功能亮点支持多个 PDF 文件上传:用户可以同时上传多个 PDF 文件,批量处理文档。
多种模板选择:根据用户需求,支持天生不同类型的音频内容,模板包括播客、讲座、择要平分歧场景。
自定义天生模型:用户可以自定义选择 GPT 模型和文本转语音(TTS)模型,以天生符合特定需求的音频内容。
不同语音选择:支持选择多种语音风格和音色,为天生的音频供应不同的听觉体验。

GitHub开源地址:https://github.com/lamm-mit/PDF2Audio

在线体验:https://huggingface.co/spaces/lamm-mit/PDF2Audio

PDF2Audio将 PDF 文件转换为播客讲座摘要等音频内容