核心功能
- 智能文档处理
-
自动提取PDF文本,清理格式错误和冗余内容
-
支持处理含数学公式的学术论文
-
智能分块处理大文件(最大支持10万字)
- 多模式内容生成
-
支持15种输出格式(播客/访谈/辩论/讲座等)
-
8种内容风格(专业/学术/轻松/搞笑等)
-
4种内容长度(短篇10分钟到长篇100+分钟)
- 灵活模型支持
-
支持6种 LLM 服务(OpenAI/Groq/本地模型等)
-
可配置 TTS 语音角色(主持人与嘉宾双角色对话)
-
本地优先设计,保护隐私的同时降低使用成本
- 全渠道使用方式
-
命令行一键生成
-
Python API 集成
-
网页版服务(基于 FastAPI)
技术亮点
- 四步处理流程
-
Step1 :PDF 解析(PyPDF2 提取 + 智能清洗)
-
Step2 :脚本生成(动态提示词 + 分块处理技术)
-
Step3 :语音优化(添加自然停顿/语气词)
-
Step4 :音频合成(多角色语音 + 片段拼接)
- 智能提示工程
-
内置角色设定(如"博学的老师 vs 好奇的新手")
-
支持用户自定义内容焦点(偏好指令优先处理)
-
自动生成对话中的即兴发挥内容(类比/反问/幽默元素)
- 工程化设计
-
中间结果缓存(可断点续生成)
-
自动清理临时文件
-
完善的错误处理与日志系统
开源项目地址:
