文章来源:万象ai发布时间:2024-12-13 19:12:30
Voice-Pro,一款集字幕、翻译和TTS于一体的多语言音频处理工具 ,一键安装。
Voice-Pro支持超过90多种语言的实时翻译,适合直播或即时翻译场景。
Voice-Pro主要功能:
Studio选项卡
提供 YouTube 下载器、噪音消除、字幕、翻译和 TTS 的集成环境
ffmpeg支持的所有视频/音频格式都可以使用
可选择输出音频格式(wav、flac、mp3)
100 种语言的语音识别和字幕创建
选择适合 PC 性能的字幕创建选项(Whisper 模型和计算类型)
翻译成 100 多种语言并通过 TTS 生成语音
多语言视频中保留了原始视频的BGM和音效。
支持TTS语音速度、音量、音调调节
Whisper Caption卡
专门用于创建字幕的选项卡。支持 90 多种语言
显示使用视频创建的字幕
提供*亮点功能
提供降噪功能(1-Demucs、2-MDXNet)
Translate选项卡
专用翻译选项卡。支持 100 多种语言
支持字幕文件(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)
也可以直接输入文字
自动检测上传文件的语言
TTS选项卡
仅 TTS 选项卡。支持超过100种语言和400种语音
支持字幕文件(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)
也可以直接输入文字
自动检测上传文件的语言
音调、音量和速度可调
Live Translation选项卡
实时语音识别和翻译支持
选择音频输入源,例如麦克风、扬声器等。
提供保存捕获的音频、识别的字幕和翻译的字幕的功能
Batch选项卡
批量处理大量文件
字幕、翻译、TTS
Voice-Pro特征:
您可以下载 YouTube 视频(mp4、webm)并将其另存为音频文件(mp3、wav、flac)。
您可以通过消除噪音和分离人声来提高语音识别的准确性。使用MDX-Net和Meta的Demucs 。
通过ai语音识别,提供自动字幕制作、机器翻译、TTS功能。
您可以轻松制作多语言视频。
一键安装。安装后,您可以永久使用它,无需额外费用。 (※ 免费版有30分钟使用时间限制)
提供Web-UI 。推荐使用谷歌Chrome浏览器。
Voice-Pro项目地址:https://github.com/abus-aikorea/voice-pro
上一篇: PixVerse AI如何使用详细教程指南
PixVerse AI如何使用详细教程指南_映技派,专注ai人工智能!,PixVerse 是一款 AI 文字或图片生成视频工具,在 PixVerse AI 网页版或 Discord 输入文字提示词或上传图片,PixVerse 就能快
下一篇: HeyGen推出Avatar Look功能
HeyGen推出Avatar Look功能_映技派,专注ai人工智能!,HeyGen最近推出了Avatar Looks功能,这项功能允许用户上传任意数量的视频素材,系统会利用这些素材生成个性化的虚拟数字分身。用户可以自由修改数字分身的背景、服装、姿势和摄像角度等,从而根据自己的需求调整和个性化视频内容。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25