能力 - audio2srt: 采用阿里云的”录音文件识别“能力 - 字幕翻译: 至此百度、腾讯翻译
问题 - 似乎不能单独发**起 srt2zh 任务(起点只能是视频/音频)——错,从文档中的截图看,是可以的
安装与部署 - 只支持windows,无需本地AI
能力 - audio2srt: 采用阿里云的”录音文件识别“能力 - 字幕翻译: 至此百度、腾讯翻译
问题 - 似乎不能单独发**起 srt2zh 任务(起点只能是视频/音频)——错,从文档中的截图看,是可以的
安装与部署 - 只支持windows,无需本地AI
能力 - 语音转写:支持OpenAI Whisper (本地 & 在线API) - 翻译: 未说明基于什么引擎实现
问题: - 似乎不支持单独的【翻译字幕文件】任务
能力 - 语音转录: 基于whisper模型(可本地,也可用OpenAI Whisper API) - 字幕翻译: 支持ollama 和 LM Studio (其实是基于【兼容OpenAI API】设计的 https://chidiwilliams.github.io/buzz/zh/docs/usage/translations )
安装与部署: 基于python包 - 对MacOS和Windows均提供了一键安装包 - 对Linux提供了flatpak和snap包
仅翻译功能
👎 2024年12月后无更新了,估计作者已经弃坑
功能: - 音频转写采用whisper模型 (基于python包openai-whisper实现,需要pytorch支持) - 翻译只支持Azure Translator API
部署: 基于python 和 ffmpeg
能力: - 语音转录支持本地(WhisperCpp/FasterWhisper) 和在线(B接口/J接口??) - 字幕翻译支持传统引擎和LLM - 传统引擎: DeepL/微软/谷歌 - LLM: Ollama、DeepSeek、硅基流动以及【OpenAI兼容接口】 (配套提供LLM API中转站)
安装部署 - Windows提供一键安装包 - MacOS需要自行基于python搭建,且作者说未验证过 👎 。另外本地 whisper 功能尚不支持macos)
能力: - 语音识别 - 本地: faster-whisper和openai-whisper - API: OpenAI SpeechToText API / GoogleSpeech / 阿里中文语音识别模型/ 豆包模型,并支持自定义语音识别api - 字幕翻译 - 传统: 微软翻译|Google翻译|百度翻译|腾讯翻译|DeepL|DeepLX - LLM: ChatGPT|AzureAI|Gemini
安装部署:基于python - 对Windows提供预打包版本 - MacOS/Linux下需要自行部署:只支持python-3.10 👎,本地跑whisper需要pytorch+cuda
单纯字幕翻译功能
内置彩云小译、DeepL、微软翻译,并支持自配置的百度翻译、华为云、火山、腾讯、有道、OpenAI 翻译引擎
缺点 - 无文档 👎 - 仅支持windows - 感觉比较粗糙 - LLM支持较弱
有在线版本,也可自部署(nodejs 18.18+)
LLM只支持OpenAI 和 DeepSeek(不支持 【兼容OpenAI的API】)
传统翻译引擎支持DeepL, Google, Azure,不支持国内翻译平台