9 Matching Annotations
  1. Jun 2025
    1. 能力 - audio2srt: 采用阿里云的”录音文件识别“能力 - 字幕翻译: 至此百度、腾讯翻译

      问题 - 似乎不能单独发**起 srt2zh 任务(起点只能是视频/音频)——错,从文档中的截图看,是可以的

      安装与部署 - 只支持windows,无需本地AI

    1. 能力: - 语音转录支持本地(WhisperCpp/FasterWhisper) 和在线(B接口/J接口??) - 字幕翻译支持传统引擎和LLM - 传统引擎: DeepL/微软/谷歌 - LLM: Ollama、DeepSeek、硅基流动以及【OpenAI兼容接口】 (配套提供LLM API中转站)

      安装部署 - Windows提供一键安装包 - MacOS需要自行基于python搭建,且作者说未验证过 👎 。另外本地 whisper 功能尚不支持macos)

    1. 能力: - 语音识别 - 本地: faster-whisper和openai-whisper - API: OpenAI SpeechToText API / GoogleSpeech / 阿里中文语音识别模型/ 豆包模型,并支持自定义语音识别api - 字幕翻译 - 传统: 微软翻译|Google翻译|百度翻译|腾讯翻译|DeepL|DeepLX - LLM: ChatGPT|AzureAI|Gemini

      安装部署:基于python - 对Windows提供预打包版本 - MacOS/Linux下需要自行部署:只支持python-3.10 👎,本地跑whisper需要pytorch+cuda