卡卡字幕助手
卡卡字幕助手

卡卡字幕助手 v1.33

官方版无广告264

基于大语言模型(LLM)的视频字幕处理助手,支持语音识别、字幕断句、优化、AI字幕翻译全流程处理

更新日期:
2025年9月20日
语言:
中文
平台:

56 人已下载 手机查看

卡卡字幕助手VideoCaptioner)是一款基于大语言模型(LLM)与现代语音识别技术的开源视频字幕处理工具,实现了“视频→自动转写→智能断句/校正→AI字幕翻译→一键合成字幕视频”的全流程自动化工具。

主要功能

  • 自动语音识别(支持在线接口与本地 Whisper/faster-whisper 等模型);
  • 基于 LLM 的智能断句、错别字/术语纠正与风格优化;
  • 多语言字幕翻译(支持 LLM 翻译、微软/谷歌/DeepL 等选项);
  • 支持字级时间戳、VAD(语音活动检测)、人声分离、批量处理与多线程加速;
  • 多种字幕格式导出(SRT、ASS、VTT、TXT 等)并可直接合成带字幕的视频;
  • 支持多平台视频抓取/下载(如gau)与原有字幕提取

使用教程

1,AI大预言模型配置:该工具实现的智能断句、字幕翻译等功能全部依靠AI大模型。这里推荐大家使用本地大模型,或者接入第三方的大模型接口。我这里使用的是硅基流动的腾讯混元翻译大模型(免费)

硅基流动模型申请教程:https://www.tudingai.com/3046.html

2,语音转录配置:我这里使用的是默认的转录模型B接口,该软件内置,免费也挺好用的。如果你担心隐私问题,推荐你下载:本地 Whisper/faster-whisper 等模型

3,字幕样式:该工具支持字幕样式的修改,大家在使用之前就可以提前配置好你喜欢的字幕样式。它还内置了几个字幕样式模板,比如:毕导视频风格。

4,创建任务:该工具支持抓取 B站、YouTube等视频平台的视频和字幕文件,只需要输入视频链接即可下载。当然也支持你上传本地的视频。

5:语音转录:通过语音识别模型,将视频语音转换为srt格式字幕文件。支持单独上传视频或者 音频文件。

6,字幕优化与翻译:拖入字幕文件,可实现字幕校正、AI字幕翻译、字幕编辑等操作。支持导出SRT、ASS、VTT、TXT等多种字幕格式。

7,字幕视频合成:支持软字幕视频合成,开启后字幕不会被烧录视频中。但软字幕需要一些播放器(如PotPlayer)支持才可以进行显示播放。

分享到:

相关软件