VSE是一款专业的视频字幕提取工具,能够将视频中的硬字幕直接转换为SRT格式外挂字幕文件。最大的亮点是完全本地化运行,不需要依赖任何第三方API服务,基于深度学习技术实现高效字幕识别。
主要功能特点
- 智能识别视频关键帧中的字幕内容
- 自动定位视频画面中的文字区域
- 精准识别字幕文本内容
- 智能过滤非字幕内容(如台标、水印等)
- 自动去除重复字幕行
- 支持批量处理多个视频文件
- 支持87种语言字幕识别(包括中英双语)
两种提取模式
快速模式:提取速度快,但可能会遗漏少量字幕(推荐日常使用)
精准模式:逐帧检测,确保不遗漏字幕,但处理速度较慢
使用注意事项
重要提示:视频文件和程序路径中不要包含中文或空格!否则可能导致程序无法正常运行。
错误示例:
- D:\下载\vse\运行程序.exe (路径含中文)
- E:\study\kaoyan\sanshang youya.mp4 (路径含空格)
安装说明
推荐直接下载压缩包解压运行。如果遇到问题,可以尝试通过conda环境安装源码运行。
v2.0.0版本更新
- 新增Windows平台的CPU和GPU版本
- 升级V4版识别模型,准确率更高
- 优化精准模式性能
- 新增界面多语言支持
- 扩展至87种语言识别能力
项目特色
- 完全本地OCR识别,无需任何API
- 支持GPU加速,大幅提升处理速度
- CLI版本自动检测字幕区域
- 提供图形化界面(GUI)版本
版本选择
Windows CPU版:适合普通用户
Windows GPU版:仅支持Nvidia显卡用户(不支持AMD),提取速度极快
项目地址:https://github.com/YaoFANGUK/video-subtitle-extractor