电州收藏夹

#Python #开源
AutoCut: 通过字幕来剪切视频
AutoCut 对你的视频自动生成字幕。然后你选择需要保留的句子，AutoCut 将对你视频中对应的片段裁切并保存。
你无需使用视频编辑软件，只需要编辑文本文件即可完成剪切
github: https://github.com/mli/autocut
此项目依赖python及ffmpeg
📡发布：https://noisevip.cn/14845.html
📢关注频道：@quanshoulu
💬留言讨论：@Efficiencyfollow
📬投稿bot：@noisewowbot
📇搜索bot：@Efficiencysearchbot
🎁访问主页： www.noisework.cn

439 views09:42

电州收藏夹

WhisperX是一个具有以下特点的自动语音识别（ASR）项目：

1. 快速实时转录：WhisperX利用Whisper模型进行批处理推断，实现了70倍的实时转录速度。这使得处理大量音频数据变得更加高效。

1. 单词级时间戳：WhisperX提供准确的单词级时间戳，使得识别结果可以更精细地对应到语音中的每个单词。

1. 说话人分离：通过集成pyannote-audio的说话人分离功能，WhisperX实现了多说话人ASR。它能够识别和区分不同说话人的语音，为多人对话场景提供更准确的识别结果。

1. VAD预处理：WhisperX使用语音活动检测（VAD）进行预处理，有效减少了虚假识别和批处理时的错误，同时不会降低识别准确性。

#自动语音识别 #语音识别 #说话人识别 #时间戳 #音频处理 #深度学习 #机器学习 #Python #语音技术 #开发工具 #音频转录 #音频处理 #开源项目 #人工智能 #软件 #whisperx #开源

https://github.com/m-bain/whisperX

513 viewsedited 06:07

About

Blog

Apps

Platform