开源的自动剪辑视频工具 ——跳跃剪辑（JumpCutter）

这是一个 python 写的小工具，我下载 jumpcutter 下后，修补了一些 bug ，并加入了自动转字幕和自动剪辑的功能，成了现在的版本。

不过我也是不专业程序员，目前也没时间学 Github ，也懒得写英文 Readme 了，代码也简单，就发到这里，看下有没有志愿者，能把这个程序发到 Github，进行维护。

工具源代码在这里：自动跳跃剪辑 JumpCutter.zip

为了更方便理解这个工具，我录制了一个视频，将自动剪辑前后的两个版本放到这里，供对比下：

自动剪辑后：剪辑后 new.mp4
自动剪辑前的原视频：剪辑前 new.mp4

因为使用的笔记本自带的麦克风收音，录音时风扇又在大转，所以会有些杂音，请见谅。

这个教程的两个版本，一个是经过了本工具剪辑后的效果，一个是原始视频。经过自动剪辑后，视频更精炼，表达更好。

建议上面两个视频对比看一下，就能理解该工具有多强大。

所谓的自动剪视频有两个方面：

根据音频大小，分出静音和有声音部分。将静音部分加速到比如 999 倍，就相当将静音片段剪了去了。剩下的就是有声音、信息量较多的视频部分。
在拍视频时，比如：

在 01:00 时，我说了声“保留”；在 01:30 时，我说了声“删除”；在 02:00 时，我说了声“保留”；视频拍摄到了 02:30 。

对视频使用脚本，通过阿里云 api ，将音频转成字幕，设置保留关键词为“保留”、保留切掉的关键词为“删除”，在上述拍摄的时长 02:30 的视频中：
- 00:00 ~ 01:00 、01:30 ~0 2:00、02:00 ~ 02:30 这三个片段会被保留
- 01:00 ~ 01:30 这个片段会被删掉
- 包含关键词“保留”、“删除”的片段，也会被删掉
这样，我就可以在拍视频时决定哪些片段要 cut 掉，比如有一句话说错了，只要说一声“删除”，之前这一小段就会在后期自动被删掉（完全不用手动 cut），要确保刚刚这一小段保留下来，只要说一声“保留”就行。

在拍视频时就可以决定要保留哪些片段、删除哪些片段，很 cool 不是吗？

也正是由于这个功能需要知道视频音频说了什么，才需要使用阿里云的录音文件识别 api，将音频转成带时间戳的字幕。

通过联合使用上述两个方法，就可以自动剪出一个非常棒的 vlog、视频教程（因为这类视频中，一般只有讲话的时候才有信息量，而因为我们大脑反应速度的限制，视频中会有不少空白的时间，我们不是在说话，而是在想下一句说什么）

甚至，只使用将静音片段加速的方法，就能得到不错的结果，比如，将 15 分钟的视频，自动剪辑成 8 分钟，而且不损失任何重要信息！

我能想到最好的用处就是，对于程序员，可能

想通过视频给自己的项目、创意一个好的介绍
自己语言能力不大行，上镜后，录出的视频有许多不满意的片段
不大会、也不想剪视频

就可以用这个工具，粗糙、肆意、随便地录制一个教程视频后，用该工具处理一下，仅需一条命令，就能生成一个信息量高、精炼的视频教程。

中文帮助

简介

JumpCutter 是一个 python 脚本。

它可以对视频中 有声音 和 没声音 的部分施以 不同的播放速度。

原作者是 karykh ，但是有一些 bug 。 Github_jumpcutter

本版本修补了各个已知 bug ，加入了：

使用阿里云、腾讯云 API 自动转 srt 字幕
根据字幕自动剪辑

它现在可以根据 srt 字幕文件 中的关键词 自动剪辑（也就是删除和保留）视频片段。

只有当有 srt 输入文件的时候，才会做自动剪辑。

阿里云 API 前 3 个月免费每天 2 小时，之后，按 2.5 元/小时收费。

你可以到 https://www.bilibili.com/video/av97093907/ 查看它的工作原理。p4 视频是 jumpcutter 原作者的视频搬运。

下面是选项的帮助：

--input_file inputFILE    指定一个输入的视频文件

--url URL    如果要处理的输入文件是一个 YouTube 在线视频，就用这个选项，输入 URL

--input_subtitle SUBTITLE    如果要依据字幕来自动剪辑，就输入字幕文件路径，要求 srt 字幕

--cut_keyword    字幕中的关键字，这是切除片段的关键词。默认是“咔嚓”

--save_keyword    字幕中的关键字，这是保留片段的关键词。默认是“保留”

--output_file    输出视频文件路径，可选，如果没有选这个，会有默认自动的输出文件名

--silent_threshold    静音阈值，低于多少的音量可以被认为是静音（取值在 0 - 1 之间，是相对于整个音频中的最大音量的相对值，不是绝对值。）

--sounded_speed    有声音部分的速度，默认是 1.00

--silent_speed    没有声音部分的速度，默认是 5.00

--frame_margin    加速留白。就是在静音区间两端留几帧，不要加速，防止音频没有停顿。默认是 1 帧

--sample_rate    音频采样率，默认是 44100 ，目前程序不支持自动获得采样率，如果你的采样率不是这个值，需要手动填写

--frame_rate    视频帧速，默认30，一般会自动识别，不用管。如果帧速出了问题，再来这里调节

--frame_quality    帧质量。处理时，会先把视频中的每一帧提取出来，保存到 jpg 格式的图片，这个选项决定了保存图片的质量。取值在 1 - 31 之间，1 代表质量最高，31代表质量最差。默认是3

--online_subtitle    是否要使用在线云服务转字幕，可选项有：1, 0。默认是 0，也就是否

--subtitle_language    选择在线识别字幕的语言。可选项有："Chinese", "English"。默认是 "Chinese"

--cloud_engine    用哪个语音识别引擎。可选项有："Alibaba"、"Tencent"。默认是"Alibaba"

--delete_cloud_file    识别完成后，是否删除保存在云端的音频文件。可行项有：True, False。默认是 True

安装

脚本嘛，直接 copy 下来，装上 FFmpeg、 python、需要的库

一条使命装需要的库：

pip install -r requirements.txt## 使用

查看帮助：

python jumpcutter.py -h

示例 1：

仅把视频静音片段加速，所有参数为默认值，输出文件为"我的 vlog_new.mp4"

python jumpcutter.py --input_file "我的vlog.mp4"

示例 2：

仅把视频静音片段加速，手动设置参数

python jumpcutter.py --input_file "视频.mkv" --silent_speed 99 --sounded_speed 1 --frame_margin 2 --silent_threshold 0.025 --output_file "视频.mp4"

示例 3：

把视频静音片段加速，手动设置参数，并自动转字幕，利用字幕中的关键词自动剪辑

python jumpcutter.py --input_file "视频.mkv" --online_subtitle 1  --subtitle_language "Chinese" --cloud_engine "Alibaba" --delete_cloud_file True --cut_keyword "删除" --save_keyword "保留" --silent_speed 8 --sounded_speed 1 --frame_margin 2  --silent_threshold 0.025 --output_file "D:\视频_剪辑后.mp4"

示例 4：

把视频静音片段加速，手动设置参数，并自动转字幕，利用字幕中的关键词自动剪辑。这是在 Windows cmd 窗口，加了换行符，更好看点

python jumpcutter.py ^
--input_file "视频.mkv" ^
--online_subtitle 1  ^
--subtitle_language "Chinese" ^
--cloud_engine "Alibaba" ^
--delete_cloud_file True ^
--cut_keyword "删掉" ^
--save_keyword "保留" ^
--silent_speed 8 ^
--sounded_speed 1 ^
--frame_margin 2  ^
--silent_threshold 0.025 ^
--output_file "D:\视频_剪辑后.mp4"

视频转字幕引擎配置

打开 moduels 文件夹，打开 CloudEngine.ini 文件，按里面说的填好 api 相关信息。

毕竟，你不填好 api ，怎么用阿里云/腾讯云的语音识别服务呢，对吧？

; 在这里存放云引擎的参数

;  oss 管理控制台用于管理 bucket ，bucket 就是你的云文件存放的地方，我们要先将音频文件上传到这个云空间，才能识别。所以你需要在阿里云开发者控制台开通 oss 管理控制台服务，再在控制台中新建一个 bucket 。新建好之后，将这个 bucket 的权限设为“公共读”（只有将权限设为“公共读”，你的“智能语音交互”服务才能访问这里面的录音文件），记下它的：外网访问EndPoint、bucket 名字

; 再在控制台搜索“智能语音交互”，开通服务后，新建两个项目，一个识别语言为中文，一个为英文，音频采样率为 16k ，保存。记下这两个项目的：appkey

; 上面两个服务弄好后，还用不了，因为我们没权限！所以我们要开通在主账号下开通一个能操控这两个服务的用户，搜索“RAM访问控制”，开通服务，在控制面板，创建一个用户，记下它的：“AccessKey ID”、“AccessKey Secret”，并给这个用户添加以下两个权限：“管理对象存储服务（OSS）权限”、“管理智能语音交互（NLS）的权限”

[Alibaba RAM Access Control User]
; 这里存放阿里巴巴 RAM 访问控制中有权限的用户密钥
yourAccessKeyId = xxxxxxxxxxxxxxxxxxxxxxx
yourAccessKeySecret = xxxxxxxxxxxxxxxxxxxxxx

[Alibaba Cloud OSS]
; 这里存放阿里巴巴 oss 智能对象的设置
yourEndpointDomain = xxxxxxxxxxxxxxxxxxxxxxxx
yourBucketName = xxxxxxxxxxxxxxxxxxxxxxx

[Alibaba Cloud Chinese Transcribe Engine]
; 中文项目的appKey
appKeyForChinese = xxxxxxxxxxxxxxxxxxxxxx

[Alibaba Cloud English Transcribe Engine]
; 英文项目的appKey
appKeyForEnglish = xxxxxxxxxxxxxxxxxxxxxxxxx

[Tencent Cloud Sub User]
; 这里存腾讯有权限的子用户密钥
yourSecretId = xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
yourSecretKey = xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

[Tencent Cloud OSS]
; 这里存放腾讯 oss 智能对象的设置
yourBucketDomain = https://audio-recognition-xxxxxxxxxxxxxxxxxxxxxxx.myqcloud.com
yourBucketName = audio-recognition-xxxxxxxxxxx
yourBucketRegion = ap-xxxxxxxx
yourEndPoint = cos.ap-xxxxxxxx.myqcloud.com

20 回帖

开源的自动剪辑视频工具 ——跳跃剪辑（JumpCutter）

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

注册关于

请输入回帖内容 ...

lkk • 5 年前

试了下可以的！就是转字幕的时候台词太长了, 这个能我们这边能优化的么?另外这个录音文件转文字的有其他免费的 api 推荐么？

2 回复
其他回帖
nonozone • 5 年前

~~打开 moduels 文件夹，打开 CloudEngine.ini 文件，按里面说的填好 API 相关信息。~~

~~这个目录我怎么没找到？~~

哦，原来是因为我下载的原版 jumpcutter...
nonozone • 5 年前

还有个问题想请教，关于语音自动识别保留 /剪掉的。

假如前面录了好长一段，都没事，突然有一句话哧溜了，叫了一声剪掉。那前面的那一长段，都没有了？

1 回复
nonozone • 5 年前

有的，新视频都有字幕可以看的。我看了源文件，好像里面设置的不是切掉，是咔嚓 ...，还有就是，静音部分，没有加速。
查看全部回帖

中文帮助

简介

安装

视频转字幕引擎配置

相关帖子

syncthing 开机自动启动隐藏窗口

打破硬件壁垒！煎饺 App：强悍 AI 语音工具，为何是豆包 AI 手机平替？

使用工具

llms.txt：为大模型打造的“网站说明书”

制作可视化大屏

一个用纯 AI 编写的应用程序分享

软件 & 工具

欢迎来到这里！