这是一款电脑端语音输入工具。顾名思义,Caps Writer 就是按下大写锁定键来打字的工具。它的具体作用是:当你长按键盘上的大写锁定键后,软件会开始语音识别,当你松开大写锁定键时,识别的结果就可以立马上屏。
对于聊天时候进行快捷输入、写代码时快速加入中文注释非常的方便。
目前软件内置了对阿里云一句话识别 API 的支持。如果你要使用,就需要先在阿里云上实名认证,申请语音识别 API,在设置页面添加一个语音识别引擎。
添加其它服务商的引擎也是可以做的,只是目前阿里云的引擎就够用,还没有足够的动力添加其它引擎。
具体使用效果、申请阿里云 API 的方法,可以参考我这个视频: CapsWriter 2.0 使用视频
添加上引擎后,在主页面选择一个引擎,点击启用按钮,就可以进行语音识别了!
启用后,在实际使用中,只要按下 CapsLock 键,软件就会立刻开始录音:
所以你只需要按下 CapsLock 键,无需等待,就可以开始说话,因为当你按下按下 CapsLock 键的时候,程序就开始录音了,只要你按的时长超过 0.3 秒,就肯定能识别上。说完后,松开,识别结果立马上屏。
在设置界面,将 点击关闭按钮时隐藏到托盘
选项勾选,就可以将软件隐藏到托盘栏运行:
对于直到 0202 年,仍然没有开发者做过一个好用的语音输入工具,我又生气又无奈,毕竟这东西不赚钱,自然没有人做。
有人建议用搜狗输入法、讯飞输入法的语音输入,但这几个方面是真让人受不了:
Ctrl + Shift + A/B/C……
,有以下槽点:
Windows 小白用户,只需要在 Gitee Releases 或 Github Releases 界面下载打包好的压缩文件,解压,执行里面的 exe 文件,就可以运行了,在设置界面新建引擎,填入你在阿里云中申请的:
就可以正常使用了。
详细申请、填写 API 的步骤请到 CapsWriter 2.0 使用视频 查看视频教程。
Mac 和 Linux 用户,你们也可以使用,只是我没有 Mac 和 Linux 的电脑,无法打包。需要你们下载源代码、安装依赖库,再打包或者直接运行。
小白下载的 Release 其实是用 pyinstaller 导出的 exe 文件,如果你需要在源码基础上使用,就需要安装以下模块:
其中:
本文件夹内有一个 安装指南
文件夹,在里面可以找到详细的安装指南,还包括了提前下载的 alibabacloud-nls-python-sdk
和 pyaudio
的 whl 文件。
万水千山总是情,一块几块都是情。本软件完全开源,用爱发电,如果你愿意,可以以打赏的方式支持我一下:
如果有软件方面的反馈可以提交 issues,或者加入 QQ 群:1146626791
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。