软件介绍

最近接到一个需求,需要把录音转换为文字,一看网上几款常用的工具,想不到都是收费的;找了找,发现基本上都需要云端api,仅有的几个本地的都需要使用GPU中的cuda计算。因此,开发了这么一款语言转文字的小工具,基于Faster Whisper模型,在cpu上也能达到不错的效果。

软件截图

sshot-1.png

使用方法

双击文件打开,在左上角选择模型,左下角选择推理方式与精度(cpu推荐int8,速度更快)。

若没有支持cuda的GPU请不要选择GPU,否则会崩溃(原本想导入pytorch库判断cuda_is_available的,但是这样打出来的包会把一整个pytorch一起打包进去,太大了,后来就没这么处理)

首次使用需要下载模型,进度在console中可见,请耐心等待。

下载地址

123网盘

百度网盘

阿里云盘

天翼网盘

夸克网盘

迅雷网盘

UC网盘

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理(doubaiwang@126.com)。