找回密码
 会员注册
查看: 30|回复: 0

最方便的离线python实时中文语音识别!

[复制链接]

4

主题

0

回帖

13

积分

新手上路

积分
13
发表于 2024-9-12 14:53:58 | 显示全部楼层 |阅读模式
废话不多说,直接上代码,先安装环境需要安装的包:jsonpyaudionumpyvosk1234新建一个py文件写入:importjsonimportpyaudioimportnumpyasnpfromvoskimportModel,KaldiRecognizer,SetLogLeveldefSaveWave(model):#设置音频参数FORMAT=pyaudio.paInt16#音频流的格式RATE=44100#采样率,单位HzCHUNK=4000#单位帧THRESHOLDNUM=30#静默时间,超过这个个数就保存文件THRESHOLD=100#设定停止采集阈值audio=pyaudio.PyAudio()stream=audio.open(format=FORMAT,channels=1,rate=RATE,input=True,frames_per_buffer=CHUNK)frames=[]print("开始录音...")count=0whilecount0:count-=1frames.append(data)print("停止录音!")stream.stop_stream()stream.close()audio.terminate()rec=KaldiRecognizer(model,RATE)rec.SetWords(True)str_ret=""fordatainframes:ifrec.AcceptWaveform(data):result=json.loads(rec.Result())if'text'inresult:str_ret+=result['text']result=json.loads(rec.FinalResult())if'text'inresult:str_ret+=result['text']str_ret="".join(str_ret.split())returnstr_retif__name__=="__main__":model=Model("vosk-model-small-cn-0.22")SetLogLevel(-1)while1:res=SaveWave(model)ifres!=""andres!=None:print(res)1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465下载https://alphacephei.com/vosk/models/vosk-model-small-cn-0.22.zip并解压到和上述文件同目录下并开始运行即可!运行效果:开始录音...停止录音我说一句话123方便救急,比配其他环境快得多,5分钟就能跑起来!!!给出一个比较大的模型:https://alphacephei.com/vosk/models/vosk-model-cn-0.15.zip替换路径即可
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2024-12-27 16:11 , Processed in 0.688944 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表