-
Notifications
You must be signed in to change notification settings - Fork 251
Description
配置过程:
第一步:
配置环境(安装了anaconda,在pycharm中顺利创建了conda的虚拟环境bailing-main)
通过命令pip install -r "D:\py_example\bailing-main\requirements.txt" --use-pep517 -i https://pypi.tuna.tsinghua.edu.cn/simple --no-warn-script-location (若使用该命令注意文件地址)
于虚拟环境bailing-main中安装所有相关库成功
第二步:
从网站https://huggingface.co/FunAudioLLM/SenseVoiceSmall/tree/main下载了SenseVoiceSmall相关文件,然后下载对应的requirements.txt内容顺利完成
第三步:
在deepseek官网获取了API,并填入了config/config.yaml
后续检错:
1.问题:系统没有安装处理音频文件的'ffmpeg',下载并加入环境变量路径,先在系统下载,再在虚拟环境下载版本6.1,解决
2.出现函数问题,httpx与openai版本不合,降级到 httpx-0.27.2
3.缺少模型'models/bge-small-zh',在huggingface.co网站找到下载,并下载对应requirements.txt
4.注意不要按到F4静音键
5.tts转化失败,无法将生成的答案转化为语音,最后发现是edge_tts库版本过低,更新为edge_tts==7.0.2即可正常运行。
使用体验:
1.需要数学建立方程的题目回答时会朗读数学符号:比如反斜杠什么的
2.让他写一篇英语六级文章进行朗读时,可能不会立即回答,再次要求朗读时进行了回答。
3.一个比较复杂的问题,中间间隔较长时,他会先回答前半句,而无视掉后半句,不过可以调大配置文件那个参数(适应说话间隔大)解决
求助:
现在最后一个问题是插件的函数,比如获取某地的天气,专门打开函数运行没有问题,但是语音对话调用就卡在了函数名这里,即没有报错,也没有进一步反应。再问其它问题,就是VAD开始,然后立刻结束。不知道什么原因。