-
Notifications
You must be signed in to change notification settings - Fork 620
Open
Labels
questionFurther information is requestedFurther information is requested
Description
What is your question?
在使用 FunASR 处理音频文件时,发现部分格式为 .m4a 或 .mp3 的音频文件会直接导致设备的显存(GPU 内存)或内存(RAM)被完全占用,进而引发程序进程崩溃。但这些 “问题音频” 通过人工使用常规音频播放软件打开时,能够正常播放,未发现音频本身存在损坏、无法读取等明显问题。请问导致该现象的可能原因是什么?如何解决此类因音频处理导致显存 / 内存跑满并崩溃的问题?
What have you tried?
1、验证问题音频的完整性:使用多个主流音频播放软件(如 Windows Media Player、PotPlayer、VLC)打开问题 .m4a 和 .mp3 文件,均能正常播放,未出现卡顿、无声、文件损坏提示等问题,排除音频文件本身无法正常读取的基础问题。
2、测试非问题音频:使用相同的代码和环境处理其他同格式(.m4a、.mp3)的音频文件,大部分文件能够正常完成处理,未出现显存 / 内存异常占用,仅特定部分音频触发该问题。
3、切换运行设备:尝试将代码中 device 参数从 “cuda” 改为 “cpu”,处理问题音频时仍会出现内存(RAM)跑满并崩溃的现象,并非仅局限于 GPU 显存问题。
4、检查音频文件属性:对比 “问题音频” 与 “正常音频” 的基础属性(如时长、采样率、比特率、声道数),未发现明显规律(例如问题音频并非均为超长时长或超高采样率,部分短时长音频也会触发问题)。
5、升级相关库版本:尝试将 FunASR、ModelScope、PyTorch 等核心依赖库升级至当前最新稳定版本,重新运行代码处理问题音频,显存 / 内存跑满崩溃的问题仍未解决。
6、使用linux系统部署项目仍然现类似问题。
Metadata
Metadata
Assignees
Labels
questionFurther information is requestedFurther information is requested