近日,科大訊飛星火VoiceWise智能語音交互產品完成能力升級,重點面向企業級智能語音場景中的部署成本、國產化適配和自然對話體驗等問題,推出高性能CPU版ASR引擎及全雙工語音交互能力。
據介紹,VoiceWise高性能ASR引擎支持在線短語音識別和離線錄音文件識別,無需依賴GPU,僅基于CPU即可運行,并兼容鯤鵬ARM架構與麒麟Linux系統,可適配金融、政務、運營商、能源等行業客戶的國產化基礎設施。在同等配置的鯤鵬ARM服務器上,新版引擎較傳統CPU版本實現性能提升:在線短語音識別并發路數提升約90%,離線錄音文件識別整體吞吐量提升約150%。
在交互體驗方面,VoiceWise全雙工語音交互技術聚焦精準抗干擾和智能打斷。系統可在AI發聲的同時保持實時拾音,處理設備自干擾、環境噪聲及多人交談等復雜信號,并在用戶打斷、補充或停頓時作出更自然的響應。相關測試顯示,其誤打斷率下降約50%。
目前,VoiceWise已應用于遠程銀行、證券App語音交互、保險續保外呼等場景。在某頭部保險公司外呼場景中,業務高峰期需支撐7000路實時語音識別并發,按典型方案測算,高性能CPU版ASR綜合成本較傳統CPU方案節省約48%,較NPU方案節省約56%。