成本下探、體驗上升,語音交互技術何時能在家電行業進入普及階段?
? ? ? ? ? ? ? ? ? ?本文來源: 《電器》雜志 作者: 鄧雅靜,由 電小二 整理編輯!轉載請注明來源!
越來越多的家電品牌選擇在產品上增加語音交互功能,提升產品附加值。然而,智能家電語音交互功能仍普遍存在“聽不懂人話”“響應不及時”“交互不順暢”等使用痛點。破局的關鍵在于:一是進一步提升語音交互的使用體驗,二是降低語音算法、芯片等軟硬件的成本。從目前的發展情況來看,語音交互技術在智能家電市場加速滲透,即將迎來大規模普及。

語音技術應用于家電產品歷經兩個過程,即試水、成熟。
某業內人士表示:“從2012年開始,一些家電企業看到語音交互技術應用于家電的可能性。于是,在2012~2022年10年的時間里,越來越多的家電企業開始試水語音交互技術。隨著語音算法加快演進,2023~2025年,新芯片成本逐漸下降。當使用體驗變好、成本下降時,語音交互技術在家電行業的市場滲透率也隨之提升。因此,從2023年開始,尤其是今年,語音交互技術在家電產品上的應用愈發成熟。”
語音交互技術改進產品使用體驗,使得布局這一市場的品牌銷售數據也非常亮眼。
據《電器》記者了解,目前布局家電語音技術的企業主要有聆思科技、思必馳、云知聲、啟英泰倫等。其中,聆思科技和啟英泰倫在芯片和算法方面都有布局,不同的是,聆思科技聚焦在線語音和離線語音兩條技術路線,啟英泰倫則著力布局離線語音技術。思必馳和云知聲側重于語音算法,一般會與其他芯片廠合作,比如瑞昱半導體,共同輸出語音控制解決方案。
通過采訪得知,聆思科技自2020年創辦以來,家電語音業務始終保持遠超行業的增長速度。啟英泰倫方面表示,2024年,公司家電語音業務較2023年增長超過100%,今年預估也會快速增長。思必馳有關負責人也坦言,近兩年,思必馳的智能家電語音業務營收保持強勁的增長勢頭。

在線、離線語音技術雙線發展
從技術層面來看,家電語音交互技術的發展歷程還有另一個版本。某業內人士告訴《電器》記者,企業的選擇經歷了從最初的在線語音技術,到離線語音技術,再到離線+在線復合語音方式的轉變。在GhatGPT等AI大模型問世后,企業又看好在線語音技術。如今的趨勢是,由于離線語音技術成本低于在線語音技術,但在線語音技術具有無法取代的優勢,基于成本、產品需求等考慮,家電企業雙向推進離線語音和在線語音技術。
就當下的發展情況,成都啟英泰倫科技有限公司創始人、董事長何云鵬也認為,在線語音和離線語音是相輔相成、互相補充的,不同的使用場景和用戶需求會有不同的語音交互方式。比如,電視機需要搜索節目名稱、電視頻道,運用在線語音是最合適的。而電風扇只需要進行一些簡單功能的控制,比如開關風扇,不需要從云端獲取其他在線內容,離線語音再合適不過。又比如,吸油煙機進行開關機、調節風量操作時用離線語音響應最快速,若查詢菜譜,則需要用到在線語音技術。
具身機器人是離線語音和在線語音都會用到的新興領域。據介紹,具身機器人需要跨場景服務,日常生活中不僅需要幫助用戶解答很多問題,還需要執行諸如炒菜、疊衣服、拖地等紛繁復雜的操作。若想使用體驗夠“絲滑”,具身機器人內置的在線語音和離線語音技術的能力都需要足夠強。
綜合來看,離線語音更注重保護用戶隱私、低延遲、不依賴網絡,在控制類家電中更具普適性。在線語音依托云端強大的計算能力,能夠實現更復雜的語義理解和更豐富的服務內容,支持不斷學習和升級,更適合內容服務類設備。

創新解決方案相繼推出,家電行業普及應用指日可待
盡管市場熱度很高,但是智能家電語音交互技術本身還存在很多問題。具體來看,語音交互技術在黑電、白電和小家電品類應用更為成熟。這類產品功能相對明確,指令標準化程度高,但是語音交互的喚醒率、識別率、誤觸發率還需改進。另外,家用機器人(如掃地機器人)、智能廚電及全屋智能系統正成為語音交互技術創新應用的前沿陣地。其中,家用機器人面臨移動噪聲與位置變化的雙重挑戰,為了確保設備在移動中依然“聽得清、聽得準”,語音交互技術的強抗噪與動態聲源追蹤能力需提高;智能廚電面臨廚房環境噪聲復雜且用戶雙手常被占用的挑戰,對語音交互技術需求的重點在于強噪聲下的高識別率與“一語多意”的高效理解;全屋智能系統最大的挑戰是多設備協同,多個智能家電在同一空間,對語音技術的要求是避免出現“一次喚醒多個響應”的問題。
為了解決這些核心述求,思必馳以“聽得清、聽得懂、會響應”為路徑,構建了全鏈路的語音交互方案。據思必馳有關負責人介紹,在“聽得清”層面,思必馳創新性地融合多項智能感知技術,智慧聆聽技術集成聲源定位、波束成形與回聲消除,能夠在強噪聲環境中精準捕獲目標人聲,即使在廚房炒菜、衛生間用水等強噪聲場景下,也能準確捕捉用戶指令。在“聽得懂”層面,思必馳實現了從傳統模型到生成式大模型的自然融合,既保障控制指令的確定性,又實現開放域的泛化理解。在“會響應”層面,思必馳采用快慢相結合的“思考模式”,通過小模型實現快思考,簡單問題秒回,通過大模型實現深思考,復雜問題深度分析后給出回應。
啟英泰倫是離線語音技術的重要供應商,對于離線語音技術目前存在的問題了然于胸。何云鵬指出,受限于語音芯片的存儲空間,目前市面上離線語音家電內置的詞條從幾十條到幾百條不等,但是家電的功能越來越豐富,導致家電的每個功能只能設置一個詞或者幾個詞,用戶必須嚴格按照這些固定的詞條來操控,從而面臨用戶記不住詞,“家電聽不懂人話”的窘境。針對這一痛點,啟英泰倫推出“離線自然說”(輕量級離線語義理解NLP)技術,支持幾十萬級別的日常口語說法,為用戶提供更自然、更靈活、更智能的語音交互體驗。他強調,這個技術推出后很受客戶青睞,市場反饋很好。
與Wi-Fi模塊在家電行業的發展軌跡類似,語音交互技術在家電行業的推廣也即將進入普及階段。
某業內人士預計,2027~2028年,單個語音芯片的價格有望低于10元。在他看來,屆時,隨著家電語音交互從“單一指令執行”向“自然多輪對話”和“主動服務”演進,不斷滿足用戶對品質生活的追求,語音交互技術在家電行業的應用將加速推進,有望迎來高峰,全行業普及也將指日可待。
本文來源: 《電器》雜志 作者: 鄧雅靜,由 電小二 整理編輯!轉載請注明來源!

