智能座艙的語音系統(tǒng)被稱為VOS(語音操作系統(tǒng)),主要負責(zé)座艙內(nèi)用戶和車機的語音交互。在系統(tǒng)架構(gòu)上,VOS系統(tǒng)分為車機和算法兩部分。VOS系統(tǒng)的車機系統(tǒng)包括車云兩端。車端和駕車人員直接交互的模塊叫做對話系統(tǒng)(DS),其主要由麥克風(fēng)陣列、喚醒模塊、音頻處理模塊組成。為了實現(xiàn)更好的語音交互體驗,DS的音頻處理模塊功能非常豐富,包括AEC、VAD、音頻壓縮、喚醒詞識別、聲源定位等。 VOS的云端部分主要用于實現(xiàn)在線語音功能,包括在線ASR識別、對話服務(wù)以及實時信息同步等。 當(dāng)然,上述功能的實現(xiàn)都離不開算法的支持,算法是智能座艙VOS的靈魂。對于算法而言,兩種類型的數(shù)據(jù)最為關(guān)鍵。一種是原始訓(xùn)練數(shù)據(jù),主要用于實現(xiàn)VOS系統(tǒng)的各種功能定義和喚醒,以及打造喚醒詞庫;另一種是用戶的個人數(shù)據(jù),這是系統(tǒng)算法逐漸體現(xiàn)私人定制屬性的關(guān)鍵所在,一般VOS系統(tǒng)會不定期地采集、標(biāo)注用戶數(shù)據(jù),結(jié)合系統(tǒng)大數(shù)據(jù)不斷提升VOS系統(tǒng)的智能化水平。 從發(fā)展趨勢來看,智能座艙VOS系統(tǒng)已經(jīng)逐漸從雙音區(qū)變化為四音區(qū),在駕駛員、副駕、后排左側(cè)和后排右側(cè)四個區(qū)域都能實現(xiàn)很好的定位識別,通過聲源定位的方式鎖定當(dāng)前發(fā)布指令的音區(qū)。在此基礎(chǔ)上,廠商在逐漸嘗試對VOS系統(tǒng)進行“喚醒連說”,也就是用戶在喚醒系統(tǒng)之后可以不用等待系統(tǒng)反饋音,而是將喚醒詞和指令同時說出。此外,部分VOS系統(tǒng)也在嘗試無喚醒詞下達指令以及離線指令識別,當(dāng)然這些創(chuàng)新功能對車機硬件的智能化水平要求也比較高。當(dāng)然,目前的智能座艙不僅會聽回答,也會說會唱。也就是說,現(xiàn)階段的車載聲學(xué)系統(tǒng)不僅僅是簡單的交互,而是要打造隔音靜謐性、環(huán)繞式座艙體驗,讓駕乘人員感受到沉浸式的聽覺盛宴。以騰訊TAI4.0智能座艙解決方案為例,其中兩個亮點功能是全民K歌車載版以及騰訊愛趣聽,后者是業(yè)內(nèi)首個融合音樂、相聲、視頻、新聞、K歌、長音頻等多內(nèi)容的車載娛樂產(chǎn)品。 豐富的軟件功能就需要硬件來搭配,這也就推動了智能座艙音響系統(tǒng)的大升級。智能座艙音響系統(tǒng)的第一階段是智能音樂座艙,目前小鵬P7、AION LX、領(lǐng)克05等車型都在主打這一理念。這些品牌的智能音樂座艙有一個明顯的共同點就是品牌音響+多揚聲器,其中小鵬P7采用丹拿品牌音響,用了18個揚聲器。當(dāng)然,除了多揚聲器的升級方案,部分車企還選擇加裝低音炮產(chǎn)品以提高整車音效。 |