• 個人特質整合語音互動之深度情緒辨識技術—— 能夠依個人特質調整的 AI 語音情緒辨識模型

2019 -10 -08
近年以人工智慧進行情緒辨識技術備受關注。國際研究機構(Gartner)指出,情感AI領域具產值估計高達 200 億美元,並有良好的發展潛力 - 情緒識別的產業應用性相當全面。然而,每個人的情緒表現因個體(如個性、性別、年齡、文化等)的多樣性而大相逕庭,大多情緒預測技術也未能考量個體差異,造成技術發展規模化與強健性受限。為此本技術因應而生,透過深度網路整合語音文字資訊,以實現情緒辨識的個人化
 
本技術架構中整合了三大元素,其一為多模態語音情緒辨識,亦即整合語音文字等資料,並包含了台灣中文語⾳辨識系統及⾃然語⾔處理分析。其二則是跨語⾳資料庫的遷移學習:為了增強語⾳資料對於其他語⾳資料庫的適應性,將預先訓練的演算法輸入其他來源的數據進行輔助,以便有效地利用收取到的無標記語音資料。最後,則是整合輔助個體性的注意力機制:透過學習個體表徵空間,將其嵌入多模態深度辨識模型中。此機制中基於語者的個體特性,會選擇整段話中跟情緒識別相關的部分給予較⾼的權重,增強其辨識的能⼒。
 
此次展覽的系統為一整合語音分析方案,透過語音、文字分析情緒,多層次地整合自動語音辨識、語意處理、多模態融合、個人化模型等技術。此一系統可應用於任何透過語音當介面的產品與服務,包括語音助理、汽車產業、物聯網等等。


本技術獲選為2019未來科技展「未來科技突破獎」,了解更多:個人特質整合語音互動之深度情緒辨識技術—— 能夠依個人特質調整的 AI 語音情緒辨識模型