個人特質整合語音互動之深度情緒辨識技術—— 能夠依個人特質調整的 AI 語音情緒辨識模型

個人特質整合語音互動之深度情緒辨識技術—— 能夠依個人特質調整的 AI 語音情緒辨識模型

2019 -10 -08

近年以人工智慧進行情緒辨識技術備受關注。國際研究機構(Gartner)指出，情感AI領域具產值估計高達 200 億美元，並有良好的發展潛力 - 情緒識別的產業應用性相當全面。然而，每個人的情緒表現因個體(如個性、性別、年齡、文化等)的多樣性而大相逕庭，大多情緒預測技術也未能考量個體差異，造成技術發展規模化與強健性受限。為此本技術因應而生，透過深度網路整合語音文字資訊，以實現情緒辨識的個人化

本技術架構中整合了三大元素，其一為多模態語音情緒辨識，亦即整合語音文字等資料，並包含了台灣中文語⾳辨識系統及⾃然語⾔處理分析。其二則是跨語⾳資料庫的遷移學習：為了增強語⾳資料對於其他語⾳資料庫的適應性，將預先訓練的演算法輸入其他來源的數據進行輔助，以便有效地利用收取到的無標記語音資料。最後，則是整合輔助個體性的注意力機制：透過學習個體表徵空間，將其嵌入多模態深度辨識模型中。此機制中基於語者的個體特性，會選擇整段話中跟情緒識別相關的部分給予較⾼的權重，增強其辨識的能⼒。

此次展覽的系統為一整合語音分析方案，透過語音、文字分析情緒，多層次地整合自動語音辨識、語意處理、多模態融合、個人化模型等技術。此一系統可應用於任何透過語音當介面的產品與服務，包括語音助理、汽車產業、物聯網等等。

本技術獲選為2019未來科技展「未來科技突破獎」，了解更多：個人特質整合語音互動之深度情緒辨識技術—— 能夠依個人特質調整的 AI 語音情緒辨識模型

返回活動快訊

個人特質整合語音互動之深度情緒辨識技術—— 能夠依個人特質調整的 AI 語音情緒辨識模型

2019 -10 -08

分享資訊