技術名稱 個人化語音強化系統
計畫單位 元智大學
計畫主持人 方士豪
技術簡介
此系統第一個部分是利用神經網路模型取得語者特徵,而這些語者特徵將成為語音增強系統的部分輸入,最後預測出增強後的語音頻譜。因為這些額外加入的語者特徵,使得我們的語音增強系統可以根據不同的語者而提升了整個系統性能。
科學突破性
(1)僅使用兩個模型來實現語者感知的語音增強系統,並有效地降低了系統複雜度。
(2)在噪聲環境條件下,SaDAE與DDAE相比,分別提高了7.86%和8.17%的語音品質和語音理解度。
(3) SaDAE與DDAE比較在不同測試語者上,語音品質和理解度的進步比例,最好的分別可達28.27%和21.
產業應用性
老年化社會的來臨,聽力損失的人數在增加。然而聽覺輔具的除噪能力卻沒有相應的進步。因此,提昇語音增強技術將有助於患者配帶意願。此外,機器人技術的精進帶動語音系統介面的發展,然而這些語音系統的效能同時受到語者與環境因素的影響而降低服務品質,因此語音增強技術,一直是國內外產業界重視且持續研究的議題之一。
關鍵字 雜訊 語音增強 深度去噪自編碼 雜訊消除 語音辨識 個人化 機器人 互聯網 語音品質 語音理解度
備註
  • 聯絡人
  • 林珮汶