【109年 應用案例】 AI智能配音模組,讓機器配音有溫度
因應時代趨勢,數位學習與移動教材受到廣泛重視!
隨著科技迅速演進,如何有效率地培育出能「因應發展變動」的專業人才,是許多企業不斷思考的重要課題。近年來許多企業為刺激外部的成長動能以及內部組織的驅動力,逐步將「數位學習」應用在員工培訓之中,以提升教育訓練效果,「數位學習」與「移動教材」因而受到廣泛重視。
委外配音成本高,且無法負荷大量需求
▲導入AI配音系統之數位教材製作流程前後差異
台灣戰略突破股份有限公司曾協助企業,將歷年公部門辦理的諸多研討會、實體課程及教育訓練活動,轉製作為數位教材;然而,在轉製作的過程中,除了需邀請老師、尋找並租借拍攝場地、錄音及影片後製外,在錄製過程中,可能因講師緊張、不習慣鏡頭、吃螺絲等因素,造成錄音品質不佳或不斷NG重錄的情況。
雖然有提供客戶教材配音的選擇,但委外配音成本高,且無法負荷大量需求。因此,希望導入AI語音合成技術,研發「智能配音模組」,即時將簡報上的文字,轉換為自然流暢、近似真人發音之語音檔,以節省人員配音的成本。
擬真人之智能配音模組,提供更多元之配音選擇
▲AI配音模組示意圖
台灣戰略公司與AI技術團隊魔方數位有限公司合作,採用Tacotron2結合WaveNet及Tacotron的特性,將字元嵌入到梅爾刻度(Mel-scale)譜系圖中,然後由修正過的WaveNet模型作為vocoder,從這些聲譜圖中合成時域的波形,最終開發出MOS語音質量評測指標之評測分數近似真人之智能配音模組。
此AI智能配音模組經過測試者測試,以MOS語音質量評測指標為標準,得到評測分數為4.3,已達到計畫初始設定的目標值4.21,且高於Wavenet 4.08之評測分數,顯見成效卓越!
AI智能配音模組,成本降、利潤升,將有效提升台灣數位學習產業環境!
▲AI配音系統導入後之成本大幅降低,利潤相對提升
此AI智能配音模組,不僅可減少製作數位教材的成本,亦可解決我國產、官、學界在數位教材普及的困難,且能有效提升客戶製作數位教材之效率、大量減少人力缺口及成本結構風險,並提升獲利狀況。
台灣戰略公司後續也將持續研發「智能聽打模組」,並將導入自動化流程機器人(RPA),將數位教材製作過程中的上字幕、配音、轉檔等工作項目以自動化取代現有人工作業,協助國內數位學習產業轉型提升。