:::

【109年 解決方案】 萬首環境音樂都是AI做的 安譜搶攻全球公播市場

「音樂產業為何需要AI?AI可以解決甚麼問題?」這是安譜人工智能有限公司創辦人暨執行長曾志中不斷在詢問自己的問題。2018年創立公司,曾志中就很清楚了解市場定位及客戶所在,安譜要運用AI作曲搶攻全球環境音樂的公播市場,系統上線一個多月以來,AI已創作出超過一萬首音樂,客戶遍布咖啡廳、車輛展售中心、餐廳、髮廊等產業,「合法、免費」的公播解決方案,成為商店的首選。

曾志中是一位擁有網際網路與音樂複合背景的連續創業家,曾擔任過太合音樂集團總經理、微軟及諾基亞亞太區音樂服務總監,創立過AR公司愛米蒂亞科技和網絡直播公司天利達科技,現階段仍營運一家名為奧斯特音樂的影視配樂公司。

擁有科技與音樂雙重背景 AI音樂解決版權困境

具有科技與音樂雙重背景,讓曾志中對科技的嗅覺十分敏銳,尤其是AI熱潮不斷,讓他不斷思考,如何讓AI作曲成為一門好生意?曾志中研究,包括擁有1億付費會員的美國Spotify、100萬付費會員的台灣KK BOX及在美國上市的中國大陸QQ音樂,均處於虧損狀態,最大的問題在於這些平台均未持有音樂的版權,雖然提供會員付費聆聽音樂,但相對也要付出部分版權費給唱片公司及創作者,以至於「做得越大、虧得越多」。

兼具科技與音樂背景的曾志中,希望為AI音樂創出一片天

▲兼具科技與音樂背景的曾志中,希望為AI音樂創出一片天

在音樂領域,分為環境音樂(背景音樂, BGM)及流行音樂,其中,流行音樂產業鏈長,從作詞、作曲、編曲、唱、和聲、混聲到成曲等,製作成本高,投資風險相對較大,而環境音樂則是在商場、百貨、咖啡廳、餐廳等可公播得音樂,由於現行的規定,音樂公播權在各國的音樂相關產業協會手中,取得不易,要耗費龐大成本與時間,然而,只要音樂內容自製,就可解決版權問題,因此,運用AI作曲,將版權掌握在自己手中,成為致勝的關鍵。

根據國際唱片業協會(IFPI)報告顯示,2018年全球音樂市場收入同比增長9.7%,達到191億美元,高於2017年的174億美元。 其中,流媒體音樂市場營收達到89億美元,占全球營收47%,接近一半。而公播音樂占10-15%,也是相當驚人的市場。

確認市場潛力無窮,緊接著就要評估AI音樂的技術能量,曾志中坦言,「AI絕非萬能」,以演唱會或暢銷排行榜上的流行音樂,就必須由作詞作曲家來創作才能達到效果,AI作曲在技術上就是簡單、不複雜的曲調。

集結音樂大數據庫搭配獨家專利AI演算法 快速產出音樂

安譜音樂的AI作曲系統所參考及採用的算法包括Markov chain、類神經網絡、深度學習法,並結合安譜公司獨家專利的演算技術MDN Music Deeplearning Network,其演算技術符合樂理的獨特演算法,因此能突破傳統流行音樂的架構及曲式,創作出更貼近市場的音樂作品。而數據庫集結了大量市場百大音樂排行榜、世界名曲等樂譜資料,先透過數據分析膾炙人口優質音樂的特色、旋律等特質加以歸納,再透過深度學習的方式,使得AI作曲能達到快又好的境界。

BGMRADIO公播平台上集結上萬首AI音樂

▲BGMRADIO公播平台上集結上萬首AI音樂

安譜為複雜的音樂版權環境提供清晰的AI解決辦法,平台的素材庫擁有大量完整清楚的版權,共有超過萬首音樂,50種曲風,用戶可以在其中任意挑選合適的音樂欣賞。而安譜目前的營運模式分為兩種,一種為提供網頁版,共萬首免費AI音樂供使用者上線聆聽,若用戶需要客製化的音樂,安譜則提供付費服務,此外,因應唱片業及歌手的打歌宣傳需求,也提供廣告播放收取廣告費的模式;另一種營利模式,則是由用戶租用音樂播放器,收取每年租用費的方式來營利。曾志中表示,除了公播平台上的100%自製音樂外,安譜在作詞、作曲及編曲方面,也會協助唱片製作公司進行接案。

BGMRADIO公播平台與其他公播平台之比較

▲BGMRADIO公播平台與其他公播平台之比較

曾志中表示,「音樂不分國界,好音樂也不會分是人還是AI做的」,現階段AI演算法及相關技術相當成熟,運用AI製作音樂不是一件難事,重要的是,找到市場痛點,就有商機。安譜的市場遍及台灣、日本、韓國、新加坡等,未來將持續進軍華人最大市場-中國大陸。

曾在中國大陸創業20年的曾志中,回來創業主要原因是台灣的人才濟濟,尤其是跨域人才,不同於一般AI公司或音樂公司,安譜需要大量具撰寫程式與音樂專才的兩棲人才。公司分為研發及製作兩大部門,研發部門大多來自清大、交大的電機電子、應用音樂等相關學系,另一為音樂製作部門,在研發部門運用AI演算法快速製作出曲子之後,再由音樂專業素養高的製作部,利用人類對音樂的敏感度,將AI音樂譜成絕佳聆聽體驗的優質音樂。

安譜團隊大多是科技與音樂兼具的跨域人才

▲安譜團隊大多是科技與音樂兼具的跨域人才

推薦案例

【解決方案】AI電眼取代人眼 慧演智能運用AI幫製造業做品管
AI電眼取代人眼 慧演智能運用AI幫製造業做品管

因應製造業少量多樣的客戶需求,亟待可以找到從雲端到終端的AI解決方案。慧演智能提供軟硬整合解決方案-BailAI影像檢測解決方案,來協助傳統製造業提升製程效率及產品品質,達到轉型的初步目標。 政府宣示2017年為台灣「AI元年」之後,台灣AI新創公司如春筍般林立,成立於2018年的慧演智能即鎖定智慧製造,提供AI影像分析與流程優化的平台,以深度學習的方式檢測產品的瑕疵和組裝的步驟異常,協助企業建置從終端到雲端的基礎設施,讓工廠生產端可以自動化監控,以提升製程的效率和品質。 熟悉產線品管流程 以AI影像檢測作為創業主軸 慧演智能創辦人暨執行長劉雅雯年紀輕輕,在大學畢業之後即進入製造業,在硬碟零件的塑膠射出製程擔任品管職務,「當時已經在產線上,對於生產機台的產線流程相當熟悉」,她之後轉換跑道擔任行銷企劃、接著又擔任過AI產品經理,在時機成熟之後,劉雅雯決定創業,以製造業的AI影像辨識作為創業主軸。 「企業的困難在於缺乏AI開發團隊,即使有了AI團隊,開發專案要花很多時間,至少6-12個月」深諳市場痛點的劉雅雯表示,平台要解決的問題是提供傳統製造業不需要程式開發背景的員工,也可以自行打造AI模型的平台,從遠端協助產線的故障排除及後續的系統維護作業,來幫助企業節省開發時間及人力成本。 BailAI影像檢測平台使用場景 面對市場上提供AI影像辨識的競爭對手非常多,慧演智能的技術優勢何在劉雅雯表示,現階段許多企業備有AOI光學檢測設備,但AOI光學檢測在應用上的瓶頸是,只能用於產線速度快、數量多的瑕疵檢測,而每回檢測或生產都要重新調整參數。而根據她對產業的了解,受限於AOI設備動輒上百萬元台幣起跳,大部分中小型傳統製造業,並不具備雄厚的財力,但他們又想要做自動化檢測,這就是慧演智能的機會。 劉雅雯接著表示,傳統製造業不可能養一個包括AI工程師、資料工程師、雲端架構師、終端架構工程師等專業人才的技術團隊,而慧演智能擅長於軟硬體整合,企業透過BailAI影像檢測平台,就能輕鬆解決產線上的檢測問題。換言之,客戶只需提供影像或樣品,交由慧演智能訓練模型、部署模型及系統整合,即可輕鬆使用AI技術進行產線流程優化及監測。 參加AI新銳選拔賽 組裝行為影像辨識辨識率達9成以上 舉例而言,某家連接器廠商,技術團隊只有1-2位AI工程師。主要解決的問題是,大部分作業員都在產線上,而品管及高階主管在遠端,公司欲透過遠端監控方式掌握產線實際情況。慧演智能透過工業相機拍攝產線畫面,並將AI影像分析傳送到遠端,主管及品管人員可以透過螢幕來觀察產線組裝有無錯誤,如連接器頭跟線路有沒有接好等問題。 慧演智能的AI影像檢測架在微軟的Azure雲端平台上進行作業,也會透過終端設備,如NVIDIA的邊緣運算設備放置於檢測站周邊,透過雲端到終端的整合解決方案,協助傳統製造業提升產線效能與及早發現問題。現階段慧演智能的客群包括航空、電子周邊、連接器及金屬等相關產業。 組裝產線人體行為辨識組裝流程解決方案,準確率達9成以上 為了實證技術深度,慧演智能參加經濟部工業局2021年AI新銳選拔賽活動,為光寶科技提供「組裝產線人體行為辨識組裝流程」解決方案,透過相機及AI影像辨識的方式辨識產線作業員的有效工時及無效工時,也就是透過影像辨識手的姿勢及位置,來判斷作業員的組裝行為,其精準率可達9成以上。 劉雅雯補充說明,由於電子零組件組裝工序較複雜,多以人力為主,無法以機械手臂取代,因此慧演智能在光寶的組裝站裡,用鏡頭拍下作業員組裝的流程,再針對影片進行演算法的訓練、校正,最終訓練出的模型能直接判斷組裝過程是否出現任何錯誤,以改善整體流程。 導入BailAI影像檢測平台 專案開發時間可望縮短至1個月 成立三年多以來,慧演智能累積不少專案經驗,希望能將專案經驗產品化,劉雅雯指出,將於今2022年完成BailAI影像檢測試用版,客戶可依檢測物件的精細度選擇工業相機、視訊相機,甚至於X光來擷取影像,再透過平台做影像自動標記,慧演智能會提供符合場域的AI應用模型,供客戶使用,也可以在雲端終端做推論,便於製造業上線使用。包括金屬產業、工業電腦的金屬機殼、連接器、電子周邊,機械零件,皆可利用平台進行瑕疵檢測及物件辨識。 現階段慧演智能將持續提升技術能力,累積客戶的經驗完成產品化,同時加速AI檢測落地應用,中期將建置終端雲端基礎設施,將企業AI專案開發時間從6-12個月縮短至1個月,降低企業使用時間及使用門檻。長期目標將鎖定台商聚集較多的東南亞市場,將軟硬整合AI解決方案拓展到海外市場,擴大營運規模。

這是一張圖片。 This is a picture.
讓會議紀錄不再曠日費時 迪威智能Meeting Ink用AI幫你記錄會議

Meeting Ink企業版同步推出中 根據最新研究顯示,一般會議後若沒有即時追蹤與複習資訊,兩小時內將遺忘約50的內容,經過多層轉述和彙報,更可能遺漏超過三分之一的關鍵資訊。會議記錄對於流程嚴謹的企業和公部門尤為重要。然而,大量會議需求下,記錄可能造成會議成果遺失及團隊負擔。看準這一市場痛點,台灣AI新創迪威智能(DeepWave)推出「Meeting Ink」mdashmdash一款結合語音、文字、和自動化AI技術的全新會議紀錄解決方案。Meeting Ink 不僅支援語音轉文字、語者辨識、逐字稿翻譯、及自動化會議重點摘要,還提供消費端和企業端的靈活服務,並於今年Q4增添即時逐字稿與翻譯功能,開創會議管理新格局。 AI技術一站式解決會議紀錄痛點 自2023年底上線以來,「Meeting Ink」已成為市場上高效、準確的會議紀錄管理解決方案。迪威智能結合其自有技術、第三方工具與微軟Azure的語音識別技術,打造出最佳的語音轉文字體驗,並附加語者辨識與分段、多語言翻譯,以及多種場景下的會議摘要功能。為了實現更廣泛的應用,Meeting Ink也提供即時應用方案,使其不僅適用於日常會議,也能滿足活動、論壇、學習課程等多樣場景。目前,Meeting Ink 支援APP和網頁雙平台,並提供企業客製方案以進一步擴展應用。 優秀的聲音識別技術和最佳使用者體驗 「Meeting Ink」在市場中的優勢在於其精確的聲音識別技術和以使用者為中心的應用設計。依靠迪威的專有技術,Meeting Ink 能將語音訊號轉換為具有語者代表性的文本內容,識別每位與會者的聲音,確保資訊被清晰區分。除此之外,會議內容可以進一步根據語者進行摘要彙整,並在迪威的優化系統加持下,生成不同場景和角色的專屬摘要模板。無論是企業高層會議、學術論壇,還是個人訪談和學習課程,Meeting Ink都可依照不同背景產生量身定制的摘要內容,為會議紀錄帶來更高效、靈活的使用體驗。 精準定位企業需求,提供全方位企業應用 洞察到未來市場需求的轉變,迪威智能推出了針對2B架構的客製化服務方案,進一步優化了Meeting Ink在企業端的應用。企業客戶可使用專業版功能並享有獨家客製設計的摘要模組,以符合特定產業的需求。迪威智能承諾定期更新AI模組,確保提供最先進的技術支援。此外,Meeting Ink的企業服務方案更強調數據安全、帳號權限管理、無上限儲存空間、多裝置兼容支援所有錄音情境等,並以市面上最低的錄音時價,為企業提供經濟高效的解決方案,讓企業可專注於核心工作,提升整體會議效率。 把握AI時代脈動,領先應用市場 根據2023年市場報告,AI應用工具在未來十年內的全球市場將從近70億美元成長至500億美元,且商業與學習工具將是市場中的關鍵角色。面對AI技術發展的快速進程,迪威智能憑藉自身技術實力與創新能力,以Meeting Ink打入國際市場,並持續為企業與個人帶來會議紀錄的革命性變革。未來,迪威將不斷優化Meeting Ink,致力於推動AI技術與人們日常工作、學習場景的緊密結合,為用戶創造更便捷、高效的工作環境。

【解決方案】7毫秒內分離人聲 洞見未來科技協助聽損者「聽說更簡單」
7毫秒內分離人聲 洞見未來科技協助聽損者「聽說更簡單」

某週四下午,下了一場傾盆大雨,然而,位於台北小巨蛋附近的洞見未來科技RelaJet台北體驗中心內,客戶預約全滿,主要是聽損人士前來試聽運用人聲分離引擎設計製造出來的助輔聽器,對於聽損人士而言,能夠有平價、輕巧、降噪效果佳的助輔聽器可用,真可謂一大福音。 「希望幫助有需要的使用者,再次聽見世界的精彩」這是同為聽損人士的RelaJet創辦人暨執行長陳柏儒體貼的期望,他最懂得聽損者的需求,也希望藉由洞見未來科技獨特的人聲增幅助聽技術,能夠造福更多的人。 萬元有找的輔聽器 造福廣大聽損者 成立於2018年的RelaJet,是陳柏儒與哥哥陳宥任共同創辦的公司。RelaJet所研發的多人聲分離引擎搭配高通藍牙音訊平台,將動輒8-10萬元的進口助聽器價格壓低到萬元有找,就是希望能研發平價、降噪效果佳、可運用無線傳輸連結手機的好商品。 公司成立後的前2年,主要研發多人聲分離引擎,讓降噪效果更佳,搭載上高通藍牙耳機晶片之後,音訊處理時間極短,大約7毫秒就能強化主要人聲、降低周圍噪音干擾,只需要傳統助聽器醫療標準16毫秒不到一半的時間,幾乎「零延遲」。 洞見未來科技推出平價助輔聽器,大大嘉惠聽損者 陳宥任解釋,主要是運用高通晶片的邊緣運算,加上極簡化的演算法才能做到極低延遲及聲音可以處理更好的降噪度,同時助聽器可涵蓋18個頻道,傳統的助聽器涵蓋的範圍是4-48個頻道,未來RelaJet會朝更多頻道逐步邁進。 根據統計,全球聽覺障礙者總計47億人,其中,已開發國家聽力輔具配戴率平均為30,其中以歐美國家最多。台灣有近150萬人失能性聽損,其中,中老年族群失能性聽損就佔了30,而輔具配戴率僅有10,比率相當低。 陳宥任進一步分析,輔具配戴率偏低有兩個原因,一、國際大品牌平均售價高達8-20萬元,可使用期限3年,不僅售價高、養護成本也高,讓很多人卻步;二、在吵雜環境下,噪音也被放大,使用者仍然不一定能聽得清楚,並且聲音參數無法即時、自由調整,需要常回到門市調校不是很方便。三、大部分機種無法連接手機,不方便聽損者接聽聽電話。 運用高通藍牙晶片 產品開發速度大躍進 有鑑於此,曾在聯發科擔任半導體工程師的陳柏儒負責技術研發,有法務背景的陳宥任主責公司的管理與營運,兄弟合作無間,組建團隊運用AI人工智慧演算法與晶片串接,學習數據庫內幾千小時的音檔,透過神經網路與深度學習技術,研發出低延遲、高降噪的人聲增幅助聽技術。並在2019年將此聲音處理技術整合至高通藍牙晶片,並獲得高通台灣新創競賽獲得冠軍、高通全球擴展計畫夥伴的榮譽,讓產品開發速度大躍進,2021年在台灣推出自有品牌Otoadd系列助輔聽產品,並受到市場的青睞以及有廣大聽損者的好評。 根據不同消費者的需求,有不同的產品設計,陳宥任表示,Otoadd具有輔聽功能的無線耳機N1,屬於頸掛式入門款,售價一副9,500元,可以一邊帶輔聽器一邊聽電話,運用手機App即可控制降噪強度及聲量大小。未來也將研發周邊配件,以符合年長者的需求。該輔聽器除了在台北、高雄體驗中心可預約試聽外,也可在PChome商城、台哥大myfone商城、樂齡網等輔具通路販售。 另一款為針對輕度到重度聽損者設計的Classic R助聽器,於2021年獲得日本Good Design設計獎,這款產品自去年底上市,對於先天性聽損者具有吸引力,用過的人都說在吵雜的環境下也能比過去聽得更清楚,也感受到藍牙連接手機通話、看影片的便利。預估此一商品也將在今年下半年外銷海外市場。 此外,今年6月即將上市的助聽器藍牙功能二合一功能產品,大小就如同一般藍牙耳機,主力客群鎖定在意外觀的聽損者,一方面體積較小、無線耳機造型設計美觀,加上也可接聽電話,若經衛福部許可上市之後,符合資格的聽損者還可以向政府申請補助。 RelaJet下一階段將進軍海外市場 以美國為灘頭堡 有趣的一個問題是,因應疫情關係,全民都必須配戴口罩,無法讀唇語,此對聽損者的影響是如何呢陳宥任表示,此時就能凸顯RelaJat的優勢了。由於每位聽損者聽力強弱不同,助聽器僅能補充到適當音量,協助聽損者聽取6-7成內容,餘3成仍須仰賴讀嘴唇及手勢。而在疫情期間,為了防疫,人人都戴口罩,口罩也讓聲音有所遮蔽,RelaJat人聲分離引擎也能校正補強,使戴口罩者的聲音分離清晰,方便聽損者辨識。 除了台灣市場之外,RelaJet下一階段將進軍海外市場,預計今2022年將取得ISO 13485醫材品質管理系統認證及美國醫療器材許可證,以美國為灘頭堡,以自有品牌或是成品貼牌方式銷售海外。 除了台灣市場之外,RelaJet住輔聽器下一階段將進軍美國市場