【111年解決方案】 1 秒鐘完成結帳動作 Viscovery AI 影像辨識助攻智慧零售

編輯群2022-04-27

221

近年來，人工智慧 (Artificial Intelligence，簡稱 AI) 已逐漸改變各行各業的運作模式，不過，絕大部分的工作仍然是由人類完成，AI 則扮演輔助的角色，因而出現了「AI Copilot」一詞，代表「由 AI 驅動的工具或助理」，旨在協助使用者完成各種任務，提高生產力和效率。

AI Copilot 的概念源自於「副駕駛」這個角色，在飛行中，副駕駛協助主駕駛員完成各項任務，確保飛行安全與效率。其實，工業革命的「機器」就開始有 Copilot 的影子，各種機器在不同領域中扮演「Copilot」的角色，輔助人類完成繁重的體力和重複性工作，大幅提升工廠生產效率，推動經濟快速發展。

隨著運算設備的進步、機器學習、深度學習、影像辨識等技術的突破，AI Copilot 的概念逐漸成形。AI Copilot 的發展標誌著從「機器輔助提升到智慧輔助的轉變」。早期的機器人只能完成預設的重複性工作，而現在的 AI Copilot 則能夠學習和適應新的環境與任務，並在實際應用中不斷優化自身表現。這一轉變不僅改變了人機交互的方式，也為各產業帶來了深遠的影響。

AI Copilot 的應用範圍涵蓋了各個行業，包括：金融、醫療、製造、教育、零售…等等，無處不在。

AI Copilot 於零售業的應用：AI 影像辨識結帳

在零售業，AI Copilot 的應用已經開始展現具體成果。

以 Viscovery 的 AI 影像辨識結帳系統為例，這套系統即為 AI Copilot 模式的一種，輔助店員加速結帳，或者輔助消費者簡化自助結帳流程。

一般的結帳方式需要店員逐一掃描商品條碼，若是無條碼的商品，如：麵包、餐點，則需店員花時間先用肉眼確認品項，再一個個輸入到 POS 結帳系統中。根據一家連鎖麵包店實測，資深店員從「肉眼辨識」到「輸入一盤 6 顆麵包的商品資訊到結帳系統」的過程，就要 22 秒的時間，新進店員需要的時間可能更多。另外，根據一家日本麵包店業者分享，培訓員工認識、熟悉商品需要 1 至 2 個月的時間。

現在有了 AI 影像辨識技術，店員可以把「辨識商品」的步驟交給 AI，由 AI 扮演 Copilot 的角色，1 秒內迅速辨識品項，加快結帳，整體節省 50% 的結帳時間，優化顧客購物體驗。而培訓員工辨認麵包的時間成本，也能因此有效縮短。

即便是帶有條碼的商品，AI 也可以在一秒內快速辨識多個品項，相比逐個掃條碼的方式，效率更高！

而有 AI 影像辨識「輔助」的自助結帳系統，則能夠讓消費者在沒有店員幫助的情況下，順利完成購物，省去刷條碼或在螢幕上查找品項的麻煩，提升購物體驗，在缺工、找不到店員的時代，也幫助店家降低營運成本。

▲AI 快速辨識多件結帳商品只要一秒鐘 (圖片來源：Viscovery)

近來，致力研發 AI 影像辨識結帳方案的新創在各國嶄露頭角，目前已知最輕量化的解決方案就在台灣，只要在結帳櫃檯安裝一支 Viscovery 的鏡頭與一台搭載 Viscovery AI 影像辨識軟體的平板，即可與店家既有的 POS 結帳系統串接，馬上啟用。

整合方式多元，有隨插即用的作法，也有與店家 POS 整合的 API 串接方案。

▲ Viscovery AI 影像辨識系統可與店家現有的 POS 系統無痛整合 (圖片來源：Viscovery)

AI 影像辨識結帳的導入實例

目前 Viscovery AI 影像辨識系統已導入台灣連鎖烘焙店、新加坡中式麵店、日本仙台百貨公司商辦超商 (micormarket)、日本麵包店與蛋糕店…等等。超過 700 萬筆交易筆數，都是透過這套 AI 系統完成，辨識超過 4000 萬件商品。這些使用案例展示了 Viscovery AI 影像辨識系統在零售行業的廣泛應用，未來將持續深耕、探索零售及餐飲運用 Vision AI 的各種可能。

▲Viscovery AI 影像辨識系統已導入日本、新加坡、台灣，使用於麵包店、蛋糕店、餐廳、便利商店等多個場域 (圖片來源：Viscovery)

推薦案例

讓硬碟裡的音樂重生愛飛媒平運用AI為影像找到最佳拍檔

#AI影像音樂媒合平台

#快速配樂配對

#版權保障

一名年輕女孩，孤身在美國洛杉磯，為的是尋一個夢，一個能讓音樂創作者深埋在硬碟中的創作音樂重新找到知音的夢helliphellip。愛飛媒平創辦人李姿慧，理工科出身，心中卻卻深埋音樂人的強大基因，為了協助全球音樂人創作音樂能找到能配對成功的「最佳夥伴」，她創立愛飛媒平公司，提供一站式AI影像音樂媒合平台AV Mapping，協助影像創作者可以快速找到擁有版權的原創音樂。一站式AI影像音樂媒合解決方案，為音樂創作者找到創新商機一般來說，以往影像創作者要進行影像配樂，從作詞曲、配樂、找版權，通常需要花上兩周時間，透過AV Mapping影像音樂媒合平台，10 秒鐘立即配對到適合的音樂，音樂人也可以將創作再行銷取得分潤營利，創造三贏局面。此一嶄新、去中心化的營運模式，也獲得已故台灣音樂大師-李泰祥傳人的青睞，在平台上可重溫那一段讓音樂創作恣意飛翔的時光。李姿慧從小練鋼琴、參加合唱團及管樂團，並自己創作音樂，大學雖然念的是理工科系-成功大學測量及空間資訊學系，但從大三開始，即加入影像團隊從事配樂，並赴南藝大應用音樂系旁聽。大學畢業後，李姿慧決定順從心裡的聲音，當音樂的尋夢人。愛飛媒平提供一站式AI影像音樂媒合解決方案愛飛媒平提供一站式AI影像音樂媒合解決方案，主要係藉由人工智慧的影像辨識和音樂分析，影像創作者在平台上可自行搜尋、配對合適的音樂，透過系統可將配樂的時程從8小時縮短至幾秒鐘，大幅縮短近2,000倍。李姿慧表示，傳統影像配樂工程除了創造合適配樂，還須將大量時間成本投注在溝通及搜尋上，包括後續的編曲、錄製等後製處理和音樂授權更是耗時耗力，有了AI的協助，創作者能將所有心力花在創作上，不必擔心找不到適合音樂，或是音樂版權遭盜用的困境。虛實整合行銷，從交易到簽約一鍵完成目前愛飛媒平的音樂資料庫共有6萬首曲目，種類超過60種，涵蓋歐美及亞洲等世界各地音樂，包含流行、EDM、搖滾、愛爾蘭音樂等。愛飛媒平獨創的去中心化概念更大幅保障音樂人權益，在平台上的音樂人可自行訂價並追蹤交易流程，達到公開透明、去中心化的特性。目前平台上包括影像及音樂創作者共有7,000多位，音樂創作者在平台上交易成功，可分潤4成以上，最高達到5成。雙方在平台上交易並完成簽約，手續十分簡便。 AVMapping共有14種AI模型，輕鬆找到速配音樂李姿慧表示，AI影像音樂媒合解決方案共有14種AI模型，其作法是拆解所有元素之後，透過影像辨識與文字辨識，做音樂分析，再運用機器學習演算法大量訓練，將影像及音樂的特徵列出，即能快速媒合出合適影像情境、氛圍、節奏的配樂。除了線上媒合交易外，愛飛媒平也舉辦實體音樂會活動，邀集音樂及影像創作者參與，活動的內容環繞在AI影像配樂的展示，現場運用導演一段影片讓音樂創作者PK配樂；或是拿出示範影片，由AI進行配對，只需耗費端端10秒鐘，AI配對的影像與音樂在情緒及氛圍上都十分到位，讓現場參與者嘖嘖稱奇。三年研發獲紅點設計大獎，以科技支持音樂藝術發展愛飛媒平花了三年的研發，平台於2021年8月正式上線，2022年元月份在美國拉斯維加斯參加CES活動，引起在場記者高度關注，共獲得超過上百家的媒體報導，使得一個月使用次數就超過千倍，吸引7,000位影像、音樂創作業者加入媒合平台，據統計，先階段美國與台灣媒合交易比重各半。李姿慧表示，傳統音樂的授權方式十分複雜，包括著作類型、著作財產權種類等，要取得一首歌曲的授權，必須經過詞曲經紀公司、集管團體、製作公司、唱片公司，甚至是作曲、作詞者，十分繁瑣，音樂人也並不一定能得到分潤收入。透過AI影像音樂媒合平台，所有交易合約在線上完成，音樂創作者能獲得利潤，創作熱情不斷被激勵。三步驟協助影像創作者輕鬆完成配樂工作值得一提的是，目前NFT（Non-fungible token，又稱為非同質化代幣）在藝術及文化市場大行其道，影像音樂領域導入的可能性如何李姿慧表示，目前以太坊的交易手續費（gas fee）居高不下，加上她在洛杉磯參加多次聚會得到的結論，目前NFT接受度仍在醞釀中，然而，愛飛媒平仍看好NFT未來趨勢，在可預見的未來，仍會將相關技術導入AV Mapping平台，提供更多元化的交易方式。為了快速擴充海外市場，李姿慧在舊金山不斷尋求國際策略性投資人挹注資金。同時，由於美國洛杉磯疫情控制得宜，產業逐漸復甦中，李姿慧也參加許多線下創作聚會。愛飛媒平希望成為連接影像與音樂的橋樑，在國際市場上導入知名的使用者案例，讓更多創作者看到平台的威力。愛飛媒平也頻傳捷報，繼榮獲DSA數位廣告奇點銀獎、美國在臺協會與META合辦的AWE女性創業最佳潛力獎之後，李姿慧創辦的一站式AI影像音樂媒合平台AV Mapping也於2020年再度獲得德國紅點Read Dot Award設計大獎設計概念Design Concept的最佳設計獎Best of the best，希望持續以科技立足、以藝術為養分，支持音樂創作者創作出更好的作品。愛飛媒平創辦人李姿慧榮獲多項國際大獎，是深具潛力的女性創業家

讓會議紀錄不再曠日費時迪威智能Meeting Ink用AI幫你記錄會議

#人工智慧

#技術創新

#語音識別

Meeting Ink企業版同步推出中根據最新研究顯示，一般會議後若沒有即時追蹤與複習資訊，兩小時內將遺忘約50的內容，經過多層轉述和彙報，更可能遺漏超過三分之一的關鍵資訊。會議記錄對於流程嚴謹的企業和公部門尤為重要。然而，大量會議需求下，記錄可能造成會議成果遺失及團隊負擔。看準這一市場痛點，台灣AI新創迪威智能（DeepWave）推出「Meeting Ink」mdashmdash一款結合語音、文字、和自動化AI技術的全新會議紀錄解決方案。Meeting Ink 不僅支援語音轉文字、語者辨識、逐字稿翻譯、及自動化會議重點摘要，還提供消費端和企業端的靈活服務，並於今年Q4增添即時逐字稿與翻譯功能，開創會議管理新格局。 AI技術一站式解決會議紀錄痛點自2023年底上線以來，「Meeting Ink」已成為市場上高效、準確的會議紀錄管理解決方案。迪威智能結合其自有技術、第三方工具與微軟Azure的語音識別技術，打造出最佳的語音轉文字體驗，並附加語者辨識與分段、多語言翻譯，以及多種場景下的會議摘要功能。為了實現更廣泛的應用，Meeting Ink也提供即時應用方案，使其不僅適用於日常會議，也能滿足活動、論壇、學習課程等多樣場景。目前，Meeting Ink 支援APP和網頁雙平台，並提供企業客製方案以進一步擴展應用。優秀的聲音識別技術和最佳使用者體驗「Meeting Ink」在市場中的優勢在於其精確的聲音識別技術和以使用者為中心的應用設計。依靠迪威的專有技術，Meeting Ink 能將語音訊號轉換為具有語者代表性的文本內容，識別每位與會者的聲音，確保資訊被清晰區分。除此之外，會議內容可以進一步根據語者進行摘要彙整，並在迪威的優化系統加持下，生成不同場景和角色的專屬摘要模板。無論是企業高層會議、學術論壇，還是個人訪談和學習課程，Meeting Ink都可依照不同背景產生量身定制的摘要內容，為會議紀錄帶來更高效、靈活的使用體驗。精準定位企業需求，提供全方位企業應用洞察到未來市場需求的轉變，迪威智能推出了針對2B架構的客製化服務方案，進一步優化了Meeting Ink在企業端的應用。企業客戶可使用專業版功能並享有獨家客製設計的摘要模組，以符合特定產業的需求。迪威智能承諾定期更新AI模組，確保提供最先進的技術支援。此外，Meeting Ink的企業服務方案更強調數據安全、帳號權限管理、無上限儲存空間、多裝置兼容支援所有錄音情境等，並以市面上最低的錄音時價，為企業提供經濟高效的解決方案，讓企業可專注於核心工作，提升整體會議效率。把握AI時代脈動，領先應用市場根據2023年市場報告，AI應用工具在未來十年內的全球市場將從近70億美元成長至500億美元，且商業與學習工具將是市場中的關鍵角色。面對AI技術發展的快速進程，迪威智能憑藉自身技術實力與創新能力，以Meeting Ink打入國際市場，並持續為企業與個人帶來會議紀錄的革命性變革。未來，迪威將不斷優化Meeting Ink，致力於推動AI技術與人們日常工作、學習場景的緊密結合，為用戶創造更便捷、高效的工作環境。

聲麥無線推出殺手級5G即時AI語音翻譯降低5成口譯成本

#成本效益

#5G即時AI語音翻譯

#多語言服務

聲麥無線以「語音翻譯即服務 VaaS Voice as a Service」，推出領先全球的 5G 即時 AI 語音翻譯服務「VM-Fi聲麥無線」，提供 AI 即時翻譯字幕 TranSpeech 與 AI 多語智慧櫃台 TransDisplay 服務方案，應用於國際展會、觀光產業、零售商場等多元場域的即時轉譯服務，15分鐘快速設置翻譯服務，可大幅降低客戶50口譯服務成本，創造時間與人力成本效益。這項殺手級的應用，是成立三年的聲麥無線所推出的產品，可使得即時口譯成本大幅下降一半，也成功進軍日本市場，廣受消費者青睞。 TranSpeech演講即時字幕與TransDisplay智慧櫃台AI服務方案對於經營國際論壇及會展的主辦方而言，支付高昂的口譯費用一直是業者難以言喻的共通痛點。根據統計，若想在台灣舉辦一場全英文論壇，包括兩位口譯師、架設口譯亭、現場收發無線電台、控制台、音訊等，總花費至少要10萬以上才能達到現場口譯需求。成立於2020年9月的聲麥無線，推出「VM-Fi聲麥無線5G即時AI 語音翻譯服務」，在短短2年時間先後於經濟部工業局通訊大賽、創業歸故里競賽、高通台灣創新競賽（QITC）、日本JR 九州創新商業競賽優秀賞、以及獲得全球 CES 2022智慧城市創新獎中脫穎而出，不僅市場好評不斷，更廣受台灣投資人高度關注及日本大型商社方案採用，期許透過智慧城市解決方案，幫助全球人們免於溝通障礙，享受便利的智慧城市生活。高速5G即時AI語音翻譯免去昂貴人力設備口譯成本省5成集結語言轉譯、數位內容及UX開發等豐厚技術底子的聲麥無線團隊洞察，市場上僅有兩成的高端消費者有能力支付高昂的口譯費用，為滿足其餘八成的市場需求，聲麥無線結合5G高速傳輸及AI語音辨識技術，協助客戶減輕人力、成本負擔，其商務方案可適用於國際展會、觀光服務、商場及線上線下商務會議等多元場域應用。 5G高速AI語音轉譯服務流程 nbsp「不同於傳統口譯師的逐句口譯，過程不僅耗時又沒效率，聽眾也無法流暢傾聽演講內容」，聲麥無線進一步表示，即時AI語音翻譯服務係運用AI演算法進行講師口說和句子分析，由AI判斷台上講者的斷句及主語意思，隨即進行即席翻譯，講師不必等待逐字翻譯的時間，只要把麥克風外接音源線接入VM-Fi 5G即時AI語音翻譯服務，即可暢所欲言，觀眾也能及時閱讀高速的即席翻譯字幕。智慧5G即時AI語音翻譯，獲京都智慧城市展 2022-2023 連續兩年採用現階段「VM-Fi聲麥無線5G即時AI語音翻譯服務」主要支援提供中、英、日、韓、西、法、德七種語言的彼此互轉翻譯服務。在疫情期間，線上活動需求大增的狀況下，聲麥無線導入全球首創的即時字幕服務方案，線上外語講師的內容透過轉譯的即時字幕方式顯示在直播的畫面上，讓聽眾即時了解講師的分享內容。操作方式也很簡單，聽眾不需要下載APP，只要打開活動主辦方提供的Youtube和Facebook直播平台即可收看。即時字幕方案不僅為客戶省去惱人的翻譯工作，也讓線上聽眾能安心享受無縫接軌的即時翻譯服務。即時字幕提供聽眾無縫接軌的即時翻譯服務另外，聲麥無線在日本推出的TransDisplay「智慧櫃台方案」也深受消費者喜愛。聲麥無線表示，日本老年人口多，觀光客也多，尤其是疫情期間，大多數消費者戴著口罩，用語言溝通往往出現鴻溝，透過智慧櫃台直接將雙方的溝通由語音轉文字顯示在透明隔板上，讓民眾一目了然，成為最貼心的服務。未來，聲麥無線將結合台灣面板廠商，以軟硬整合方式，在日本商場、車站、機場及政府單位等場域，推出語音轉即時翻譯字幕的服務。智慧櫃台在疫情期間提供民眾安心友善的溝通服務 VM-Fi扎根日本市場使用者體驗才是王道面對疫情之後的全球跨境觀光商機爆發，聲麥無線對於業務拓展信心滿滿。聲麥無線表示，VM-Fi 5G AI即時語音翻譯服務在這波疫情考驗下，已淬鍊出卓越產品服務韌性，可彈性化滿足客戶在各種實體或線上服務的需求。聲麥無線預計2025年4月前在日本設立營運總部，積極與關西、京都縣市政府進行對接與義務擴張，待日本市場根基穩固之後，歐盟市場將是下一個重要目標。聲麥無線參加經濟部工業局AI計畫的AI創立方聯盟募資活動，公司借助資策會、台日中心TJPO和日本產經省外貿協會JETRO等法人協助，積極搶攻日本市場，「日本市場不僅重視數位轉型，更看重使用者體驗UX」，因此，在日本落地成功之後，拓展全球其他市場將水到渠成。聲麥無線 VM-Fi 應用在日本商場、車站、機場及政府單位。VM-Fi 是一家成立於2020年，充滿熱情和創新精神的新創公司。我們專注於AI語音識別和即時翻譯技術，致力於讓全球人們能夠在國際演講、服務櫃台和溝通中實現高速的同步語音翻譯，徹底打破語言障礙，讓每一個人都能享有資訊平權的權利。VM-Fi 的 AI 服務不僅僅是一項技術革新，更對全球可持續發展做出承諾： A 數位解決方案：我們致力於減少紙張使用，我們減少的每張A4紙，就減少78克的碳排放，以實際數位方案行動推動環境保護。 B 可再生能源決策：我們選擇使用可再生能源的雲服務，並計劃在2025年之前達成使用100使用可再生能源的雲服務為目標，為未來創造更綠色的科技基礎。 C 節水決策：我們承諾使用在2030年前達成水資源正效益的雲服務，確保水資源的補充量超過消耗量，為地球的未來貢獻力量。 D 淨零碳排放決策：使用新的數據中心時，我們將選擇淨零森林砍伐，以保護自然環境。 E 可持續發展目標：通過上述決策，我們積極促進聯合國可持續發展目標（SDGs）4 、7、9、10、11和13的實現，為創造一個更美好的世界而努力。VM-Fi的願景是打造一個無溝通障礙的世界，讓每個人都能自由交流，共同邁向更美好的未來。讓我們攜手並進，為全球的溝通平權和可持續發展作出貢獻；創建更綠色和更美好的未來

Internet Explorer

Mozilla Firefox

Google Chrome

Apple Safari (5.0)