【109年 應用案例】 AI地址解析,查找坐標不再鬼打牆
賦予地址空間坐標,協助推動「資料開放」政策
近年來政府推動「開放資料」,希望藉由資料的開放,促使跨機關資料流通,提升施政效能,滿足民眾需求,以強化民眾監督政府的力量。其中,交通資料與生活密不可分,但來源多是民眾通報的事故資料,在描述地址位置時,常以所在地的明顯目標物或門牌地址做通報;也曾有民眾反應警廣的路況報導,都沒有實際坐標。將這些原先不具空間屬性的地址,帶入地理坐標的資訊,是邁向「智慧空間決策」的途徑之一。
然而,未結構化的地址,若無人工介入處理,改善各門牌地址規格不一的情形,定位的正確率並不高,需要提升資料品質、加強資料可用性,才能創造開放資料應用的可能性,進一步協助政策推廣,並廣泛應用至休閒旅遊、求職及就業、出生及收養等各個不同領域中。
地址無嚴格規範且書寫方式不一,造成定位精確度低
Address Locator為崧旭資訊股份有限公司與研鼎智能股份有限公司GOLiFE與共同開發的「單機版門牌地址定位軟體」,提供單筆或批次地址定位的服務,為了賦予門牌地址空間屬性資料,Address Locator核心技術是以「地址解析」(Parse) 及「地址定位」(Locate) 兩階段進行門牌對位處理。首先,「地址解析」階段將擬定位門牌,依地址中行政區域階層關鍵字:縣市、鄉鎮市區、村里、路街段、巷、弄、號,拆解門牌結構;接著,「地址定位」則將前述拆分後門牌與母體地址匹配,取得定位層級及對應坐標。
然而,實際導入業務的過程中,由於門牌地址來源由不同主管機關各自維護,缺乏一致性標準,常見問題包括:包含特殊字(桃園市觀音區樹林里經建四路2之25及2之26號)、行政區缺漏(基隆市信一路28號)、重複行政階層關鍵字(桃園市平鎮區雙連里民族路雙連二段118巷12號12號)、特殊路街段巷弄(無行政區階層關鍵字)、門牌中文數字與阿拉伯數字規格不一、非現況地址等,地址型態複雜,地址精確拆分不易。
建立地址斷詞模型,成功精準定位!
為有效處理各式雜亂的門牌樣態,解決現有Address Locator地址定位上的困難,導入AI及自然語言處理技術的「地址正規化」及「中文斷詞工具」優化現有門牌地址定位能力。其中「地址正規化」處理地址關鍵字缺漏、異體字、行政區缺漏等問題;而「中文斷詞工具」則協助解決特殊地址樣態造成的「拆分錯誤」,避免出現無法成功定位的問題。
▲透過AI斷詞技術成功解析地址
過去在處理地址定位服務時,仍需人工進行資料規格調整的前處理,故多未單以產品的方式銷售,而是涵蓋在專案計畫中,提供門牌地址定位服務。而在導入地址正規化與AI斷詞技術後,已成為一個完整的產品,大幅降低使用者人為調整的時間,並達到預期的定位精準度,且AI加值後的Address Locator地址定位軟體,已於崧旭資訊股份有限公司網站上進行產品介紹及正式上架。
經過四個月的測試與修正,AI技術成功導入原有地址定位產品中,從斷詞工具的選擇、語料的建立、模型訓練並與產品功能介接,再以完整的驗測規劃,蒐集「政府資料開放平台」與「台中市政府資料開放平台」,共62個資料集、30萬餘筆地址,完全比對率達90.08%,模糊比對率高達98%,在比對率及處理時間上都大幅優於原產品!
為推廣AI技術應用於資訊服務領域,將AI加值後的門牌地址定位服務,作為新的解決方案,並於崧旭公司網站中上架宣傳;從產品功能開始介紹,說明地址正規化方式及地址定位功能;接著,引導潛在客戶想像可以適用的情境包括:決策分析、精準行銷及其他應用,產品將協助不同領域的資料,透過門牌定位賦予空間資訊,進入二維空間探索資料的脈絡與趨勢。
▲門牌地址定位解決方案
賦予景點、交叉路口及興趣點空間坐標
成功開發AI加值產品再導入致力於國內智慧型交通運輸系統類型的公司過程中發現,雖能有效解決門牌地址定位的問題,但也發現實務上關於空間資訊的描述,除門牌地址外,也包括交叉路口、興趣點及地景描述等資料樣態,為了擴大AI應用的面向,「實體識別」將成為重要的後續應用,並不僅止於門牌地址定位,在資訊轟炸的時代,資料蒐集並不是難事,如何從資料中篩選出感興趣的關鍵詞才是關鍵,未來也將朝這個方向繼續發展AI技術的資訊應用服務,期能更優化此產品,創造更多商機!