一、前言

自西元2000年左右以來的網際網路技術發展與革新,即進入所謂的第二代網路(Web 2.0)架構,其係為允許使用者於網頁或應用平台上,進行互動、溝通、分享或協同合作等,有別於第一代網路(Web 1.0)(約西元1990~2000年之主要網路運作方式),使用者大多僅能被動式地接收網頁資訊。由於Web 2.0技術普及與社群媒體快速發展,促成大量使用者生成內容(User generated content, UGC)之出現與產出,例如:文字訊息、專題文章、心情描述、打卡、照片、影片、廣播聲音和路徑軌跡等。

使用者生成內容包羅萬象,也因此提供各領域研究良好之題材。對於空間資訊領域的地理資訊建構更是如此(舉凡可以描述空間中的資訊,皆稱之為地理資訊(Geographic Information),例如:便利商店的位置、某藥局的口罩剩餘量、某景點人潮的多寡、高速公路上的車流量),因為使用者生成內容時常包含主題說明、文字註記、時間、地點,甚至是心情狀態等訊息,因此對於地理資訊的挖掘相當有助益,亦可善加運用,進而大幅減少傳統測繪和調查上的人力和時間成本。

二、點石成金:基於使用者生成內容之地理資訊發掘

興趣點(Point of interest, POI)和興趣範圍(Area of interest, AOI)是各領域廣泛使用之基礎圖資、地理資訊,前者常作為空間定位和空間分析之參考點位(例如:地標);後者則係根據特定目標產生之感興趣範圍(例如:適合觀賞某地標的空間範圍)。由於使用者生成內容時常帶有可參考之空間位置、時間和文字描述標記等,因此提供了自動化生成興趣點和興趣範圍之絕佳契機。此為從巨量資料分析,以至資料探勘和資訊萃取之典型議題,此類議題通常會設定兩個問題:哪裡(where)有興趣點?該興趣點是什麼(what)?進而提出有效率的解決方法加以解答。針對上述問題,提出系列研究流程和新型演算法,進而確立興趣點和興趣範圍,其包含下列步驟[1]:1.從巨量資料中,找出有意義(attractive)的資料點位(attractive footprints演算法)、2.進行有意義點位的分群(空間可重疊分群演算法(Spatial Overlap(SO)演算法))、3.建立某分群的興趣點位置(峰值演算法)和為興趣點命名(文字探勘)及4.建立最適合觀賞該興趣點之空間範圍(Alpha shape演算法)。

三、台灣到處是美景,由使用者生成內容告訴我們,熱門景點和絕佳觀賞位置

產生使用者生成內容之平台和管道相當多元,其中Flickr[2]係一全球流行且廣為使用之照片分享社群平台,使用者可將拍攝之照片,結合位置坐標並加上標記,上傳到平台,形成地理標記照片(geotagged photo)並加以分享,其他使用者也將可透過平台提供之簡單關鍵字查詢或地圖查詢功能,欣賞、查閱感興趣的美景或事件。雖然Flickr平台原意僅是純粹提供使用者儲存和分享所拍攝之照片,但我們卻能進行資料加乘、轉化,運用前節所提之四個步驟流程及演算法,從中挖掘出興趣點和興趣範圍,其所蘊含之意義為:集結群體共識、發掘隱含資訊,因此創造、衍生出意想不到的寶貴知識。

根據所蒐集的全台灣九百多萬個地理標記照片(包含從2004年-2017年,長達13年的資料),結合前述所提方法,獲得運算結果如圖1。圖1以顏色色階(藍至紅)表示興趣點可能出現之位置,其係根據attractive footprints演算法計算每點的投票數值,數值愈高,顏色愈紅,也代表著愈熱門、愈多不同的使用者於該位置或其附近(50公尺以內)上傳照片(已過濾掉同一使用者於同一地點對於相同目標之重複照片)。圖1(a)為全台灣興趣點可能出現的位置,圖1(b)和圖1(c)為台北市和台南市之興趣點分布位置(已分別在兩縣市篩選出至少擁有50位以上和30位以上不同使用者貢獻照片的點位,代表該點為熱門景點)。

圖2則以台南市成果為例,展示各興趣點及其興趣範圍。圖中紫紅色點為政府開放資料所公佈之景點位置、黃色點為本研究找出的興趣點之最佳觀賞位置、灰色範圍為本研究找出之合適觀賞範圍。不僅可看出從地理標記照片發掘的興趣點點位位置,和官方資料其實極為符合(如圖2(a)之台南林百貨),對於發掘新興的興趣點(如圖2(b)之正興街商圈)也是唾手可得,而鄰近興趣點、建物走向和適合觀賞該興趣點之角度(如圖2(c)上方興趣點為赤嵌樓、下方興趣點為台灣祀典武廟),皆一目瞭然。依照所提研究方法找出之興趣點和興趣範圍,統整具有下列特點:

  • 可確定每個興趣點的最佳觀賞位置(由attractive footprints演算法之峰值決定);
  • 可找出每個興趣點的合適觀賞範圍(由每一興趣點之興趣範圍決定);
  • 可找出可同時觀賞多個興趣點的位置(由興趣範圍空間重疊次數決定);
  • 可自動建置興趣點資料庫;
  • 可偵測新興的興趣點並根據新興的興趣點偵測流行趨勢。

上述興趣點和興趣範圍都可再根據特定的空間和時間需求做彈性變化,以找出最具特色或特定主題的結果,例如:各縣市、各鄉鎮之特色景點、每年之最、每月之最等,也都是輕而易舉之事。

圖1、興趣點位置(以顏色色階表示)。(a)全台灣分布;(b)台北市分布;(c)台南市分布(顯示台南市之市中心)。

圖2、台南市興趣點(點位)與興趣範圍(範圍)成果範例[1]。(a)林百貨;(b)正興街商圈;(c)赤嵌樓和武廟。

四、無限的未來

興趣點與興趣範圍係各領域用作定位、空間分析、流行趨勢分析、製作主題圖和旅遊相關應用、規劃安排等之重要參考依據,自動化、高效率且低成本之圖資或資料庫建置研究是各界所關心的議題,本研究達成了這樣的目標。現階段所提方法之架構已可處理各類使用者生成內容,只要該使用者生成內容具備點位位置、時間和文字註記等三項基本資訊,將可直接運用本研究方法發掘出興趣點與興趣範圍。

納入更多且更為彈性整合來自不同平台的使用者生成內容,以建構一個綜觀、平衡且包羅萬象主題的興趣點與興趣範圍是未來將持續研究的方向。更為獨特、細緻或領域特定需求的各類議題,例如:隨著不同的季節、一天當中的適合觀賞位置之變化(因為需要考量天氣狀況和拍攝逆光的問題)、考量高度(高程)的興趣點和興趣範圍、發掘新興或隱藏版路線(例如:登山路徑、散步路徑)、基於興趣點和興趣範圍的常規事件推估,以及結合特定族群使用者之喜好,進行相互影響評估與推薦,許多有趣課題,未來將持續探討,也期待各界一起集思廣益。

使用者生成內容是現今資訊時代的寶貴產物,只要運用適當之探勘方法與演算法,即可建構形成各領域重要之基礎資料。善用使用者生成內容,促成無限可能。


引用文獻
Kuo, C.-L.; T.-C. Chan; I. Fan; A. Zipf. Efficient Method for POI/ROI Discovery Using Flickr Geotagged Photos. ISPRS International Journal of Geo-Information, 2018. 7(3): p. 121.
Flickr. Available online: https://www.flickr.com/ (accessed on 23/12/2018)