2020/08/19 | 電子報No.0177期 | Peter 謝啓賢
製作熱區圖之前
在介紹如何製作熱區圖之前,先帶大家來了解面量圖與熱區圖的差別。身為地圖的使用者,較常使用面量圖的方式,在統計地圖上呈現區域數值或比例的高低。但面量圖呈現資料有其缺陷,一來容易被空間範圍較大的空間單元所誤導,二來較無法從中看出整體性的趨勢,此時熱區分析(Hotspot analysis)即是另外一種數值資料在地圖上的呈現應用方式,它可以精確掌握出資料在空間分布有無關聯性,當高數值的資料在空間中都聚集在一起就會成為熱區;相反的則是冷區,用圖像化方式輔助我們更容易判讀地圖。基本上就是,面量圖是讓使用者直觀讀出地圖上數據最極端的地方,而熱區圖則是找出空間分佈的集中趨勢。
舉例來說,以下圖(圖1)為例,新北市金屬製品業的分布情況左圖是以面量圖呈現其家數分布情況,最主要集中在新莊和樹林。右圖熱區圖可以明確看到比較集中的位置,如新北產業園區、西盛工業區、樹林工業區等地,但其呈現的是一個聚集強度的相對概念,只能呈現哪裡「比較聚集」。
熱區分析可以讓讀圖者很直觀的透過地圖配色,即刻看到製圖者想凸顯的區域。過往我們利用熱區分析且製作了許多互動地圖,如利用臺北市政府的開放資料製作臺北市住宅竊盜強度圖,分析可能的犯罪熱點;蒐集全台灣近9,000家投注站,並以「樂透開獎以來頭獎於各投注站的開獎次數」為權重,製作了頭獎強度圖;也依環保署公布之公害陳情案件資料,輔以公害影響範圍算出公害陳情強度圖;也透過POI的資料模擬夜間街道的明亮程度,製作夜歸地圖…等,熱區圖的應用很多元。
上述雖然簡單的介紹了熱區圖,但是它不是將資料放進去就好,但大家是否會好奇要如何找到空間中的熱區呢?目前有很多工具都可以快速產出熱區圖,但參數的設定可是大有學問呢!實際上製作時,它會受到「空間單元」、「鄰近關係定義」、「鄰近資料的空間關聯性」等…因素的影響。接下來就帶大家深入了解製作熱區圖需考量的三大因子。
一、空間單元:存在群聚的空間分布型態
統計學中我們會說兩兩資料間存在正相關、負相關或無關的關係,落在空間上,資料在空間分布的特性就存在群聚(clustered)、分散(dispersed)、隨機分布(random)等型態(圖3),群聚代表相似的資料或數值在空間中有聚集的現象,例如特定的產業會有聚集的現象(如傢俱業、汽車展示場間),離散代表相似的資料或數值在空間分布呈現分散分布的情況,隨機分布則為資料或數值在空間分布並沒有固定的規則。我們可以說,當資料存在空間群聚特性時,其空間自相關的程度很高,透過肉眼我們就可以直觀看出某些資料聚集在一起。
二、鄰近關係定義
鄰近的資料要怎麼定義,到底多近的資料叫做鄰近?常見的有幾種方式(圖4):
-
● Rook:不同資料間共用一個邊,則為Rook相鄰。
-
● Queen:不同資料間共用一個邊或一個端點,則為Queen相鄰,意即只要有接觸到的面資料就算相鄰。
-
● Distance:設定一定距離內的資料都算相鄰。
-
● K-Nearest Neighbors:設定最鄰近的幾個資料算相鄰。
面資料適用於上述四種鄰近關係的定義,但Rook僅適用於規則網格,如為行政區屬不規則型多邊形只能使用Queen的方式。另外以點資料來說,無法透過Rook或Queen的方式來定義鄰近的資料,一般最常使用Distance,設定一定的搜尋半徑定位為相鄰的資料。
搜尋半徑的大小往往影響熱區的呈現效果,如下圖5我們以台北市便利商店資料為例,使用Kernel Density分析便利商店的分布熱區,分別以250、500、1,000公尺為搜尋半徑。可以發現搜尋半徑開的越小較能看得出局部的群聚特性,例如左圖就可看出台北車站和西門町附近是便利商店最群聚的地區,交通較為便捷的地方通常便利商店分布也越聚集;相對地搜尋半徑開的越大,鄰近的點資料可能找到越多,產生的熱區範圍可能越大(右圖)。搜尋半徑開的大小沒有絕對的標準,一般會看想要呈現的效果來決定搜尋半徑,如經濟地理資訊系統計算的消費強度圖(圖6),為讓想開店決策的使用者能夠掌握到街廓甚至更小尺度的熱區強度,搜尋半徑可以設定到300公尺以下,但如要呈現全台製造業的聚集情況(圖7),則可以將搜尋半徑設定到1,000公尺以上,因此搜尋半徑的設定需要考量產業的特性,也是產製熱區圖的關鍵點之一。
三、鄰近資料的空間關聯性
前述提及當資料間存在*空間自相關,其本身應該存在空間群聚或與鄰近數值高度相關,雖然鄰近的資料可能會影響自身的數值高低,但其影響效果有可能是遞減的,越近的影響程度大,越遠的影響越少。就像超級比一比這類的團康遊戲,和出題者越接近的越容易答出一樣的答案,但離的越遠歪樓的可能性越大。因此針對這種與鄰近資料的空間關聯性,主要又有以下幾種遞減方式:
-
● 距離反比(Inverse distance, inverse distance squared):鄰近數值的影響隨著距離越遠影響越小,例如聲波的傳遞。
-
● 距離帶(Distance band):一定距離內有相同的影響,超出一定距離沒有影響。
-
● 不同歧異點(Zone of indifference):一定距離內有相同影響,但超出一定距離影響快速遞減。
資料來源: ESRI
上述提到的是需重點考量的因子,但實際上在製作時,並沒有哪一種方式最為適合、一定要如此製作的制式化製圖方法,還是要依使用情境而定。
分享了熱區圖以及筆者過往製作熱區地圖的經驗,接下來會再跟大家分享,前些日子在瑞竣科技粉絲團發佈的「姓氏資料熱區圖」(我們整理了六篇姓氏分析 劉姓、林姓、張姓、黃姓、蔡姓、王姓)。
根據內政部全國各鄉鎮市區前二十大姓人口」資料,挑出十個特色姓氏,透過空間分析方法中的熱區分析,在下期電子報與你深入分享。想知道你的姓氏有沒有進入前二十大?你的姓氏是否有特別聚集區域?請期待下期分享
*註 空間自相關指的是,數值較大的資料集中在空間中的某一區
更多有趣的地圖資訊都在「瑞竣科技 給您地圖新鮮事」,馬上Follow
|