Fellows:曾文志、馮書昭、柯皓翔、于子傑
Mentor:謝宗震、劉嘉凱
Project Manager:張淑貞
Project Partner:台灣環境資訊協會
土地孕育著無數生命,如同人類的母親。然而當台灣工商業愈加發達,許多農地也在發展歷程中遭汙染。
為讓民眾瞭解農地汙染狀況,台灣環境資訊協會2015年10月發起「守護農地計畫」,希望敦促政府積極行政,讓國民吃得安心,使土地生生不息。
透過智庫驅動(DSP)發起的「D4SG資料英雄計畫」,環資與政治大學資訊科學系/所、新聞系的學生2016年3月下旬組成跨領域團隊,透過資料科學方法,協助環資找出可能受重金屬汙染卻未受政府管制的農地,且分析各縣市的差異,而後希望發展相關專題報導。
兩份資料集套疊,找出超標未管農地
團隊使用農委會農業試驗所(農試所)之「土壤品質及生產力調查」資料,與環保署「土壤及地下水列管場址」資料集中屬農地者進行套疊。前者有重金屬的濃度,後者有公告列管的農地污染控制場址地號;兩者比對後找出未受管制的超標農地。
農試所的資料是1992年至2008年間進行的全國土壤採樣調查資料,累積約13萬筆,涵蓋78萬公頃表土,包含鎘、鉻、銅、鎳、鉛、鋅等六項重金屬有效性之調查。該資料是以250公尺*250公尺網格(6.25公頃)為單位。
不過團隊成員發現農試所所提供之資料,有8000筆重複,並有約13筆時間疑似錯誤(出現在上述時間區間外)。
另外,由於農試所資料與環保署現今重金屬管制標準檢測方法不同,前者是透過0.1M鹽酸方法,後者是經過王水消化法,因此環資先將農試所的資料經公式換算,再根據《土壤汙染管制標準》評估是否超標。
最後得出的超標採樣網格共有1111筆,去掉地理位置重複資料後剩下993筆。
針對環保署的資料,環資已將地號轉為經緯度圍成的多邊形,共5097筆。有300餘筆因缺乏地籍圖資資料,無法轉換。資料最早的一筆為2002年10月2日,最新的一筆資料則更新至2015年12月20日。
鳥瞰重疊狀況
環資在與政大團隊合作前,已經建置完成「守護農地地圖」,將農試所及環保署的資料繪製在地圖上。圖示中的黃色網格為農試所超標網格,紅色為列管中的農地,橘色則是已解除列管的農地。因此,單獨未疊色的黃色網格即為疑似重金屬超標、但範圍內並無政府公告為污染控制場址的農地,盼有關單位應儘速查證。
從距離、密度二指標回答問題
團隊為找出超標未管農地,發展出「距離指標」,計算農試所超標網格與最接近公告列管農地污染場址間的距離(d)。團隊以超標網格為中心、200公尺半徑內的範圍作為判準,若無重疊則代表該超標網格疑似沒有被政府管到。由於污染列管場址多為不規則多邊形,故計算距離時取多邊形的重心為準。
另外,團隊還發展出「密度指標」,試圖找出農試所超標網格之熱區。由於農地污染常常是藉由灌溉渠道或水路擴散,造成系統性的污染,故此方法試圖找出超標熱區。計算原理是以農試所所有超標網格中心為圓心,以方圓一公里畫圓,計算範圍內超標採樣點個數,越多反映該圓超標網格密度越大。
在這次的計畫中,我們用較為寬鬆的標準定義「超標熱區」,只要範圍包含的超標網格大於1個(即還有其他超標點),就算在超標熱區中。
我們也已經開發了資料分析介面,讀者可以自行嘗試探索資料。例如在「地圖與數據分頁中」,拉選更高的網格密度定義為熱區,或用更遠的距離去定義重疊與否,藉此觀察篩選結果。
分析結果
若將農試所經計算後得出的超標網格資料在地圖上顯示,我們發現大多集中在桃園、彰化、高雄、屏東一帶。環保署公告列管污染場址亦多集中在桃園、彰化地區。