高風險危機警示模組
Fellows:林峰生、林廷州、林恆宇、胡馨勻、葉憲周、郭泰竹、郭家諭
Mentor:謝宗震
Project Manager:李苡菲
Project Partner:新北市政府社會局
摘要
新北市高風險中心由100年執行至105年,新北市高風險兒少通報案件累計達66,397案件(平均每年約1萬件),考量此類高風險家庭常面臨多元化之風險,為能協助網絡中的工作人員對於家庭的危機程度有更精確的掌握,可於處理眾多高風險案件時,導入更適宜之資源與服務模式協助,使此類家庭免於再次發生高風險危機或進而演變成更嚴重的兒童虐待案件,如果無法提早找出類似嚴重的家庭,極有可能會發生更嚴重的事件。因此,找出容易重複被通報的「回頭客」以及預測個案是否有機會「進入家暴防治中心」(以下簡稱家防),可望幫助解決以上時間有限但人力不足,並適應多元化風險的問題。
背景說明
新北市為全台灣最大縣市、六都之首,人口數高達400萬人,涵蓋29個行政區,擁有豐富的自然資源及科技進步的城市,但在光鮮亮麗的外表下,社會邊緣的角落正在發生許多鮮為人知的問題,而這些問題可能就發生在你我周遭,關係著社會安全以及未來主人翁的幸福。
新北市高風險家庭服務管理中心(以下簡稱:高風險中心)成立於民國一百年,主要負責進行高風險家庭案件之分級管派與服務狀況追蹤,目的是為了提前預防家庭暴力以及兒童受虐等問題發生,民國101年至105年新北市高風險兒少通報案件累計達66,397件(平均每年約一萬件),等於每一個小時就要處理一件高風險家庭的個案,且是24小時待命、全年無休。
有鑑於此,由D4SG資料英雄計畫組織了一支擁有社工、統計、資工、資料科學以及專案管理背景的團隊,透過高風險中心十萬多筆的資料,經由大數據分析,希望能夠協助高風險中心對於家庭的危機程度有更精確的掌握,可於處理眾多高風險案件時,導入更適宜之資源與服務模式協助,避免再次發生高風險危機或進而演變成更嚴重的兒童虐待案件。
專案目標
新北市是個有著多元文化與族群聚集的城市,約有百分之七十是外移人口,但隨著家庭結構的改變、傳統自掃門前雪觀念的根深柢固。為了要讓兒少能獲得更完善的照護,新北市高風險家庭中心建立一個完善的兒少安全保護網,以普及宣導、預防支持、保護服務三個層級,希望能做出完善預防的工作,避免兒虐事件的發生。
新北市高風險兒少通報案件量平均每年約有10,000件,每人每年約需處理1,666件案件。因此,在如此龐大的案件量中如何更準確的評估每個案件的輕重緩急並且妥善安排人力資源做出最適當的處理著實重要。「預防勝於治療」基於以上種種原因,我們希望可以建立一個良好的預測機制,先找出容易重複進案的「回頭客」以及個案是否有很大風險會「進入家防中心」,再藉由這些因子建立出預測模型,幫助高風險中心人員往後對於這些高風險家庭能進行主動且預先的關懷訪視,對這些家庭的危機程度有更精確的掌握,在處理高風險案件時,導入更適宜之資源與服務模式協助,讓此類家庭免於再度發生高風險危機或進而演變成更嚴重的兒童虐待案件。
資料集介紹
本專案所使用的資料取自於「新北市高風險家庭整合型安全網資訊管理系統」,將資料個案之身分證加密後,整合成單一資料總表,取得近147萬筆原始資料,包含每一個案之重複案件以及個案評估量表、通報表、派案評估表等資訊。重點資訊條列如下:
- 該案兒少人口變項之資料,包含如:性別、年齡、居住區域、國籍等
- 每通報案件於通報時經由通報人勾選之風險指標
- 每通報案件於社工初篩派案時所評估勾選之兒少所遭遇的家庭問題情形 (如經濟問題、就學問題、父母親藥癮問題等)
- 各網絡局處受理案件後對於案件危機程度的評估資料(以紅黃綠燈進行危機程度區分)
- 各網絡局處每月對於案件之服務紀錄
- 資料勾機外部資料情形
「新北市高風險家庭整合型安全網資訊管理系統」橫跨10個局處 (民政、教育、社會、衛生、工務、勞工、警政、消防、原民、資訊中心)與 1,300個窗口。亦勾稽相關外部資料,包含新北市福利補助系統、教育局兒少學籍系統以及兒童虐待保護案件資訊系統,是一個多元整合管理系統。
執行方式
由於工作期程有三個月,因此我們將工作切分成兩段,第一階段包含流程理解、資料盤點、預期成果;第二階段是進行資料清理、資料分析並且撰寫成果報告。
由於在此案之前顧問已有台北市家防專案的經驗,所以對於社工的組織較為了解,也較清楚資料專案的困難之處。最初的一個多月,主要的工作在於理解高風險中心的工作流程,配合資料盤點的結果,利用資料驅動的討論方式收斂到兩個專案目標,首先是避免案件無法結案不斷的重複開案,又或者是個案落入更危險的兒少保護體系 (家暴)。
接下來的一個月主要工作是制定資料分析策略,首先進行資料處理,將資訊系統拉出來的資料轉換成可供機器學習模型所使用的資料大表 (data.frame),其中最困難的工作在於如何從凌亂的資料表中,找出高風險中心處理的個案屬於哪個家庭,以及如何做跨表格的合併。接下來是做資料探索,找出與落入家暴問題案件相關的特徵以及派案回頭客的相關特徵。統整這些資料探索結果後本組使用邏輯斯迴歸、支持向量機、隨機森林等演算法針對家暴個案、回頭客個案進行預測,最終選擇準確度高達八成的隨機森林模型作為成果。
資料探索
在龐大的資料海中,透過了解社會安全因素(包括經濟因素、教育因素、家庭狀況等),找出正確的指標並排除多餘的噪音(包含遺漏值、極端值等),最終建立出資料總表。
建立完資料總表後進行探索式分析,執行方式是將團隊成員分為四大組別,分別為新北市地圖熱點呈現小組、新北市行政區家防狀況調查小組、指標關聯性探索小組、回頭客分析小組,以下分別介紹各組負責細節。
(一) 新北市地圖熱點呈現小組
在通報資料中,將每個通報的地點位置的地址做經緯度的轉換,並透過資料視覺化的方式,結合 Google Map,將通報發生的地區畫上熱點圖。透過通報熱點圖,可了解新北市各地區通報狀況,並提早做預防。除了通報熱點圖以外,同時也製作派案熱點圖、家防熱點圖,透過比對了解每一地區發生事件之密集程度。
(二) 新北市各社福中心家防狀況小組
透過進入家防的列表,可得知哪些個案的身分證是進入家防的,並且與特徵資料欄位結合,得出進入家防的個案之地點位置,在此階段我們利用新北市各個社福中心做轉換,並將各個行政區通報後進入家防的比例透過長條圖呈現
(三) 指標關聯性小組
透過整理完成後的資料集,具有統計背景的成員對各個指標進行統計方法的檢定,並找出哪些因素是容易影響個案進入家防,例如:單親家庭、貧困、就學狀況不佳…等,同時也能排除較不相干的因素,透過了解各指標的影響狀況,有利於下一階段的預測模型建立,提高模型準確度。
(四) 回頭客分析小組
在通報資料以及派案資料當中,可以透過觀察案主之編號之否重複,找到重複通報以及重複派案的「回頭客」,利用通報時間的間隔,更可以發現是否處理時間較長的個案更容易進入家防。因此,找出回頭客的輪廓對於高風險中心在第一次接觸到個案時的判斷十分有幫助,也容易歸納出需要重點加強的族群。
模型建立
(一) 預測個案是否會重複被通報
在預測個案是否會重複被通報時,同樣也需要蒐集在指標關聯性中表現特別顯著的因子,此外,在高風險中心的資料表中,存在著「風險燈號」的資料,也就是案件狀態燈,預期對於預測個案的通報狀態會有顯著的影響,因此可能朝著整合燈號以及通報表的特徵資料,來建立預測個案是否會被重複通報之模型。
本團隊最終提出一個被通報高風險個案是否為回頭客的風險預測模型,其準確度為78%、召回率為60%。
(二) 預測個案是否進入家防
每年新北市的高風險案件約有18%會落入家暴,因此若能在案件尚未發展成家暴案之前,先提出警示將產生莫大助益。
在預測個案是否進入家防時,需要蒐集在指標關聯性分析中表現特別顯著的因子,放入模型後,增加對預測的精準度。此外,本團隊認為家防的資料有非常高的可能為不平衡之資料,意即進入家防的個案可能佔的比例偏少,因此也需要透過平衡抽樣的方式,使資料分配平均,才能穩固模型的精準度。預測後的產物除了模型表現的精準度外,還會產生變數重要程度表,呈現哪些因子對於模型的重要程度是高的。
本團隊最終提出一個高風險個案是否會落入家暴的風險預測模型,其召回率達六成五,也就是說有機會從這18%的案件中預先找出其中的65%。
在探討高風險家庭是否會落入兒少暴力問題時,本組發現幾個關聯性指標,包含:
- 就學情況
- 家庭指標
- 重複被派案
- 案件解決時間的長短
- 案件警示燈號的變化
- 家庭關係的紊亂
- 負擔家計者死亡
- 非自願性失業
執行時程
總時長:3.5個月
- 解決問題方向探索:2週
- 了解問題背後行政流程、高風險相關資料閱讀:4週
- 清理資料:1.5個月
- 探索性分析、建立模型、視覺化:1個月
提案單位回饋
從事社會服務工作者在這三個月中經歷了一場截然不同的體驗,了解到六萬件個案的相同與不同。僅管每一個高風險個案都是獨一無二的,但是透過資料分析,卻仍能從眾多個案中梳理出一些一致性的脈絡以及有效的指標,這是資料分析與社會服務跨域合作的難能可貴之處。
在國內外各類型關鍵場合(政府、家暴防治、產業、公民社群等)分享目前成果,持續累積之實務經驗,開發延伸分析模組,進而擴大推廣「家暴防治分析系統」之應用。
專案成果同樣受到主管單位新北市政府社會張錦麗局長的大力讚賞,接下來將會以此結果進行的實務驗證,期待將資料分析模型導入業務操作的過程中產生正向影響力。
4 Comments
您好
我是看了這篇報導,以及您的分析結果
https://youtu.be/WeEq5xU0u1s
讓我對這題目以及資料深感興趣
想請教您我們可以透過什麼申請方式獲得這批資料?是向社會局申請嗎?
謝謝
是的,若有資料研究或使用需求,請洽新北市社會局。
是的,請洽社會局詢問。