Data for Social Good Data for Social Good
  • 最新消息
    • 佈告欄
    • 熱門活動
  • 資料英雄計畫
    • 團隊募集
    • 專案成果
    • 資料英雄榜
  • 媒體報導
  • 聯絡我們
  • 最新消息
    • 佈告欄
    • 熱門活動
  • 資料英雄計畫
    • 團隊募集
    • 專案成果
    • 資料英雄榜
  • 媒體報導
  • 聯絡我們

Month: 三月 2017

  • Home
  • 2017 Archives
  • 三月 Archives
29 三月

[心得] 用數據來溫暖社會,一場家暴防治的奇幻旅程

  • Posted by Chen Ya-Yun
  • Categories 紀錄
  • Comments 0 comment

大家好,我是雅韵。
我想分享參與「公私協力 資料治理防家暴」計畫的心得,因為從中我得到太多太多了!
來自心理學與腦科學研究領域的我,清楚地知道創傷經驗對受害個案及周圍親友的影響。因此,藉由資料分析的能力參與第一線社工人員的工作,將是我能以所學,降低家暴事件對於個人、家庭與社會傷害的一個機會。
首先感謝「臺北市家庭暴力暨性侵害防治中心」決定公私協力,參加「D4SG 資料英雄計畫」,讓我有機會貢獻一己之力於如此重要的社會議題上。我參與的資料科學團隊中,有夥伴來自金融業、也有來自科技業,有人因為小燈泡事件而決心親身投入社會議題,也有人希望用看似冰冷的程式語言來溫暖社會。在這樣子綜合的團隊裡,我看到了跨領域合作的優勢,每個人貢獻所長、每個人也以不同的觀點切入問題,讓資料能夠被更全面的詮釋以及更快的完成分析。
「資料治理防家暴」計畫在大家利用下班時間投入於社會議題的熱情當中有了初步卻也重要的成果。在三個多月的團隊合作期間,社工師的寶貴經驗、國內外的相關文獻回顧以及個案管理的工作記錄,包括數據與文字資料,讓我們經歷了一場數據、理論與實務經驗結合的奇幻旅程。這趟旅程,順利產出兩個成果,分別是:「家暴通報地圖」與「親密關係暴力風險指標」的建立。
「家暴通報地圖」讓我們了解鄰里的收入高低、職業種類、社區是老舊或新興並不能區別該地區通報數量的高低。怎樣的社會組成會使通報數量上升?可能是家暴數量本身就很多,當然,也可能是個案或者鄰里親友積極守望相助的結果。這部分是數字解釋不了的現場實務面,需要仰賴後續社工人員與里長乃至相關機關的夥伴努力,帶著這份數據、這些家暴通報地圖,深入社區本身,與里長、社區居民共同討論與分享,同時,讓社區中的每位成員都成為改變社區,創造友善和平社區的重要角色。
另一個成果是「親密關係暴力風險指標」,也就是建立了「親密關係暴力再發生的危機指數」,建立這份指標的目的在於希望能讓家防中心及早介入親密關係暴力的處理,促使重複發生親密關係暴力的風險有效下降。受到重複性家暴的個案,會有生理與心理健康方面的問題,此類案件不僅是社工與醫療人員的負擔,其家庭成員日後複製家暴經驗的可能性也會倍增,部分的人出現攻擊傾向,部分的人會成為新家庭的新受害者。我們利用橫斷一年的親密關係家暴紀錄資料來預測個案未來重複被家暴或被通報家暴的風險,若個案第一次被通報時,社工人員就能了解個案屬於高再受害風險,便能更積極有效的策劃協助方案,防止下一次的不幸發生。(目前此模型已完成,進入驗證階段中…)
這個資料治理計畫,其實大家投入最多心力的,並非在於數據統計的部分,反而是在資料分析結果的詮釋。因為在這次的資料當中看到了「主觀經驗」與「客觀真實」之間不小的差距,當看到資料分析的結果與主觀經驗、甚至與過去國內外文獻不一致時,所有人其實都嚇了一跳。但也感謝這個嚇一跳,家防中心決定改變過去一貫的防治宣導政策,改以鄰里差異化取代,以及讓實務經驗與數據科學在未來的工作中並行。而我們資料團隊也從中學了一大課,結果不一致時,我們不斷檢查數據是不是放錯了,是不是用了不恰當的演算法?等等。團隊成員的資料分析能力也因為透過與來自 「智庫驅動」 的資料分析專家一同實戰,有了實質進步。
聽聞最近這些資料分析成果的相關新聞引起了社會波瀾,謝謝大家願意關注在這個議題上。「公私協力 資料治理防家暴」計畫目前看似告一小段落,但其實這只是一小步而已,第一,這些看似固定的地圖是「互動式地圖」,目前只有一年的資料,家防中心預計將往後各年的資料也以同樣的方式整理、呈現,讓參與防治的上下機關以及社會大眾能夠看到社區中每個成員對於家暴防治的努力,需要協助的家庭主動尋求協助、而平常忙於各自工作的鄰居們也有了活絡社區的氣氛的機會,相信一年兩年過去,看著自己的社區的家暴數量因大家努力而逐漸減少,或是因為大家守望相助而使得以往看不見的家暴黑數能夠有機會浮上檯面,都會是一個非常感動的成果,也會是一個向他人證明自己住在好社區的客觀證據。第二為了使資料結果能有更恰當的詮釋,未來還需要仰賴里長、各界專家、第一線的社工人員與家暴防治相關的公私立機構,進行更近一步的研究與實地訪查。敏感性資料去識別化之後,期待各界有興趣的夥伴,無論是學術或是相關防治機構,都可以利用這份資料進行更廣泛的應用或是更深入的研究探討。
謝謝大家,通過這個計畫,我更確信有效利用資料絕對能推進社會福祉。感謝能有這個機會參與如此有意義的計畫!讓我們一同使世界更加美好!
延伸閱讀

「面對家暴 只能被動挨打嗎?」公部門大挑戰 大數據這樣防家暴 (風傳媒 2017/03/06)
觀點投書:一張家暴風險地圖說了什麼?科學分析和社區防治還有話要說 (風傳媒 2017/03/09)
資料治理讓社區對家暴「心裡有數」公部門與社區組織公私協力防暴向下紮根 (臺北市政府社會局 2017/03/15)
北市繪家暴地圖 盼降低再通報個案 (中時電子報 2017/03/15)

Read More
13 三月

預測模型的準確率 99.9% 就夠了嗎?錯,鍵盤打火英雄告訴你該怎麼辦!

  • Posted by Guo Guan Ling
  • Categories 紀錄
  • Comments 0 comment

如何有效運用人力與資源來宣導火災預防觀念,進而降低火災發生率,一直是高雄市消防局終極目標。
有別於火災風險地圖 1.0,消防局冀望能從建築物角度出發,彙整住戶與周遭環境資料以建構出建物火災風險預測模型。經過多次討論,決議以各式建物混雜的鳳山區為例,希望用機器學習方式得到預測模型。資料英雄用8萬筆資料訓練 DNN 模型,哇!準確率幾乎百分之百,這一切都太完美了,對嗎?

錯!建物有上萬棟,但實際在104到105年間發生過火災數量卻不到一百,像這種非均衡的二分類數據 (1:800) 實務上很常見,高準確率的模型往往只預測一種類別,這就是 Accuracy Paradox!
遇到數據失衡時,我們能怎麼辦?
1. 擴大時間範圍,蒐集更多歷年火災資料
新增多筆歷年火災資料,並重複抽樣出比例均衡的小樣本來訓練模型,來避免數據失衡的問題。
2. 用不同抽樣方法來抽取樣本
下面條列一些經驗法則:
a. 在母數少的類別中隨機複製資料
b. 在母數多的類別中隨機刪除資料
c. 考慮隨機和非隨機的抽樣方法,如分層
d. 考慮不同比例的抽樣方式
3. 嘗試不同類型的演算法
試試其他演算法,如決策樹算法、CART 以及隨機森林等等,或許其他演算法能有效分類。
4. 調整權重因子
確定只能使用的演算法是適當的且無法採樣時,可藉由調整權重或是增加懲罰因子,來平衡數據類別。
5. 嘗試用不同角度或創新想法
考慮是否可以將其拆分為類似的小問題,如把大數據分成許多小類別數據。
許多方法都可嘗試,這次,資料英雄該如何快速找到最佳的方法來破解難題呢?敬請期待。

Read More

分類

  • 佈告欄
  • 紀錄
  • 資料英雄計畫

近期文章

  • D4SG 333短期方案-錄取公告
  • [提案招募] D4SG 333 短期方案
  • D4SG Fellowship 冬季班暫停公告
  • 智慧防洪,韌性城市
  • 空汙追追追

標籤

OCHA workshop 便民看板 兒少保護 家暴預警 就業輔導 急轉診 排班管理 文字雲 水土保持 法律扶助 火災風險 畜牧廢水 社會救助 空汙 結巴 緊急醫療優化 脫離貧窮 資料工作坊 資料英雄計畫 農地種電 開放資料 防洪 隨機森林 韌性城市 高風險家庭

彙整

  • 2020 年 十月
  • 2020 年 五月
  • 2019 年 十二月
  • 2019 年 八月
  • 2019 年 二月
  • 2019 年 一月
  • 2018 年 十二月
  • 2018 年 十一月
  • 2018 年 七月
  • 2018 年 六月
  • 2018 年 二月
  • 2018 年 一月
  • 2017 年 十二月
  • 2017 年 六月
  • 2017 年 五月
  • 2017 年 三月
  • 2017 年 二月
  • 2017 年 一月
  • 2016 年 十二月
  • 2016 年 十一月
  • 2016 年 八月
  • 2016 年 七月
  • 2016 年 六月
  • 2016 年 一月

D4SG資料英雄計畫 ©2014-2019