Data for Social Good Data for Social Good
  • 最新消息
    • 佈告欄
    • 熱門活動
  • 資料英雄計畫
    • 團隊募集
    • 專案成果
    • 資料英雄榜
  • 媒體報導
  • 聯絡我們
  • 最新消息
    • 佈告欄
    • 熱門活動
  • 資料英雄計畫
    • 團隊募集
    • 專案成果
    • 資料英雄榜
  • 媒體報導
  • 聯絡我們

資料英雄計畫

  • Home
  • 資料英雄計畫
29 三月

[心得] 用數據來溫暖社會,一場家暴防治的奇幻旅程

  • Posted by Chen Ya-Yun
  • Categories 紀錄
  • Comments 0 comment

大家好,我是雅韵。
我想分享參與「公私協力 資料治理防家暴」計畫的心得,因為從中我得到太多太多了!
來自心理學與腦科學研究領域的我,清楚地知道創傷經驗對受害個案及周圍親友的影響。因此,藉由資料分析的能力參與第一線社工人員的工作,將是我能以所學,降低家暴事件對於個人、家庭與社會傷害的一個機會。
首先感謝「臺北市家庭暴力暨性侵害防治中心」決定公私協力,參加「D4SG 資料英雄計畫」,讓我有機會貢獻一己之力於如此重要的社會議題上。我參與的資料科學團隊中,有夥伴來自金融業、也有來自科技業,有人因為小燈泡事件而決心親身投入社會議題,也有人希望用看似冰冷的程式語言來溫暖社會。在這樣子綜合的團隊裡,我看到了跨領域合作的優勢,每個人貢獻所長、每個人也以不同的觀點切入問題,讓資料能夠被更全面的詮釋以及更快的完成分析。
「資料治理防家暴」計畫在大家利用下班時間投入於社會議題的熱情當中有了初步卻也重要的成果。在三個多月的團隊合作期間,社工師的寶貴經驗、國內外的相關文獻回顧以及個案管理的工作記錄,包括數據與文字資料,讓我們經歷了一場數據、理論與實務經驗結合的奇幻旅程。這趟旅程,順利產出兩個成果,分別是:「家暴通報地圖」與「親密關係暴力風險指標」的建立。
「家暴通報地圖」讓我們了解鄰里的收入高低、職業種類、社區是老舊或新興並不能區別該地區通報數量的高低。怎樣的社會組成會使通報數量上升?可能是家暴數量本身就很多,當然,也可能是個案或者鄰里親友積極守望相助的結果。這部分是數字解釋不了的現場實務面,需要仰賴後續社工人員與里長乃至相關機關的夥伴努力,帶著這份數據、這些家暴通報地圖,深入社區本身,與里長、社區居民共同討論與分享,同時,讓社區中的每位成員都成為改變社區,創造友善和平社區的重要角色。
另一個成果是「親密關係暴力風險指標」,也就是建立了「親密關係暴力再發生的危機指數」,建立這份指標的目的在於希望能讓家防中心及早介入親密關係暴力的處理,促使重複發生親密關係暴力的風險有效下降。受到重複性家暴的個案,會有生理與心理健康方面的問題,此類案件不僅是社工與醫療人員的負擔,其家庭成員日後複製家暴經驗的可能性也會倍增,部分的人出現攻擊傾向,部分的人會成為新家庭的新受害者。我們利用橫斷一年的親密關係家暴紀錄資料來預測個案未來重複被家暴或被通報家暴的風險,若個案第一次被通報時,社工人員就能了解個案屬於高再受害風險,便能更積極有效的策劃協助方案,防止下一次的不幸發生。(目前此模型已完成,進入驗證階段中…)
這個資料治理計畫,其實大家投入最多心力的,並非在於數據統計的部分,反而是在資料分析結果的詮釋。因為在這次的資料當中看到了「主觀經驗」與「客觀真實」之間不小的差距,當看到資料分析的結果與主觀經驗、甚至與過去國內外文獻不一致時,所有人其實都嚇了一跳。但也感謝這個嚇一跳,家防中心決定改變過去一貫的防治宣導政策,改以鄰里差異化取代,以及讓實務經驗與數據科學在未來的工作中並行。而我們資料團隊也從中學了一大課,結果不一致時,我們不斷檢查數據是不是放錯了,是不是用了不恰當的演算法?等等。團隊成員的資料分析能力也因為透過與來自 「智庫驅動」 的資料分析專家一同實戰,有了實質進步。
聽聞最近這些資料分析成果的相關新聞引起了社會波瀾,謝謝大家願意關注在這個議題上。「公私協力 資料治理防家暴」計畫目前看似告一小段落,但其實這只是一小步而已,第一,這些看似固定的地圖是「互動式地圖」,目前只有一年的資料,家防中心預計將往後各年的資料也以同樣的方式整理、呈現,讓參與防治的上下機關以及社會大眾能夠看到社區中每個成員對於家暴防治的努力,需要協助的家庭主動尋求協助、而平常忙於各自工作的鄰居們也有了活絡社區的氣氛的機會,相信一年兩年過去,看著自己的社區的家暴數量因大家努力而逐漸減少,或是因為大家守望相助而使得以往看不見的家暴黑數能夠有機會浮上檯面,都會是一個非常感動的成果,也會是一個向他人證明自己住在好社區的客觀證據。第二為了使資料結果能有更恰當的詮釋,未來還需要仰賴里長、各界專家、第一線的社工人員與家暴防治相關的公私立機構,進行更近一步的研究與實地訪查。敏感性資料去識別化之後,期待各界有興趣的夥伴,無論是學術或是相關防治機構,都可以利用這份資料進行更廣泛的應用或是更深入的研究探討。
謝謝大家,通過這個計畫,我更確信有效利用資料絕對能推進社會福祉。感謝能有這個機會參與如此有意義的計畫!讓我們一同使世界更加美好!
延伸閱讀

「面對家暴 只能被動挨打嗎?」公部門大挑戰 大數據這樣防家暴 (風傳媒 2017/03/06)
觀點投書:一張家暴風險地圖說了什麼?科學分析和社區防治還有話要說 (風傳媒 2017/03/09)
資料治理讓社區對家暴「心裡有數」公部門與社區組織公私協力防暴向下紮根 (臺北市政府社會局 2017/03/15)
北市繪家暴地圖 盼降低再通報個案 (中時電子報 2017/03/15)

Read More
13 三月

預測模型的準確率 99.9% 就夠了嗎?錯,鍵盤打火英雄告訴你該怎麼辦!

  • Posted by Guo Guan Ling
  • Categories 紀錄
  • Comments 0 comment

如何有效運用人力與資源來宣導火災預防觀念,進而降低火災發生率,一直是高雄市消防局終極目標。
有別於火災風險地圖 1.0,消防局冀望能從建築物角度出發,彙整住戶與周遭環境資料以建構出建物火災風險預測模型。經過多次討論,決議以各式建物混雜的鳳山區為例,希望用機器學習方式得到預測模型。資料英雄用8萬筆資料訓練 DNN 模型,哇!準確率幾乎百分之百,這一切都太完美了,對嗎?

錯!建物有上萬棟,但實際在104到105年間發生過火災數量卻不到一百,像這種非均衡的二分類數據 (1:800) 實務上很常見,高準確率的模型往往只預測一種類別,這就是 Accuracy Paradox!
遇到數據失衡時,我們能怎麼辦?
1. 擴大時間範圍,蒐集更多歷年火災資料
新增多筆歷年火災資料,並重複抽樣出比例均衡的小樣本來訓練模型,來避免數據失衡的問題。
2. 用不同抽樣方法來抽取樣本
下面條列一些經驗法則:
a. 在母數少的類別中隨機複製資料
b. 在母數多的類別中隨機刪除資料
c. 考慮隨機和非隨機的抽樣方法,如分層
d. 考慮不同比例的抽樣方式
3. 嘗試不同類型的演算法
試試其他演算法,如決策樹算法、CART 以及隨機森林等等,或許其他演算法能有效分類。
4. 調整權重因子
確定只能使用的演算法是適當的且無法採樣時,可藉由調整權重或是增加懲罰因子,來平衡數據類別。
5. 嘗試用不同角度或創新想法
考慮是否可以將其拆分為類似的小問題,如把大數據分成許多小類別數據。
許多方法都可嘗試,這次,資料英雄該如何快速找到最佳的方法來破解難題呢?敬請期待。

Read More
18 二月

右手寫 Code,左手 CPR 的資料英雄

  • Posted by ck
  • Categories 紀錄, 資料英雄計畫
  • Comments 0 comment

「到院前心肺休止」(Out-of-Hospital Cardiac Arrest, OHCA) 佔救護車出勤比例雖低,但是死亡率卻頗高,因此備受緊急救護與醫療界的重視。
高雄市政府衛生局想要分析歷年的 OHCA 資料,改善下列問題:

瞭解 OHCA 發生風險因子與地理分布,以便優化資源配置
分析「旁觀者介入」程度與有效性,調整相關政策規劃與執行
提高存活機率

除了文獻上經常被探討的危險因子,衛生局也想瞭解是否還有尚未被研究的在地性因子。

參與本 D4SG 專案的資料英雄們,技能專長琳瑯滿目,從程式開發、統計分析、資料探勘到系統開發,有人是醫學系學生,有人是消防隊緊急救護員、還有醫院急診部的醫師。
透過剖析真實的在地資料,期望能針對上述三個關鍵問題,找到改善現況的答案!

Read More
03 一月

家暴案件風險與預警管理系統

  • Posted by Chen Ya-Yun
  • Categories 資料英雄計畫
  • Comments 3 comments

Fellows:王郁秀、王景弘、陳雅韵、潘柏任、謝依珊、李曜容、柯景泰
Mentor:謝宗震、劉嘉凱
Project Manager:張盈宜
Project Partner:台北市家庭暴力暨性侵害防治中心

本專案與臺北市家庭暴力暨性侵害防治中心(簡稱家防中心)合作,以家庭暴力案件預警與風險管理為目標,希望達到「降低被害人再受暴風險」及「提高社工服務效能」兩個主要目的。
我們以現有資料發現能夠從「區域」及「個案」兩觀點切入問題。透過區域資料建立家暴案件特徵地圖,能夠達到社區預防作用,減少盲目的宣導政策,另外以個案特徵(因案件種類及資料完整度,我們僅限縮在親密關係暴力),嘗試建立預測模型,此模型能作為預警系統,新進個案若呈現高再受暴特徵,則社工能早期預防,防止多次家暴發生,避免受害者身心狀況惡化以及過多的人力資源投入。

以下我們將分別描述此兩觀點的詳細作業流程。
[地圖組]

以「區域」觀點探索家暴案件
「村(里)」為中華民國之第四級行政區劃名稱;亦是最基層之地方自治單位,因此多數政府單位資料上的建置皆是以此做劃分,家防中心的資料亦有此特性。故我們針對家庭暴力案件建置以「地點 (村里)」為主體的通報熱點警示指標,透過有效評估工具篩選個案件類型之高危機區域,希望能減少與里長溝通的資訊不對稱,共同推動社區意識防護家暴發生,加上外部單位如:學校、醫院、警察等通力合作責任也是依據區域分工,此時家暴區里風險地圖正式成為相互共通語言,大家需要共同知道處理問題之資源分配的優次緩急,才能一齊有效率的解決台北市家暴問題,進而將此機制推廣至全台灣,讓台灣最美的風景依然是人。

方法 (Methods)

Google 地圖API

讓填答地址先轉經緯度
再以經緯度判斷轉成里
判斷失敗的地址以人眼辨識修正

資料清理ETL

移除重複CA夾
去除非台北市的案件
去除沒有地址者
計算欄位:各區、里by案種的男女比重、年齡比重,及總家暴案件數、案種排名百分比、低收或者障礙排名百分比

Read More
06 十二月

火災火警報案資料探勘

  • Posted by 許 筱翎
  • Categories 資料英雄計畫
  • Comments 2 comments

Fellows:曾凱聲、張凱鈞、宋培源、王宜婷、許筱翎、韓鈺瑩
Mentor:謝宗震、劉嘉凱
Project Manager:王蕙盈
Project Partner:高雄市政府消防局

對抗火災的最佳策略是採取預防性攻擊,防患於未然。若用資料科學的語言描述,就是定義問題、資料盤點與清理、分析建模、預測、決策支援。
以高雄市為例,每年的火災案件不到一百件,但是消防隊員還是忙不完。有一個重要的原因是,雖然每年「火災」數量不多,但是「火警」的案件卻是數以千計。火警和火災,差別只在一線間。家中瓦斯爐燒開水未關,鄰居報案後,消防隊來得及破門而入關掉瓦斯,就只是火警;來不及關掉,就可能演變為造成生命與財物損失的火災了。而不論火災或火警,其危險因子(例如起火原因、建築物特性、人口特徵等等)可能都是共通的,若能評估火警風險,或許就等同建立了火災風險模型。這即是 D4SG 資料英雄計畫「火災風險地圖」專案正在設法解決的公共問題。
我們是一群「用資料力做公益」的資料英雄,很榮幸與高雄市政府消防局合作,利用週末和晚上,共同分析過去數年的消防案件,從無到有,開始打造台灣第一個「資料科學,打火救人」的實戰經驗。
高雄,加油!
資料來源

1. 高雄市政府消防局火災紀錄資料
2. 高雄市政府消防局火災分析表
3. 高雄市政府消防局火警出動人車數
4. 高雄市政府消防局各大隊補助安裝住宅用火災警報器場所清冊
5. 高雄市政府社會局資料(低收入戶、獨居長者、身心障礙)
6. 高雄市政府稅捐處建築物資料
問題解決

一、人力配置
問題
如何使人員排班更有效率?(每個分隊在什麼時段可精簡人力,什麼時段須要多加派人力?)
高雄市政府消防局每個隊員的值班待命時間為早上8點到隔天9點,共25小時。
若能從歷年的火災紀錄看出忙碌的時段差異,在較不忙碌的時段安排較少的人力,在滿足基本戰力與鄰近分隊即時支援的前提下,不必讓每個隊員皆值勤25小時的時間,能夠讓隊員有更多時間休息,避免不必要的人為疏失,並作更有效率之人力配置。
分析
1. 以派遣次數的角度出發:
分隊的派遣次數越多代表該時段火災火警發生越頻繁,消防人員出動的次數越多。以線圖呈現分隊忙碌的時段。使用分析欄位:案件時間、派遣分隊、案件狀態。

Read More
02 十一月

農地種電空間變遷

  • Posted by johnson
  • Categories 資料英雄計畫
  • Comments 0 comment

Fellows:陳晉暉、陳均豪、林家慶、周立筠、吳彥霖、楊承翰
Mentor:謝宗震、劉嘉凱
Project Manager:鄧凱元
Project Partner:天下雜誌、國家太空中心

農電組製作了一個網頁陳述完整專案報告 (https://d4sg-solar.github.io/)
 
以下整理天下雜誌呂國禎副總主筆在10/26成果發表會的報告內容
問題定義
農地種電的利益與衝突
電業法將台灣電力結構入法,50%天然氣、30%燃煤、20%綠電成為法律規定。太陽能光電目標20GW(核四*7),目前總裝置容量0.95GW,未來將種20倍的太陽能
種那裡? 農地上,那台灣有多少農地?
農委會統計的台灣農地約81萬公頃,主計處調查台灣農地(含特定農業區、一般農業區)實際耕種剩44.6萬公頃
參考資料

資料英雄計畫調查結果
國家能源政策綱領 (電業法)
行政院主計處,臺灣農地統計
農委會,嚴重地層下陷地區內不利耕作得設置綠能設施之農業用地範圍
環保數,污染農地調查工作
台電資訊揭露

分析成果

衛星照片定位雲林縣農地上的太陽能面光電板面積、數量
嚴重地層下陷地區
受污染農地
農委會農業收入調查
田野實地調查

成果發現

雲林縣太陽能光電板種電位置與污染農地並無正相關,太陽能板未種在受汙染農地上
雲林縣太陽能板種電與嚴重地層下陷地區呈現正相關,光電板集中於高鐵通過沿線鄉鎮

Read More
01 十一月

D4SG資料英雄計畫#2 (2017冬) 現正招募中!

  • Posted by johnson
  • Categories 佈告欄, 紀錄
  • Comments 0 comment

《D4SG 資料英雄計畫》是一群相信資料驅動的公共服務能夠促進社會進步的社會企業、學研機構、非營利組織共同發起。
2015 年末,在參加與辦過多場資料科學活動後,我們體會到工作坊與黑客松是極佳的概念測試場域,然而一個資料科學解決方案要能夠完備、可複製仍需要一段時間的用心耕耘。D4SG 與公共服務性組織合作,選擇兼具高度社會影響力與再利用性的資料科學專案,並媒合民間熱血的資料英雄,利用三個月的工作時間共同完成。
我們在 2016 年協同六個公共服務性機構,聚集了超過25位來自民間的資料英雄,產出兩期共五組關於組織營運優化、危機案件預警、環境政策倡議上的在地案例。

現在,2017 年的資料英雄計畫正式展開,我們強烈募集「提案單位」與「資料英雄」,即日起受理報名2016 年 11-12 月招募與審查時間,正式計畫將於明年 2017 年 01-03 月開始執行。請有興趣的公益組織與資料科學愛好者到團隊募集頁面瞭解詳細資訊。
想要近距離了解D4SG計畫嗎?不妨參考我們最近的公開講座:

11/08 網路星期二,『資料力,做公益』- 開創公共服務的新契機
11/09 中研院統計所,D4SG資料英雄計畫,資料驅動公共服務的台灣經驗
11/19 泛.知識節,Data for Social Good:資料科學開創公共服務的新契機
11/30 北醫拇山人文講座,如何在大數據時代提升資料力

圖片來源:wesharepics.site

Read More
21 八月

打擊家暴的資料英雄

  • Posted by ck
  • Categories 紀錄
  • Comments 0 comment

「我是因為小燈泡事件而選擇加入家暴防治的資料英雄專案。」這是依珊在D4SG資料英雄計畫期中聚會的開場白。

依珊和一群原本不認識的人,因為對於家暴防治懷有相同熱誠而相遇,在每週三晚上七點,往往連晚餐都來不及吃,就匆匆趕赴臺北市家庭暴力暨性侵害防治中心,和該中心的工作人員進行資料分析的工作會議。

這群資料英雄包括能在談笑間完成複雜資料格式轉換與清洗的東尼和Brian、不斷提出關鍵問題的依珊和曜容,在超短時間內讀完十幾篇中英文論文的郁秀、沈默寡言埋頭寫程式的阿泰、以及總是一臉嚴肅思考如何建模的雅韵。
他們的共同目標:

建立家暴風險預警管理模型
降低家暴發生率
提高社工服務效能

在家防中心高度專業的工作同仁帶領之下,經過一個多月的努力,他們逐漸認識家庭暴力的種類、成因與個案處理流程,並開始探索第一手的個案處理紀錄資料。

在社會學的領域,對於家暴危險因子的定義通常是質性的,例如「過往受虐經驗」、「關係衝突」或是「居住穩定性」。為了建立統計模型,資料英雄們持續和社工師進行困難的對話,共同嘗試將這些質性指標轉換為可量化的指標。

在未來的一個月,他們希望能協助家防中心將個案資料整理乾淨,繪製家暴熱點地圖與資訊看板,並初步建置家暴預警分析模型。
加油!
>> 原文取自:DSP智庫驅動官方部落格

Read More
16 七月

資料科學,打火救人

  • Posted by ck
  • Categories 紀錄
  • Comments 0 comment

對抗火災的最佳策略是採取預防性攻擊,防患於未然。
若用資料科學的語言描述,就是定義問題、資料盤點與清理、分析建模、預測、決策支援。
以高雄市為例,每年的火災案件不到一百件,但是消防隊員還是忙不完。

有一個重要的原因是雖然每年「火災」數量不多,但是「火警」的案件卻是數以千計。

火警和火災,差別只在一線間。家中瓦斯爐燒開水未關,鄰居報案後,消防隊來得及破門而入關掉瓦斯,就只是火警;來不及關掉,就可能演變為造成生命與財物損失的火災了。

不論火災或火警,其危險因子(例如起火原因、建築物特性、人口特徵等等)可能都是共通的,若能評估火警風險,或許就等同建立了火災風險模型。
這即是 D4SG 資料英雄計畫「火災風險地圖」專案正在設法解決的公共問題。

我們很榮幸與高雄市政府消防局合作,號召一群「用資料力做公益」的資料英雄,利用週末和晚上,共同分析過去數年的消防案件,從無到有,開始打造台灣第一個「資料科學,打火救人」的實戰經驗。
高雄,加油!
相關資訊:

打火就打火,談大數據?

>> 原文取自:DSP智庫驅動官方部落格

Read More
09 六月

視障按摩小站排班管理

  • Posted by johnson
  • Categories 資料英雄計畫
  • Comments 0 comment

INTRODUCTION
視障朋友從事按摩以外的工作時,常常面臨多重挑戰,其中有視障所產生的就業困境;同時也會面對一般普遍的就業挑戰。在非營利組織 雙連視障關懷基金會,致力爭取視障朋友工作機會下,按摩小站設立於醫院,提供一個明亮開放的空間,在醫療院所明亮開放的環境下,願意嘗試視障按摩的朋友因此變多!視障朋友藉於按摩小站服務,走入社區,走入人群,讓更多人了解視障按摩、了解視障,進而創造對視障朋友更友善的社會環境。
 
PROBLEM
在非營利組織 雙連視障關懷基金會 積極爭取下,目前有10個按摩小站,大多駐點於醫療院所內,提供約100位按摩師穩定就業機會。然而累積了大量紙本的記錄工作表與非細節的電子式文檔,卻因為資料不夠完善,讓這些寶貴資料無處發揮。 另外,按摩小站的排班在管理是一大負擔,人工調動排班靠得是人腦記憶跟有限的資訊,此時就有可能造成師傅之間的誤會。所以如果在有大量可用的資料後,進而發掘資料價值,透過資料分析,產出信服人的資料視覺化呈現。

在有大量可用的資料後,進而發掘資料價值,透過資料分析,產出信服人的資料視覺化呈現。
(Image Credit: http://d4sg.org)
METHOD
根據上述所遇到的問題,我們分為兩個部份:

後台的資料庫管理要如何呈現?資料的欄位要有哪些?
前台要給使用者哪些比較的選擇?以及比較過後給予回饋的呈現?

[1] Azure架設資料庫建設前後端。後台使用 php將功能主要分為「增加工作記錄」與「管理按摩師傅與各小站」。原本 雙連視障關懷基金會 提供的電子檔資料只有儲存一個按摩師傅一天總共的薪水,與紙本上相比未將「指定節數」、「未指定節數」和「來客數」等詳細資料也作記錄。為了統一資料庫名稱,我們共同討論資料欄位名稱,這時我們就將前述也附加上去。
[2] 前台使用 JS 傳使用者選定資料跟後台要資料庫資料的時候,會依據後台接收到的字串,使用 python plotly 做資料視覺化呈現,再透過 api 方式傳回前端。
DEFINE:
asg 指定節數, nasg 未指定節數,

Read More
  • <
  • 1
  • 2

分類

  • 佈告欄
  • 紀錄
  • 資料英雄計畫

近期文章

  • D4SG 333短期方案-錄取公告
  • [提案招募] D4SG 333 短期方案
  • D4SG Fellowship 冬季班暫停公告
  • 智慧防洪,韌性城市
  • 空汙追追追

標籤

OCHA workshop 便民看板 兒少保護 家暴預警 就業輔導 急轉診 排班管理 文字雲 水土保持 法律扶助 火災風險 畜牧廢水 社會救助 空汙 結巴 緊急醫療優化 脫離貧窮 資料工作坊 資料英雄計畫 農地種電 開放資料 防洪 隨機森林 韌性城市 高風險家庭

彙整

  • 2020 年 十月
  • 2020 年 五月
  • 2019 年 十二月
  • 2019 年 八月
  • 2019 年 二月
  • 2019 年 一月
  • 2018 年 十二月
  • 2018 年 十一月
  • 2018 年 七月
  • 2018 年 六月
  • 2018 年 二月
  • 2018 年 一月
  • 2017 年 十二月
  • 2017 年 六月
  • 2017 年 五月
  • 2017 年 三月
  • 2017 年 二月
  • 2017 年 一月
  • 2016 年 十二月
  • 2016 年 十一月
  • 2016 年 八月
  • 2016 年 七月
  • 2016 年 六月
  • 2016 年 一月

D4SG資料英雄計畫 ©2014-2019