Data for Social Good Data for Social Good
  • 最新消息
    • 佈告欄
    • 熱門活動
  • 資料英雄計畫
    • 團隊募集
    • 專案成果
    • 資料英雄榜
  • 媒體報導
  • 聯絡我們
  • 最新消息
    • 佈告欄
    • 熱門活動
  • 資料英雄計畫
    • 團隊募集
    • 專案成果
    • 資料英雄榜
  • 媒體報導
  • 聯絡我們

資料英雄計畫

  • Home
  • 資料英雄計畫
08 十月

D4SG 333短期方案-錄取公告

  • Posted by 值班編輯
  • Categories 佈告欄
  • Comments 0 comment

提案:狂風暴雨、安全救災 (金門縣林務所)
颱風天風倒木對民眾生命財產安全一大威脅。金門縣林務所為金門縣行道樹管理養護之負責單位,同時負擔颱風期間路樹傾倒之緊急清運工作,如何在大風大雨之中快速清運並確保救災人力安全是所內關心事務,這次提案透過過往救災紀錄及氣象局相關颱風資訊,讓林務所在颱風發生前超前部署,減少風倒木事件發生數量,颱風發生當下做適宜人力及機具安排,維護民眾及救災人員之安全。
▌關鍵詞:救災防災、資料探索
▌錄取英雄:廖O程、葉O縈

提案:提升採購稽核業務品質及效能(臺北市政府工務局採購科)

政府採購的生命週期包括招標、開標、決標、履約、驗收與保固等階段,標案執行過程之稽核,仰仗機關內外部稽核委員的採購相關法令與實務專業能力。如何透過自然語言處理,協助稽核委員以結構化方式記錄執行缺失,並分析系統性與結構性之問題,將是本專案探索分析之重點。
▌關鍵詞:政府採購、自然語言處理
▌錄取英雄:王O雲、張O詠、曾O毅
社會住宅租戶輪廓分析(臺北市政府社會局)

社會住宅租戶輪廓分析(臺北市政府社會局) 社會住宅是由政府作莊,採「只租不賣」模式,提供給符合條件的一般家戶和弱勢戶申請的住宅。臺北市目前已有13處社會住宅開放申請,整個流程包含招租、入住與維運。本專案的核心議題是透過分析社會住宅弱勢住戶資料,期待能建立資料視覺化儀表板,了解哪種類型的人經常來申請、比較容易入住、實際保障哪些弱勢類型,以作為調整投注資源之參考依據。

▌關鍵詞:社會住宅、資料視覺化
▌錄取英雄:陳O廷、邱O禎、林O廷
每個提案將派遣專家與提案單位進行資料盤點、問題聚焦、預期成果評估等討論,再根據預期成果的社會影響力、資料成熟度、時限內可完成程度、經驗可複製性、以及主管是否積極支持讓成果能確實導入組織運作等面向進行審查,以決定提案錄取名單。
關於資料英雄的錄取標準,則是以完成專案主題的技能需求為基準,由負責專案的指導顧問進行選秀,根據個人技能與興趣分配。

Read More
03 一月

環境廢水防治便民看板

  • Posted by 歐 采瑀
  • Categories 資料英雄計畫
  • Comments 2 comments

Fellows:王韋勝、蔡志瑋、黃鈺茹、賴宜宏、歐采瑀、詹欣諭
Mentor:陳潔寧
Project Manager:許又仁
Project Partner:新竹縣政府環境保護局

環保議題在台灣是最容易引爆民怨,卻又長年無法令民眾滿意的公共政策領域。其中汙水防治常涉及農地重金屬汙染及灌溉用水安全,涉及的政策範圍橫跨農業領域和食品安全問題。然而,政府權責單位所面臨的困境是「稽查人力不足時常疲於奔命」、「廠商觸犯數個環保法規,跨科室橫向溝通效率不足」、「廠商不只在一個縣市有廠房各縣市環保局無法橫向連結知會」等問題。
根據「行政院環境保護署.環境資源資料開放平台」的開放資料,我們發現開放資料的資料結構,依據各縣市環保局各事業類別,如一般廢棄物、汙水防治…等科室概念分類資料,僅考慮了各縣市環保局各科室回傳資料的結構,並未將資料進行「儀表板式」的呈現,僅將各分類資料進行簡單疊代呈現,在地理圖資上的呈現,也未能提供各利害關係人方便閱讀。
同時也造成各科室之間的資料橫向溝通較為不易,且針對個別廠商在不同汙染觸法事項上沒辦法及時察覺,造成事業單位的管理困擾。而披露的公開資訊亦不足以造成個別廠商自律的效果。 我們針對這個管理上的困難,針對 Open Data 的資訊整理,進行了便利看板的設計,並結合地理圖資,以汙水防治作為範例,進行資料的整理與分析。
計畫目標希望弭平民眾、政府權責單位、列管廠商之間的資訊落差,透過便利看板的揭露,讓環境污染稽查更有效率,賦權政府機關更有效率提供民眾期待的環保治理,並透過透明化資訊促使各列管廠商自律。
 
資料來源

新竹縣政府環保局提供內部資料:管制公司
行政院環境保護署.環境資源資料開放平台:下載新竹縣相關資料(包含基本資料、裁處資料、河川管制區、河川水質監控數據等)
透明足跡
全國商工行政服務入口網
公司名稱 & 股票代號對照表
股票網站

 
系統構想

由於環保署提供之基本資料較為詳細,如下圖所示,因此,首先篩選列管類別為水汙染之公司,藉由管制編號視為 key值,將環保局內部資料之流域別進行join整合,賦予每一家管制公司排放汙水之流域別,並進行地址對位 geocoding。

我們從局處整體的角度思考設計了三個頁面,以瞭解局處內部裁處情形和各公司裁處狀況。
1.各事業別TOP5裁罰公司
以各科室之管制事業進行統計,計算出該時間點發生裁處事實之前五名公司,藉此督促相關單位進行監督。

Read More
03 一月

如何評估學生學得會?

  • Posted by 蔡 子揚
  • Categories 資料英雄計畫
  • Comments 0 comment

Fellows:黃卉怡、柯景泰、林芃彣、楊佩雯、游家鑫、張育慈
Mentor:劉嘉凱、梁智程
Project Manager:蔡子揚
Project Partner:誠致教育基金會

緣起
如何衡量學生學得會?

均一教育平台致力於提供所有學生「均等」且「一流」的學習機會,以此做為我們的使命。均一教育平台設計是以個人化學習為概念,我們深信要落實個人化學習,必須尊重每一個孩子不同的特質與現況,並搭配「精熟學習」與「成長心態」之教育理念,讓每個孩子重新體驗自己有學會的機會!
近年來,不論是線上或線下,均一夥伴們皆努力探索不同的可能性,希望能與學校家庭共同合作,幫助孩子們在基本學力上的進步,而我們也常常問自己,孩子們真的學會了嗎?因此在數據上的蒐集與分析不停精進,希望能透過客觀可靠的科學方式,為我們的產品作改善,2016年更與台大林明仁教授進行專案合作,分析宜蘭縣的小學生,經過兩年學習歷程看到,宜蘭縣的學生能使用平台3.5小時,且在均一教育平台上獲得超過13個練習題組精熟,學力檢測能提升14.2個PR值,這讓我們更有信心相信我們確實有幫助孩子們進步。
但是,我們不能因此驕傲自矜,在教育的路上我們仍有很長的一段路要走,證明了我們的產品確實可以幫助學生之後,更要知道是什麼地方確實幫助了學生?學生在學習上如何更有效率,讓進步的幅度能更上一層樓呢?線上線下,平台跟老師家長可以怎麼配合?這些都是我們希望能釐清的題目。
 
思考
聯合所有正面力量

我們常常聽到說:「不要重新發明輪子」。在誠致內,我們也常常告訴自己,要善用槓桿,聯合所有正面力量,站在巨人的肩膀上,讓自己更有效率地利用資源,於是在今年年中當我們看到 智庫驅動-D4SG資料英雄計畫,與公共服務性組織合作,選擇兼具高度社會影響力與再利用性的資料科學專案,並媒合民間熱血的資料英雄,利用三個月的工作時間共同完成,同時,有著熟稔資料科學的mentor們會帶領專案前進。我們認為這是一個很好的機會,利用均一內部大量的數據,結合外部人才在資料上的知識,希望能夠發揮1+1 > 2 的力量,了解往後平台在資料搜集與功能上可以做什麼改善,做到更緊密結合「網路」、「數據」與「教育領域知識」,進一步發揮教育科技創新。
同時,我們也希望能做到以下:

軟體公司的思維跟經營,重視速度與 O2O(Online to Offline)交叉運作
發揮團隊執行力,善用數據分析,避免斷點
公開透明 – 主動公開使用數據,取信於社會,並拋磚引玉,希望台灣其他MOOC也能公佈數據

 
過程
高手在民間

鄉民說得好:「高手在民間」。在D4SG計畫中,我們發現參與者背景非常多元,有上班族、主管經理、研究生等,不僅在本身領域上面有所成就,也願意奉獻自己的時間參與公益計畫,真正讓我們體會到 Data

Read More
26 十二月

高風險危機警示模組

  • Posted by 郭 泰竹
  • Categories 資料英雄計畫
  • Comments 4 comments

Fellows:林峰生、林廷州、林恆宇、胡馨勻、葉憲周、郭泰竹、郭家諭
Mentor:謝宗震
Project Manager:李苡菲
Project Partner:新北市政府社會局

摘要
新北市高風險中心由100年執行至105年,新北市高風險兒少通報案件累計達66,397案件(平均每年約1萬件),考量此類高風險家庭常面臨多元化之風險,為能協助網絡中的工作人員對於家庭的危機程度有更精確的掌握,可於處理眾多高風險案件時,導入更適宜之資源與服務模式協助,使此類家庭免於再次發生高風險危機或進而演變成更嚴重的兒童虐待案件,如果無法提早找出類似嚴重的家庭,極有可能會發生更嚴重的事件。因此,找出容易重複被通報的「回頭客」以及預測個案是否有機會「進入家暴防治中心」(以下簡稱家防),可望幫助解決以上時間有限但人力不足,並適應多元化風險的問題。
背景說明
新北市為全台灣最大縣市、六都之首,人口數高達400萬人,涵蓋29個行政區,擁有豐富的自然資源及科技進步的城市,但在光鮮亮麗的外表下,社會邊緣的角落正在發生許多鮮為人知的問題,而這些問題可能就發生在你我周遭,關係著社會安全以及未來主人翁的幸福。
新北市高風險家庭服務管理中心(以下簡稱:高風險中心)成立於民國一百年,主要負責進行高風險家庭案件之分級管派與服務狀況追蹤,目的是為了提前預防家庭暴力以及兒童受虐等問題發生,民國101年至105年新北市高風險兒少通報案件累計達66,397件(平均每年約一萬件),等於每一個小時就要處理一件高風險家庭的個案,且是24小時待命、全年無休。
有鑑於此,由D4SG資料英雄計畫組織了一支擁有社工、統計、資工、資料科學以及專案管理背景的團隊,透過高風險中心十萬多筆的資料,經由大數據分析,希望能夠協助高風險中心對於家庭的危機程度有更精確的掌握,可於處理眾多高風險案件時,導入更適宜之資源與服務模式協助,避免再次發生高風險危機或進而演變成更嚴重的兒童虐待案件。
專案目標
新北市是個有著多元文化與族群聚集的城市,約有百分之七十是外移人口,但隨著家庭結構的改變、傳統自掃門前雪觀念的根深柢固。為了要讓兒少能獲得更完善的照護,新北市高風險家庭中心建立一個完善的兒少安全保護網,以普及宣導、預防支持、保護服務三個層級,希望能做出完善預防的工作,避免兒虐事件的發生。
新北市高風險兒少通報案件量平均每年約有10,000件,每人每年約需處理1,666件案件。因此,在如此龐大的案件量中如何更準確的評估每個案件的輕重緩急並且妥善安排人力資源做出最適當的處理著實重要。「預防勝於治療」基於以上種種原因,我們希望可以建立一個良好的預測機制,先找出容易重複進案的「回頭客」以及個案是否有很大風險會「進入家防中心」,再藉由這些因子建立出預測模型,幫助高風險中心人員往後對於這些高風險家庭能進行主動且預先的關懷訪視,對這些家庭的危機程度有更精確的掌握,在處理高風險案件時,導入更適宜之資源與服務模式協助,讓此類家庭免於再度發生高風險危機或進而演變成更嚴重的兒童虐待案件。
資料集介紹
本專案所使用的資料取自於「新北市高風險家庭整合型安全網資訊管理系統」,將資料個案之身分證加密後,整合成單一資料總表,取得近147萬筆原始資料,包含每一個案之重複案件以及個案評估量表、通報表、派案評估表等資訊。重點資訊條列如下:

該案兒少人口變項之資料,包含如:性別、年齡、居住區域、國籍等
每通報案件於通報時經由通報人勾選之風險指標
每通報案件於社工初篩派案時所評估勾選之兒少所遭遇的家庭問題情形 (如經濟問題、就學問題、父母親藥癮問題等)
各網絡局處受理案件後對於案件危機程度的評估資料(以紅黃綠燈進行危機程度區分)
各網絡局處每月對於案件之服務紀錄
資料勾機外部資料情形

「新北市高風險家庭整合型安全網資訊管理系統」橫跨10個局處 (民政、教育、社會、衛生、工務、勞工、警政、消防、原民、資訊中心)與 1,300個窗口。亦勾稽相關外部資料,包含新北市福利補助系統、教育局兒少學籍系統以及兒童虐待保護案件資訊系統,是一個多元整合管理系統。

執行方式
由於工作期程有三個月,因此我們將工作切分成兩段,第一階段包含流程理解、資料盤點、預期成果;第二階段是進行資料清理、資料分析並且撰寫成果報告。
由於在此案之前顧問已有台北市家防專案的經驗,所以對於社工的組織較為了解,也較清楚資料專案的困難之處。最初的一個多月,主要的工作在於理解高風險中心的工作流程,配合資料盤點的結果,利用資料驅動的討論方式收斂到兩個專案目標,首先是避免案件無法結案不斷的重複開案,又或者是個案落入更危險的兒少保護體系 (家暴)。
接下來的一個月主要工作是制定資料分析策略,首先進行資料處理,將資訊系統拉出來的資料轉換成可供機器學習模型所使用的資料大表 (data.frame),其中最困難的工作在於如何從凌亂的資料表中,找出高風險中心處理的個案屬於哪個家庭,以及如何做跨表格的合併。接下來是做資料探索,找出與落入家暴問題案件相關的特徵以及派案回頭客的相關特徵。統整這些資料探索結果後本組使用邏輯斯迴歸、支持向量機、隨機森林等演算法針對家暴個案、回頭客個案進行預測,最終選擇準確度高達八成的隨機森林模型作為成果。
資料探索

Read More
26 十二月

[心得] 用數據預測危機,一個社工系學生的學習之旅

  • Posted by 胡 馨勻
  • Categories 紀錄
  • Comments 0 comment

參加初衷
一開始之所以會參加資料英雄計畫,是因為看到大數據運用於商業、行銷,並大致了解大數據的概念之後,覺得如果可以把大量資料分析並預測、調整作法的概念運用於社會工作領域上面那該是一件多麼美好的事,不但可以較容易了解擁有什麼樣行為模式的案主比較可能發生狀況、讓社工可以加強對他們的處遇,將預防做得更全面,同時也可以讓社工人員追蹤什麼樣的處遇方式對什麼樣的個案可能最有效果,將最適當的資源放置在最需要的地方,減輕工作的負擔。抱持著這樣的想法,某一天在網路上搜尋時正好看到資料英雄計畫之前做有關於火災預警以及台北市家暴防治的成果,覺得這是一個可以對資料科學增進了解,同時也了解自己想法實際行動的樣貌,於是就報名,幸運地獲選入高風險危機示警的計畫中,也看到了當初未曾想過的風景。
對高風險系統的認識
雖然身為社工系的學生,對於社會工作的工作方法、社會福利及輸送的體系有大致知識上的了解,但是實際上在台灣每個縣市政府下的社會安全網是如何被建構、系統的運作流程及方法也都不盡相同,我也沒有對這部分有進一步的了解。整個資料英雄計畫中最重要的部分大概就是對於新北市高風險系統運作流程的了解了,唯有了解整個高風險運作體系以及高風險中心在當中扮演的角色,才知道要用什麼樣的資料以及用什麼變項來分析,分析結果才可以對高風險中心的業務產生效益。新北市的高風險系統真的做得非常完善,從通報、成案、派案到開案、結案,除了社會局以及高風險中心本身以外,還結合了九個局處一起來為高風險家庭及兒童服務,透過高風險中心的同一派案可以讓個案儘快至適當的局處接受服務,達成個案管理的效果,除了讓個案能夠獲得最需要的資源與服務,也能減少各局處做重複業務的行政成本。
不過於此同時,也了解了中央與地方上的差異,高風險的通報標準是中央政府訂出的,不過對於高風險家庭卻沒有確切的定義,各縣市政府的流程及方法也不同,不只如此,中央與地方的資訊系統也不一致,工作人員要適應不同系統,每個系統也都有很多內容或是步驟、有一定的複雜度,導致還要花費額外的時間去適應以及填寫不同的欄位,若是中央和各地區的系統可以整合成同一個的話,不僅同樣一份資料只要寫一次,若要轉介至其他縣市,也可以方便工作人員進入狀況,銜接服務。
對資料分析過程的觀察
而這次計畫讓我收穫最多的當屬於資料分析的部分了,不但實際參與了整個過程,也讓我了解如何將不同的統計方法應用於真實的情況中,也開始學習一點R語言。
我覺得在資料分析中,除了對於整個系統與狀態的了解以外,最重要的即是資料取得的來源與定義,因為這樣才能夠對資料做最合適的處理,做出來的結果才能產生意義。在決定到底要做什麼內容之前,需要不斷討論、不斷了解、不斷確認,一來是要確認哪些資料是可以使用的,包含資料的內容、什麼狀況會填答、填答的狀況是否有許多空值等等,也要確定什麼題目是對需要資料分析的單位是有意義的,所以要確認題目就要花費很長一段時間,這是我始料未及的事。
高風險中心給我們數萬筆資料,但許多欄位是一些基本資料的描述,是質性的資料無法分析,或者因為制度設計上並沒有強制規定一定要填而產生了許多空值,同時也有產生因為資訊系統勾稽上產生的問題而導致的困難,所以光是確定要做的題目是不行的,要清理資料、確定某一筆資料是可以使用的才能夠真正確定。同時出乎我意料之外的是,原本以為只能做什麼樣的家庭背景或者指標可能較容易進入高風險系統甚至兒童保護系統,後來竟然可以運用通報次數或者燈號的變化等做出預測,又學到了新的想法!
這次的經驗真的很寶貴,不但整體參與了討論的過程,也從其他成員們做的事情當中了解了在處理資料時要做的事情有哪些,而不只是單純的紙上談兵,真的覺得很幸運可以參與資料英雄計畫的高風險中心組!
學R的一些心得想法
最後,在毫無任何R語言基礎即進入專案中的狀況下,為了能夠跟大家一起工作,在暑假時我也開始學習R語言。我所參考的資料是R語言翻轉教室,裡面的課程設計是一課一課進行,會有說明、舉例,同時也可以自行操作,每一課最後都會有作業,可以自己思考。對於不熟悉程式語言的人來說,自學還是會有一定困難。對我來說最複雜的部分應該是在函數裡面要放的內容,或是物件性質的差異,另外,自學課程相較於實體課程困難的部分也還是學生的差異性,每個學生有問題的地方也都不同,不可能面面俱到,有些地方也不一定都說明詳細,需要自行查資料。還有最痛苦的是腦袋中有想法可是無法實現,上網查的時候,可能也因為關鍵字不正確所以也找不到做法。程式碼無法順利運作時,找錯誤也是一個困難的過程,可能還是需要不斷練習、參考別人寫的程式碼才能夠有持續的進步,我也會在學習R的路上繼續邁進。
延伸閱讀

D4SG專案成果:高風險危機警示模組 (新北市高風險中心)
D4SG專案成果:家暴預警與風險管理 (台北市家防中心)
D4SG專案成果:建築物火災風險地圖 (高雄市消防局)
高風險家庭及新北市通報方式
R語言翻轉教室

Read More
30 六月

D4SG資料英雄計畫 2017 夏季班錄取公告

  • Posted by johnson
  • Categories 佈告欄
  • Comments 0 comment

錄取提案
高風險危機警示模組(新北市政府社會局)
為防範家庭陷入兒少虐待之困境,新北市政府推動「新北市高風險家庭整合型安全網服務計畫」,連結跨局處共同針對家中具有恐易導致兒虐的高風險因素 (如:照顧者精神障礙、酒藥癮、高衝突、經濟困難等) 的家庭提供服務。100-105年間累積達 66,397 案件。為促使個案處理時能導入更適宜之資源與服務模式協助,希望建置「高風險危機警示模組」,讓網絡人員以更智慧的方式協助高風險家庭。
▌關鍵詞:兒少虐待、風險預警、跨局處系統
▌資料範疇:

通報個案基本資料 (超過6萬件個案)
由通報人勾稽之風險指標
由社工評估之家庭問題 (經濟問題、就學問題…)
各網絡局處評定之風險燈號與服務記錄 (社政、教育、衛政、民政、警政、司法 …等跨單位數據)
其他外部資料

改善公益性線上學習平台的服務效能(誠致教育基金會、均一教育平台)
均一教育平台透過雲端平台提供「免費、均等、一流」的教育機會給每一個人,學習主題涵蓋中小學的數學、自然、英文、社會與電腦科學。目前每週都有數萬名學生使用均一教育平台,還有許多老師在平台上面開發客製化的課程模組,提身班級同學的學習表現。
▌關鍵詞:使用者分群、標籤分析、推薦系統
▌資料範疇:

歷年用戶行爲紀錄(約一億筆紀錄)
歷年用戶學習績效

畜牧廢水防治便民看板(新竹縣政府環保局)
畜牧產業為台灣農業生產中重要的一環,其生產總值每年均超過新臺幣 1千億元,占農產品生產總值 33%以上,對繁榮農村經濟及安定社會,深具貢獻,惟畜牧業發展的過程,也帶來大量廢水、廢棄物,經常是民眾及輿論關切的焦點。本案由新竹縣環保局發起,以開放政府的精神,整合水污染之利害關係數據,期待能夠建立一個「畜牧廢水防治便民看板」。
▌關鍵詞:畜牧廢水、開放資料、便民看板
▌資料範疇:

列管畜牧業場域基本資料 (名稱、位址、運作狀態、規模, …)
定檢申報資料 (名稱、定檢時間、原廢水與放流水監測數據,

Read More
11 六月

高風險家庭資料建置與預警

  • Posted by johnson
  • Categories 資料英雄計畫
  • Comments 0 comment

Fellows:林庭蔚、林瑜軒、曾俊維、陳沛瑜、呂寧遠、鍾幸芸、羅町光
Mentor:莊友欣、謝宗震
Project Manager:許瑋
Project Partner:財團法人漢慈公益基金會
社會變遷及家庭結構的改變,隔代、單親、外籍配偶及近貧等經濟弱勢家庭有逐年增加的趨勢。處於這種資源相對弱勢的家庭中,不僅課業無人指導,甚至下課後連晚餐也沒有著落。弱勢兒童及少年在成長過程中比一般家庭孩子要面臨較多貧窮風險。同時,主要照顧者因為本身照顧能力薄弱或多重角色負荷,甚難獨立承擔育兒及教養之壓力。
有鑑於家庭是個人發展重要關鍵,2008歲末,正逢金融海嘯席捲,原本就處於社會邊緣的經濟弱勢族群,影響更是首當其衝,許多家庭面臨失業、貧困的困境。在新竹科學園區的漢民科技公司,秉持扶助弱勢的使命,在風雨飄搖的2009年,成立財團法人漢慈公益基金會 ,結合當地清華大學、交通大學、新竹科學園區優勢的社會人文資源,無償為弱勢服務,提供「高關懷家庭支持服務」、「弱勢兒少生活陪讀」,免費提供課業輔導、品格教育、家庭關懷服務,藉由優勢觀點「與其給他魚吃,不如教他釣魚」自立理念,提升家庭復原力及韌性,進而恢復家庭功能。
建置高風險家庭的預測模型
在漢慈想要建置高風險家庭預測模型背後的想法,因爲在漢慈所輔導的家庭相對於一般政府機構更加的複雜和難處理,且漢慈在個案的輔導和幫助上是非常細膩的,從財務、法律支持、孩童教育上著手,往往需要課輔老師、社工、志工等一同完成,也因此有各式各樣紙本紀錄的資料。因此社工們在繁忙的情況下,往往還需要花很大心力去爬梳個案資料,得出一個全貌,尤其是對於初接案的社工,或是新手基金會夥伴,使得經驗不易傳承。
總結圍繞漢慈想要建置高風險家庭預測模型的相關問題:

如何使用這些記錄幫助漢慈裡的夥伴能更快速簡單掌握一個家庭的全貌,減少花費在翻閱紙本紀錄,且能由幾年來累積的資料萃取出一些經驗呢?

能否梳理漢慈夥伴們過去幾年的心血,設計一套高風險家庭的預警系統呢?

如何幫助社工們更方便的存取紀錄資料,以利往後進行資料分析,發揮資料的價值呢?

解決方案
專案開始是以建置高風險家庭的預測模型為出發,經過跟漢慈的夥伴討論後,評估三個月的工作時間和收集相關圍繞漢慈細節的問題,我們提出的解決方案包含一系列可以做的事情和優先順序。

整理漢慈內部所擁有的資料
挑選可以用來作為高風險家庭預測模型的資料
嘗試可能的分析方式來預測相關高風險家庭
將整個分析方案建置成完整的應用

資料描述
漢慈這邊提供的資料,主要有下面幾類:

個案的開案資料,共有78個個案
個案的家訪資料,共有46個個案
高風險家庭的風險因子對照表,共有7大類風險因子,分別代表家庭功能的各個面向

經濟功能:46個細項指標
教育功能:40個細項指標

Read More
11 六月

建築物火災風險地圖

  • Posted by 莊 靜雅
  • Categories 資料英雄計畫
  • Comments 1 comment

Fellows:劉憲錡、林立哲、郭冠伶
Mentor:謝宗震
Project Manager:莊靜雅
Project Partner:高雄市政府消防局

Introduction
高雄市消防局自成立以來,咸奉「預防火災」、「搶救災害」、「緊急救護」之消防三大任務及其他為民服務事項,共同努力。為達成積極主動為民服務之使命,消防員24小時受理民眾需求並隨時出勤執行各項救災救護任務。每次的出勤任務都代表著人民傷亡或財物損失,同時也耗費國家的人力資源,卻無法徹底解決問題,因此預防火災便成了消防局積極推動的首要目標。
Problems
有鑑於住宅火災佔總案件數一半以上,高雄市消防局加強宣導住宅社區火災預防措施。但如何善用有限人力與資源,進而顯著降低火災發生頻率,一直讓消防局苦無對策。於是消防局與資料英雄合作,冀望能從建築物角度出發,彙整住戶與周遭環境資料以建構出建物火災風險預測模型,進而找出高風險住宅戶做居家訪視與社區消防觀念宣導,此外,本專案交叉分析不同數據,希望從中闡述新穎觀點以作為決策參考。
Method
資料處理
為評估建物火災機率,建築物火災風險地圖是以建物門牌號作為每一筆資料的索引,在高雄市政府機關大力的配合下,取得自稅捐處取得十三萬餘筆左營區地價資料、地政局建照十三萬餘筆建照資料。透過 Python 與 SQLite 反覆比對地址以及對地址進行正規化處理後,我們合併出約八萬九千筆資料。另外,根據金門大學火災預測碩士論文(link),承蒙社會局提供左營區身障、低收、獨居老人資料,加上消防局的狹小巷弄、火災報案紀錄,我們整理出以下特徵值。

資料處理實際上是這次專案花掉最多時間的地方,因各處室資料格式繁紊不一,資料整併窒礙難成。冀望將來,市府能將跨處室之集中資料倉儲作為資訊基礎建設之基石。

平衡學習 & 非平衡學習
在訓練建物火災機率模型初期,我們嘗試以深度學習演算法建置模型。我們得到 99.9% 的準確度,而後發現模型預測所有的建物都不會失火,因訓練資料中未失火的建物佔絕大多數,僅約四百筆建物曾失火,模型無法學習到失火建物的特徵,故模型猜測沒失火,且可藉此得到高準確度。
建物火災機率預測實為典型的非平衡學習,而準確度之於非平衡學習不是個好的指標。我們發現我們的初期模型在召回率方面的表現非常差。參考過往文獻後,我們決定以 BalanceCascade 的方法來訓練模型。下面我們將一步步介紹如何實作 Blanace Cascade 方法。
首先,我們需要對所有未失火的建物進行分群。我們將建物分成 137 群,每一群擁有八百筆建物資料。為此,我們採用了kNN(k-Nearest Neighbors)演算法。

Read More
11 六月

「到院前心肺休止」(OHCA) 風險地圖

  • Posted by A-ping Lin
  • Categories 資料英雄計畫
  • Comments 0 comment

為期四個月的資料英雄計畫,一群來自不同背景的資料夥伴被集結。從程式開發、統計分析、資料探勘到系統開發不同的技能,有人是醫學系學生,有人是消防隊緊急救護員志工、還有醫院急診部的醫師。「透過資料力,讓急診救護達到正向的循環」,這樣共同的想法將我們聚在一起。與提案方高雄市衛生局進行合作,引入資料科學的方法論,對高雄地區的歷年救護資料進行分析,為緊急救護與醫療界盡一份力。
OHCA(Out-of-Hospital Cardiac Arrest ,到院前心肺休止)是指病患在送達醫院的急診室前出現心肺功能停止之情況。當心跳停止達四分鐘時,腦部將會因為缺氧而受損;當超過十分後,腦部就可能達到永久損害而成植物人。因此,OHCA 病患的分分秒秒都在與時間拔河,在急重症檢傷分類中視為最優先處理的案例。
搶救黃金時間,不能只靠一己之力,必須仰賴上、中、下游的資源整合。「生命之鏈(Chains of Survival)」從社區、消防端、急診端及照護端整合眾人之力,透過五個環環相扣的流程,提高急救復甦及癒後健康的機會。
(https://i.imgur.com/rGYnl0T.png)
根據「熱區辨識」、「危險因子分析」、「緊急醫療優化」三個角度,定義了下列三個具體的問題,並預期從資料中解析出改善之道:

了解 OHCA 發生風險及其因素
了解 旁觀者 CPR 介入情況與效益
了解 社區救護資源分配優先順序

資料旅程 Data Journey
採用的資料集主要分為兩份資料:

OHCA 救護資料集 : 2010-2016 的 OHCA 消防端+醫院端資料
外部資料集 : 空氣/溫度/人口公開資料

我們針對了「OHCA 救護資料集」當中重要的

Read More
01 五月

D4SG資料英雄計畫-提案單位常見問題集

  • Posted by johnson
  • Categories 佈告欄, 紀錄
  • Comments 0 comment

這是一個讓政府單位、非營利組織快速了解 D4SG資料英雄計畫的說明頁面。

什麼是 D4SG資料英雄計畫?
D4SG 資料英雄計畫,指在透過媒和資料專家與 GOV/NPO 夥伴,以及 Workshop (資料工作坊)、Fellowship (資料英雄之旅) 等實作活動,讓組織的資料可以獲得更多應用,發現並解決更多組織內/外的議題!D4SG資料英雄計畫有兩種主要的活動,一種是短期密集式的 Workshop;另一種是長期鍛鍊式的 Fellowship。Workshop適合初次體驗資料應用的組織;Fellowship 適合資料成熟度較高的組織,根據組織關注議題提出資料科學的創新解方。

可以參與怎樣的活動?
對於資料世界的新鮮人可以先從我們的活動說明會與成果發表會進行了解。你可以查詢 D4SG官網的 Events 頁面,關注最新/過往的活動消息。

Workshop 的活動流程是?

每個人都要帶電腦來查找/整理資料
組織應該派誰來參加?透過報名表格,描述參加者在活動的身份位置和資料專長
GOV/NPO 夥伴們要自備資料(可以是組織或相關政府機關的公開資料)、思考要解決的題目
共同討論工作坊時間:須在週末舉辦,因為除了 NPO 夥伴之外,還需要其他資料科學家與設計師跨領域加入,一起豐富視野和技術
強調活動方式:帶你的資料來(BYOD)、帶你的問題來(BYOQ)


Read More
  • 1
  • 2
  • >

分類

  • 佈告欄
  • 未分類
  • 紀錄
  • 資料英雄計畫

近期文章

  • 採購稽核智慧化
  • D4SG 333短期方案-錄取公告
  • [提案招募] D4SG 333 短期方案
  • D4SG Fellowship 冬季班暫停公告
  • 智慧防洪,韌性城市

標籤

OCHA workshop 便民看板 兒少保護 家暴預警 就業輔導 急轉診 排班管理 政府採購 文字雲 水土保持 法律扶助 火災風險 畜牧廢水 社會救助 空汙 結巴 緊急醫療優化 脫離貧窮 自然語言處理 資料工作坊 資料英雄計畫 農地種電 開放資料 防洪 隨機森林 韌性城市 高風險家庭

彙整

  • 2021 年 十月
  • 2020 年 十月
  • 2020 年 五月
  • 2019 年 十二月
  • 2019 年 八月
  • 2019 年 二月
  • 2019 年 一月
  • 2018 年 十二月
  • 2018 年 十一月
  • 2018 年 七月
  • 2018 年 六月
  • 2018 年 二月
  • 2018 年 一月
  • 2017 年 十二月
  • 2017 年 六月
  • 2017 年 五月
  • 2017 年 三月
  • 2017 年 二月
  • 2017 年 一月
  • 2016 年 十二月
  • 2016 年 十一月
  • 2016 年 八月
  • 2016 年 七月
  • 2016 年 六月
  • 2016 年 一月
  • 2013 年 六月

D4SG資料英雄計畫 ©2014-2019