Data for Social Good Data for Social Good
  • 最新消息
    • 佈告欄
    • 熱門活動
  • 資料英雄計畫
    • 團隊募集
    • 專案成果
    • 資料英雄榜
  • 媒體報導
  • 聯絡我們
  • 最新消息
    • 佈告欄
    • 熱門活動
  • 資料英雄計畫
    • 團隊募集
    • 專案成果
    • 資料英雄榜
  • 媒體報導
  • 聯絡我們

Month: 六月 2017

  • Home
  • 2017 Archives
  • 六月 Archives
30 六月

D4SG資料英雄計畫 2017 夏季班錄取公告

  • Posted by johnson
  • Categories 佈告欄
  • Comments 0 comment

錄取提案
高風險危機警示模組(新北市政府社會局)
為防範家庭陷入兒少虐待之困境,新北市政府推動「新北市高風險家庭整合型安全網服務計畫」,連結跨局處共同針對家中具有恐易導致兒虐的高風險因素 (如:照顧者精神障礙、酒藥癮、高衝突、經濟困難等) 的家庭提供服務。100-105年間累積達 66,397 案件。為促使個案處理時能導入更適宜之資源與服務模式協助,希望建置「高風險危機警示模組」,讓網絡人員以更智慧的方式協助高風險家庭。
▌關鍵詞:兒少虐待、風險預警、跨局處系統
▌資料範疇:

通報個案基本資料 (超過6萬件個案)
由通報人勾稽之風險指標
由社工評估之家庭問題 (經濟問題、就學問題…)
各網絡局處評定之風險燈號與服務記錄 (社政、教育、衛政、民政、警政、司法 …等跨單位數據)
其他外部資料

改善公益性線上學習平台的服務效能(誠致教育基金會、均一教育平台)
均一教育平台透過雲端平台提供「免費、均等、一流」的教育機會給每一個人,學習主題涵蓋中小學的數學、自然、英文、社會與電腦科學。目前每週都有數萬名學生使用均一教育平台,還有許多老師在平台上面開發客製化的課程模組,提身班級同學的學習表現。
▌關鍵詞:使用者分群、標籤分析、推薦系統
▌資料範疇:

歷年用戶行爲紀錄(約一億筆紀錄)
歷年用戶學習績效

畜牧廢水防治便民看板(新竹縣政府環保局)
畜牧產業為台灣農業生產中重要的一環,其生產總值每年均超過新臺幣 1千億元,占農產品生產總值 33%以上,對繁榮農村經濟及安定社會,深具貢獻,惟畜牧業發展的過程,也帶來大量廢水、廢棄物,經常是民眾及輿論關切的焦點。本案由新竹縣環保局發起,以開放政府的精神,整合水污染之利害關係數據,期待能夠建立一個「畜牧廢水防治便民看板」。
▌關鍵詞:畜牧廢水、開放資料、便民看板
▌資料範疇:

列管畜牧業場域基本資料 (名稱、位址、運作狀態、規模, …)
定檢申報資料 (名稱、定檢時間、原廢水與放流水監測數據,

Read More
11 六月

高風險家庭資料建置與預警

  • Posted by johnson
  • Categories 資料英雄計畫
  • Comments 0 comment

Fellows:林庭蔚、林瑜軒、曾俊維、陳沛瑜、呂寧遠、鍾幸芸、羅町光
Mentor:莊友欣、謝宗震
Project Manager:許瑋
Project Partner:財團法人漢慈公益基金會
社會變遷及家庭結構的改變,隔代、單親、外籍配偶及近貧等經濟弱勢家庭有逐年增加的趨勢。處於這種資源相對弱勢的家庭中,不僅課業無人指導,甚至下課後連晚餐也沒有著落。弱勢兒童及少年在成長過程中比一般家庭孩子要面臨較多貧窮風險。同時,主要照顧者因為本身照顧能力薄弱或多重角色負荷,甚難獨立承擔育兒及教養之壓力。
有鑑於家庭是個人發展重要關鍵,2008歲末,正逢金融海嘯席捲,原本就處於社會邊緣的經濟弱勢族群,影響更是首當其衝,許多家庭面臨失業、貧困的困境。在新竹科學園區的漢民科技公司,秉持扶助弱勢的使命,在風雨飄搖的2009年,成立財團法人漢慈公益基金會 ,結合當地清華大學、交通大學、新竹科學園區優勢的社會人文資源,無償為弱勢服務,提供「高關懷家庭支持服務」、「弱勢兒少生活陪讀」,免費提供課業輔導、品格教育、家庭關懷服務,藉由優勢觀點「與其給他魚吃,不如教他釣魚」自立理念,提升家庭復原力及韌性,進而恢復家庭功能。
建置高風險家庭的預測模型
在漢慈想要建置高風險家庭預測模型背後的想法,因爲在漢慈所輔導的家庭相對於一般政府機構更加的複雜和難處理,且漢慈在個案的輔導和幫助上是非常細膩的,從財務、法律支持、孩童教育上著手,往往需要課輔老師、社工、志工等一同完成,也因此有各式各樣紙本紀錄的資料。因此社工們在繁忙的情況下,往往還需要花很大心力去爬梳個案資料,得出一個全貌,尤其是對於初接案的社工,或是新手基金會夥伴,使得經驗不易傳承。
總結圍繞漢慈想要建置高風險家庭預測模型的相關問題:

如何使用這些記錄幫助漢慈裡的夥伴能更快速簡單掌握一個家庭的全貌,減少花費在翻閱紙本紀錄,且能由幾年來累積的資料萃取出一些經驗呢?

能否梳理漢慈夥伴們過去幾年的心血,設計一套高風險家庭的預警系統呢?

如何幫助社工們更方便的存取紀錄資料,以利往後進行資料分析,發揮資料的價值呢?

解決方案
專案開始是以建置高風險家庭的預測模型為出發,經過跟漢慈的夥伴討論後,評估三個月的工作時間和收集相關圍繞漢慈細節的問題,我們提出的解決方案包含一系列可以做的事情和優先順序。

整理漢慈內部所擁有的資料
挑選可以用來作為高風險家庭預測模型的資料
嘗試可能的分析方式來預測相關高風險家庭
將整個分析方案建置成完整的應用

資料描述
漢慈這邊提供的資料,主要有下面幾類:

個案的開案資料,共有78個個案
個案的家訪資料,共有46個個案
高風險家庭的風險因子對照表,共有7大類風險因子,分別代表家庭功能的各個面向

經濟功能:46個細項指標
教育功能:40個細項指標

Read More
11 六月

建築物火災風險地圖

  • Posted by 莊 靜雅
  • Categories 資料英雄計畫
  • Comments 1 comment

Fellows:劉憲錡、林立哲、郭冠伶
Mentor:謝宗震
Project Manager:莊靜雅
Project Partner:高雄市政府消防局

Introduction
高雄市消防局自成立以來,咸奉「預防火災」、「搶救災害」、「緊急救護」之消防三大任務及其他為民服務事項,共同努力。為達成積極主動為民服務之使命,消防員24小時受理民眾需求並隨時出勤執行各項救災救護任務。每次的出勤任務都代表著人民傷亡或財物損失,同時也耗費國家的人力資源,卻無法徹底解決問題,因此預防火災便成了消防局積極推動的首要目標。
Problems
有鑑於住宅火災佔總案件數一半以上,高雄市消防局加強宣導住宅社區火災預防措施。但如何善用有限人力與資源,進而顯著降低火災發生頻率,一直讓消防局苦無對策。於是消防局與資料英雄合作,冀望能從建築物角度出發,彙整住戶與周遭環境資料以建構出建物火災風險預測模型,進而找出高風險住宅戶做居家訪視與社區消防觀念宣導,此外,本專案交叉分析不同數據,希望從中闡述新穎觀點以作為決策參考。
Method
資料處理
為評估建物火災機率,建築物火災風險地圖是以建物門牌號作為每一筆資料的索引,在高雄市政府機關大力的配合下,取得自稅捐處取得十三萬餘筆左營區地價資料、地政局建照十三萬餘筆建照資料。透過 Python 與 SQLite 反覆比對地址以及對地址進行正規化處理後,我們合併出約八萬九千筆資料。另外,根據金門大學火災預測碩士論文(link),承蒙社會局提供左營區身障、低收、獨居老人資料,加上消防局的狹小巷弄、火災報案紀錄,我們整理出以下特徵值。

資料處理實際上是這次專案花掉最多時間的地方,因各處室資料格式繁紊不一,資料整併窒礙難成。冀望將來,市府能將跨處室之集中資料倉儲作為資訊基礎建設之基石。

平衡學習 & 非平衡學習
在訓練建物火災機率模型初期,我們嘗試以深度學習演算法建置模型。我們得到 99.9% 的準確度,而後發現模型預測所有的建物都不會失火,因訓練資料中未失火的建物佔絕大多數,僅約四百筆建物曾失火,模型無法學習到失火建物的特徵,故模型猜測沒失火,且可藉此得到高準確度。
建物火災機率預測實為典型的非平衡學習,而準確度之於非平衡學習不是個好的指標。我們發現我們的初期模型在召回率方面的表現非常差。參考過往文獻後,我們決定以 BalanceCascade 的方法來訓練模型。下面我們將一步步介紹如何實作 Blanace Cascade 方法。
首先,我們需要對所有未失火的建物進行分群。我們將建物分成 137 群,每一群擁有八百筆建物資料。為此,我們採用了kNN(k-Nearest Neighbors)演算法。

Read More
11 六月

「到院前心肺休止」(OHCA) 風險地圖

  • Posted by A-ping Lin
  • Categories 資料英雄計畫
  • Comments 0 comment

為期四個月的資料英雄計畫,一群來自不同背景的資料夥伴被集結。從程式開發、統計分析、資料探勘到系統開發不同的技能,有人是醫學系學生,有人是消防隊緊急救護員志工、還有醫院急診部的醫師。「透過資料力,讓急診救護達到正向的循環」,這樣共同的想法將我們聚在一起。與提案方高雄市衛生局進行合作,引入資料科學的方法論,對高雄地區的歷年救護資料進行分析,為緊急救護與醫療界盡一份力。
OHCA(Out-of-Hospital Cardiac Arrest ,到院前心肺休止)是指病患在送達醫院的急診室前出現心肺功能停止之情況。當心跳停止達四分鐘時,腦部將會因為缺氧而受損;當超過十分後,腦部就可能達到永久損害而成植物人。因此,OHCA 病患的分分秒秒都在與時間拔河,在急重症檢傷分類中視為最優先處理的案例。
搶救黃金時間,不能只靠一己之力,必須仰賴上、中、下游的資源整合。「生命之鏈(Chains of Survival)」從社區、消防端、急診端及照護端整合眾人之力,透過五個環環相扣的流程,提高急救復甦及癒後健康的機會。
(https://i.imgur.com/rGYnl0T.png)
根據「熱區辨識」、「危險因子分析」、「緊急醫療優化」三個角度,定義了下列三個具體的問題,並預期從資料中解析出改善之道:

了解 OHCA 發生風險及其因素
了解 旁觀者 CPR 介入情況與效益
了解 社區救護資源分配優先順序

資料旅程 Data Journey
採用的資料集主要分為兩份資料:

OHCA 救護資料集 : 2010-2016 的 OHCA 消防端+醫院端資料
外部資料集 : 空氣/溫度/人口公開資料

我們針對了「OHCA 救護資料集」當中重要的

Read More

分類

  • 佈告欄
  • 未分類
  • 紀錄
  • 資料英雄計畫

近期文章

  • 採購稽核智慧化
  • D4SG 333短期方案-錄取公告
  • [提案招募] D4SG 333 短期方案
  • D4SG Fellowship 冬季班暫停公告
  • 智慧防洪,韌性城市

標籤

OCHA workshop 便民看板 兒少保護 家暴預警 就業輔導 急轉診 排班管理 政府採購 文字雲 水土保持 法律扶助 火災風險 畜牧廢水 社會救助 空汙 結巴 緊急醫療優化 脫離貧窮 自然語言處理 資料工作坊 資料英雄計畫 農地種電 開放資料 防洪 隨機森林 韌性城市 高風險家庭

彙整

  • 2021 年 十月
  • 2020 年 十月
  • 2020 年 五月
  • 2019 年 十二月
  • 2019 年 八月
  • 2019 年 二月
  • 2019 年 一月
  • 2018 年 十二月
  • 2018 年 十一月
  • 2018 年 七月
  • 2018 年 六月
  • 2018 年 二月
  • 2018 年 一月
  • 2017 年 十二月
  • 2017 年 六月
  • 2017 年 五月
  • 2017 年 三月
  • 2017 年 二月
  • 2017 年 一月
  • 2016 年 十二月
  • 2016 年 十一月
  • 2016 年 八月
  • 2016 年 七月
  • 2016 年 六月
  • 2016 年 一月
  • 2013 年 六月

D4SG資料英雄計畫 ©2014-2019