錄取提案
家事訴訟:以歷史的判決看外配是否受到法律差異對待(法律扶助基金會)
參照內政部移民署網站統計資料,截至2018年底,外裔或外籍配偶人數已達近18萬人,又每年約1萬多人登記結婚、亦有近5千人離,是以對於非在台灣生長,對於台灣文化陌生,更不諳本國語言及法律之外籍配偶,其在家事訴訟程序中是否受差異之對待,其成因為何,現有之法律扶助律師是否已提供適切之服務等,皆為此次專案所欲探詢之問題。
▌關鍵詞:法院判決、文字探勘
有限社工人力資源解決高危機個案(桃園市政府家庭暴力暨性侵害防治中心)
家防中心針對家暴被害人及其家庭提供服務,乃為重要業務內容之一。桃園市平均一年約1萬餘件之家暴通報案件,如何在有限人力、資源前提下,針對具高度生命危機議題可能生的案件中,在定期網絡合作中共同找出當中的高高危機個案,立即並優先介入係顯得重要及必要。
▌關鍵詞:高風險家庭、風險預測、危險因子
智慧防洪,韌性城市(臺北市政府工務局大地工程處)
近期,午後豪大雨造成排水系統瞬間過載無法負荷,成為水災或坡地崩塌之主要成因,集中降雨以既有的水文學說而言,解決方式通常是投入更多的錢去整治,做出更高的防洪標準(有錢的縣市),或是乾脆將易淹水區域的居民遷移至別處安置(省錢的做法);但是近年來資料科學的進步,是否可以透過資料探索來摸索出一個彈性防洪的方法,讓有限的資源做出更好的利用(比如以50年防洪標準的設施搭配其他防洪手段,讓防洪標準可以等同75年水準等),即是我們想要探討的目標。
▌關鍵詞:防洪、韌性城市
錄取英雄
石O蓁、江O矩、吳O展、吳O萱、李O杰、李O雲、李O萱、李O臻、林O逵、邱O琪、
邵O磊、姜O文、姜O安、張O偉、張O婷、張O懋、陳O廷、黃O淳、黃O雅、葉O安、
廖O程、蔡O涵、蕭O哲、謝O翰。
本次資料英雄計畫的主題包含法律正義丶社會安全與災害防治。
每個提案都將派遣專家與提案單位進行資料盤點、問題聚焦、預期成果評估等討論,再根據預期成果的社會影響力、資料成熟度、時限內可完成程度、經驗可複製性、以及主管是否積極支持讓成果能確實導入組織運作等面向進行審查,以決定錄取名單。
關於資料英雄的錄取標準,則是以完成專案主題的技能需求為基準,由負責專案的指導顧問進行選秀,根據個人技能與興趣分配。
本期共錄取 24 位資料英雄 。將於 2018/12/17 (一) 寄發錄取通知,若屆時您沒有收到信件請來信 service@dsp.im,謝謝。
Fellows:陳姿君、張赫麟、張家豪、藍浩、潘怡均、吳奇倫、吳又建、林瑜軒
Mentor:謝宗震、楊思
Project Manager:陳映竹
Project Partner:衛生福利部保護服務司
通過文獻梳理,我們發現「風險評估」在兒少保領域的應用在20世紀90年代就已經普及(English & Pecora, 1994),在現如今依然是主要的評估工具。在學術領域,兒少保領域的「風險評估」可被定義為「評估某個既定的(通常是父/母)人在未來可能傷害兒童的一個過程」(Wald & Woolverton, 1990)。據已有研究,通過整理各種主要的風險評估工具,其共同考量的因素不超過三大類別的範圍:兒童特徵或受虐情況,父母特質與家庭環境(尹欣如,2013)。
大數據應用於兒少保領域的風險評估在其他國家早已有所應用,美國聖路易斯華盛頓大學的Jolley(2012)曾用神經網絡模型將風險因素分為靜態因素和動態因素,來預測兒童遭受不良對待的復發。也有學者通過分類和回歸樹分析來對兒童遭受不良對待的復發來進行預測,發現對高風險組有更好的預測力(Sledjeski, Dierker, Brigham & Breslin, 2008)。
一、研究資料與主題
圖 1
主題1:兒少保護通報開案預測
透過通報表資訊預測該案開案與否,提供兒少保社工進入調查階段前案件優先順序參考。分析使用2017年一類案件通報表及關係人基本資料,包含最終開案及未開案案件,共20,165筆。
從通報過渡到調查階段,大量的非緊急案件,現況仰賴社工專業判斷。我們目標是社工不僅是面對當下的通報案件、自身專業判斷,透過分析資料庫中歷史通報案件,建構開案預測模型輔助社工,綜合自身專業與模型結果資訊成為工作排程依據。
圖 2
主題2:共案特徵預測及訪視優先次序分析
兒少保護開案案件中,透過調查報告找出與「保護司與心口司共同列管案件(共案)」特徵類似,但未有心理衛生社工介入服務(未納入共訪機制)之案件,預先提示兒少保社工提高服務密度及敏感度。分析使用2016和2017年一類案件被害人父母調查報告資料,篩選出最終開案的案件,共13,621筆。
進到服務階段,實務經驗告訴我們保護司、心口司兩個單位共同列管個案,必須有較高服務密度。也已建立保護司兒少保社工、心口司心衛社工的「共案共訪」機制。相對的,非共同列管案件就沒有心衛社工介入服務。即便未納入共訪機制的個案,透過共案特徵預測,預先提示兒少保社工提高服務密度及敏感度,仍可提供綿密的服務。
二、分析手法
主題1:兒少保護通報開案預測模型
使用關聯分析找出通報表填報項目選項中影響開案的重要因素。並透過通報表結構化資料及案情陳述非結構化文字資料,結合自然語言處理(NLP)與Random Forest隨機森林技術建立開案預測模型。
Fellows:蔡佳淳、陳上峰、李泓旻、楊思、葉子蓁、張哲偉
Mentor:謝宗震、陳潔寧
Project Manager:呂岱恩
Project Partner:臺北市政府社會局
臺北市政府社會局自民國89年起陸續開辦超過15個脫貧方案,各方案辦理期限約3~5年,由於人力有限,約服務一百多人,開辦前業務同仁需投入大量時間,篩選名單後逐一寄發申請表、辦理方案說明會、受理民眾申請再審查是否符合資格等;過程中,需籌備辦理多元課程、督導學生完成方案任務、關懷學生參與情形等,惟最終完成參與方案者僅占最初參與方案人數的百分之七十,而未能完成方案的百分之三十參與者,多數不願配合方案規定,或其家庭除經濟問題外,還有更迫切的福利需求,而無法達成方案任務。
由於每個個案需花費大量時間與資源,因此如何積極輔導適合對象優先參與脫貧方案,以提高參與者完成方案的比例同時讓有迫切需求的參與者有機會參與服務方案成為優先要務。此次資料英雄計畫透過資料分析找出家戶適合接受的服務,提供業務同仁評估是否適合參與方案,以妥善運用有限資源,提升方案服務效益。
研究資料與主題
本次研究以臺北市100年07月至103年06月的「Young Young 精彩青年培力希望發展帳戶專案」為例進行資料分析,瞭解社會局脫貧方案是否有助於提升家戶平均收入,並找出影響家戶脫貧的家庭類型。
由臺北市政府社會局提供去識別化後有參加及未參加定期儲蓄型方案的家庭特徵,依此資料嘗試回答:
1. 參加方案且脫貧者具何種家庭特徵。
2. 參加脫貧方案與未參加方案家戶是否有差異。
分析手法
在現有的低收家戶資料中,有參加方案的實驗組(A)以及沒有參加方案的對照組(B),均有一定比例的家戶脫貧(A1, B1)。而此專案的主要目的之一是欲藉著資料的分析,找出未來適合參與脫貧方案的家戶,把資源做更有效地分配,讓更多家庭有機會脫離貧窮。
.利用 Gower’s Distance 計算不同組別的家庭特徵相似程度
Gower’s Distance (Gower, 1971) 是用來計算兩組資料的相似程度 (距離),資料的型態可以同時包含類別,數值,邏輯(true or false)。Gower’s Distance 的量測值介於0到1之間,數值愈大則距離愈遠,也就是差異性愈大。
錄取提案
空汙危機追追追(天下雜誌)
台灣十大死因中,有七大和空氣污染密切相關。 其中,空污中最難發現的 PM2.5(細懸浮微粒),更可以穿透一般口罩,直達胸腔,增加各種心血管疾病和提高死亡率的風險。 和OECD的36國相比,台灣的懸浮微粒濃度更高居第二糟。 對抗空污,台灣不能再等。本案希望透過數據公開與資料分析,找出真正原因,化解社會衝突,對症下藥。
▌關鍵詞:空氣品質、空氣污染
脫貧就業:協助經濟弱勢者重回勞動市場(臺北市政府社會局社會救助科)
期待能夠於社福系統篩選脫貧就業名單時,可運用明確之指標,依據個案之就業能力或阻力予以分級分類,訂出分級輔導之優先名單,增加專案開案之人數。
▌關鍵詞:扶貧、精準行銷、個案管理
保護性案件之精準派案(衛生福利部保護服務司)
建立篩派案窗口之風險預判模型,透過通報表及篩案評估欄位,並運用受暴者及關係人之身分串接網絡資訊,經模型運算後得出通報案件之風險層級,並作為評估派往家防中心(高度風險)或社福中心(中低度風險)之參考基準。
▌關鍵詞:兒少保護、風險預測、危險因子
錄取英雄
王O琪、余O駿、吳O建、吳O倫、吳O葦、李O昇、李O沂、沈O璇、林O衡、林O軒、
林O傑、胡O馨、徐O婷、張O豪、張O麟、陳O君、陳O彥、陳O宜、陳O蓓、斯O雯、
曾O毓、黃O揚、潘O均、蕭O資、藍O。
本季資料英雄計畫的主題包含脫貧就業丶空汚分析與兒少保護。
每個提案都將派遣專家與提案單位進行資料盤點、問題聚焦、預期成果評估等討論,再根據預期成果的社會影響力、資料成熟度、時限內可完成程度、經驗可複製性、以及主管是否積極支持讓成果能確實導入組織運作等面向進行審查,以決定錄取名單。
本期共錄取 25 位資料英雄。
關於資料英雄的錄取標準,則是以完成專案主題的技能需求為基準,由負責專案的指導顧問進行選秀,根據個人技能與興趣分配。我們將於近日內寄發錄取通知,請錄取者於 2017/6/25 (一) 之前回覆隨信表單。
Fellows:陳林彣、謝宗翰(皆為台灣 SAS 公司指定代表)
Mentor:劉嘉凱
Project Manager:葉瓊瑜
Project Partner:財團法人法律扶助基金會
法律扶助,是指對於有法律需求,卻無力負擔訴訟費用及律師報酬的人民,提供專業性的法律幫助。財團法人法律扶助基金會成立於2004年,以「為經濟上的弱勢者提供法律的專業扶助,實現訴訟的平等權」為宗旨,由政府所捐助設立的私法人組織。然而,需要扶助的弱勢團體、個人卻可能因為「資訊」或「地理」成本,不知道如何接觸法扶基金會,甚至不知道法扶基金會的存在。
本次專案針對全台22個分會,於2015-2017年的收案案件,結合外部資料(如: 衛福部低收中低收入戶人口、內政部各鄉鎮市區人口……等),建立分會健檢儀表板,分析各地分會所負責各鄉鎮市區的案件覆蓋率、人口特徵以及案件屬性,進而找出現實上被忽略的需扶助人口。
資料來源
由於2015年法律扶助法修改,擴大法律扶助認定範圍,因此本次分析專案所使用的資料主要取用法律扶助基金會業務資料庫2015年之後的資料,總數為21萬筆申請案件,其中包含12萬不重複案件申請人,並將資料去識別化,重點資訊條列如下:
1. 申請人之人口變項之資料,如:性別、年齡、住所資訊、特殊族群身分等
2. 申請人之資力審核相關資料,如:總財產、家戶總收入等
3. 申請案件之法律案件相關資料,如:案件案由類別、案件時間等
此外,本次專案結合外部資料,如衛福部低收中低收人口資料、內政部各鄉鎮市區人口資料、原民會原住民人口資料等,以分析各分會在不同鄉鎮市區的案件覆蓋率、人口屬性與案件屬性。
探索資料 – 需求缺口分析
在本次分析專案中,我們主要使用資料視覺化的手法進行分析,並期望透過分析不同地區申請人、案件案由的分布狀況,提供法扶各分會未來設計推廣活動或合作案時,能更加適地適性與在地化設計。
◆ 台灣概況總覽
上圖為台灣法律扶助案件申請人的分布狀況,每個氣泡代表一個分會聚落,氣泡越大、顏色越橘,代表申請人越多。總體而言,法律案件集中於都會區,尤其以最上方的北北基分會群最多。
上圖為全台特殊身分族群分布,由於特殊身分族群得免審查資力,因此為法扶基金會的主要服務族群。總體而言,「原住民」申請人口最多,其次為「低收中低收入戶」與「身心障礙族群」。
上圖則為台灣法律扶助申請案件的案由分布,次數排名前五的申請案由分別為「債篇」、「毒品危害防制條例」、「傷害罪」、「勞工」、「消費者債務清理條例」。
◆ 分會覆蓋率分析 – 以北北基鄉鎮市區為例
人口基數大的區域,便可能有更多法律扶助申請人,因此不能僅以申請人口多寡來斷定一個區域的需求缺口大小。為了排除人口基數的影響,我們使用「覆蓋率」做為輔助判斷的指標,公式為「該區域法律扶助申請人」除以「該區域總人口」,該指標代表「在一定人口下,有多少百分比的人會申請法律扶助」。
此外,分析特殊身分族群將更具代表性,因此接下來我們針對「低收中低收入戶」、「身心障礙族群」、「原住民」等三個特殊身分族群,於北北基各鄉鎮市區的覆蓋率分布進行分析。
上圖為低收中低收族群於各鄉鎮市區的覆蓋率氣泡地圖,氣泡越大代表該鄉鎮市區的申請人越多,顏色越淺則代表覆蓋率越低;黑色地標由北至南分別代表基隆分會、士林分會、新北分會、台北分會於地圖上的位置。總體觀察可以發現分會周邊的鄉鎮市區氣泡顏色較深,代表覆蓋率普遍較高;而如果將覆蓋率偏低的鄉鎮市區挑出來,也就是圖中有黑色粗框的氣泡,可以發現這些覆蓋率偏低的地區,跟分會的距離都較遙遠。由此可知,「地理因素」對於弱勢族群是否會申請法律扶助是個重要影響因子。
Fellows:黃軍元、劉威凱、施伃蓮、許柏方、吳俊儀
Mentor:陳昭文、劉嘉凱
Project Manager:陳昭文
Project Partner:高雄市政府衛生局
緊急醫療的處理首重於「適當時間將適當病人送至適當醫院」處置原則。然而,當病人醫療需求與提供之醫療資源無法在第一次就醫就媒合成功時,或可能會觸發院際轉診的行為。轉診行為有利有弊,或許可能讓病人得到更適切的醫療照護,但轉診過程所伴隨的潛在的風險,也應被仔細考慮。就整體社會安全網的系統觀點而言,轉診的浮現,在某種程度上也反應出緊急醫療過程中可能存在的照護缺口。若能釐清這問題,也許能讓我們對優化社區醫療配置與建構安全照護網絡有更明確的補強藍圖。
一、研究動機與目的
二、研究方法
三、結果
四、討論與建議
五、研究限制與建議
一、研究動機與目的
緊急醫療生態中,轉診並非罕見事件。而政府規劃的轉診資訊系統也運作了一段時間,但從歷史資料挖掘出哪些經驗洞見,卻一直留給許多實務從業人員一個大問號。緊急醫療資訊優化後的與所引導出的透明當責文化,是我們專案想導引出一個重點。從歷史經驗掏出的規則與脈絡,也將是我們運用資料驅動公共衛生政策之豐厚基礎。我們希望藉由分析緊急醫療生態中急診轉診資料,來解構高雄區域急救責任醫院間的急診轉診行為及觀察緊急醫療系統在面臨壓力時是否有所轉診應變作為,以期能提出更精準的區域資源優化或改善品質的建議。
二、研究方法
資料來源
[急診患者流動分析圖] 呈現急診患者流動情形,一般急診病人來源有三種,由119送達、由家屬送達或患者自行就醫及從其他醫院轉入,而圖中以紅色標記的過程為本次專案主要分析的資料來源,其中包含患者的急診檢傷、診斷、處置、轉院時間及到院時間等訊息。
急診患者流動分析圖
根據高雄市政府衛生局所揭示,急診轉診資料來源共有兩部分,分別為「EMOC高雄市緊急醫療資訊整合中心」和衛生福利部「緊急傷病患轉診電子作業平台」(以下簡稱衛福部轉診平台)。EMOC這個組織主要是聯繫、整合及協調高雄各區的救護資源,而轉診平台是衛福部委託急診醫學會專案所建立的線上轉診系統,目的是希望能夠促進醫院間雙向溝通,讓轉診的流程能夠更順利。兩系統所追蹤的紀錄皆為區域內轉診的病人資料。這兩個系統中,以EMOC的資料欄位較為完整,而轉診平台的資料,闕漏值較多,但其優勢在於有紀錄病人的基本資料,但於本專案分析時皆已隱藏加密。
我們這個專案以EMOC的資料進行高雄地區轉診現況分析,並配合利用衛福部轉診平台的轉診資料,建立一個可以地圖呈現病人轉診流向的網頁。另一方面,當醫院急診發生人物力資源不足以應付急診新病人時(如推床用盡、重大外傷或CPR中等原因),將會循轄區標準機制,向EMOC通報滿載。這部分通報會有時間戳記,其滿載時數與頻率之資料,也會納入我們的分析中,以便評估各急救責任醫院在各月份的量能變化是否會影響轉診行為出現。
變數簡介
高雄市EMOC資料集內包含轄區內24家急救責任醫院的轉出、轉入醫院代號、病人診斷、檢傷分級及轉院時間等資料,我們以醫院名稱及所對應的醫院代碼串聯衛福部提供的各醫院基本資料,如:急救醫院責任分級、地址等資料,結合高雄市政府衛生局所提供的EMOC滿載通報資料進行分析,主要變數之定義及值列於 [變數定義表]。
變數定義表
變數
定義
值
Fellows:王韋勝、蔡志瑋、黃鈺茹、賴宜宏、歐采瑀、詹欣諭
Mentor:陳潔寧
Project Manager:許又仁
Project Partner:新竹縣政府環境保護局
環保議題在台灣是最容易引爆民怨,卻又長年無法令民眾滿意的公共政策領域。其中汙水防治常涉及農地重金屬汙染及灌溉用水安全,涉及的政策範圍橫跨農業領域和食品安全問題。然而,政府權責單位所面臨的困境是「稽查人力不足時常疲於奔命」、「廠商觸犯數個環保法規,跨科室橫向溝通效率不足」、「廠商不只在一個縣市有廠房各縣市環保局無法橫向連結知會」等問題。
根據「行政院環境保護署.環境資源資料開放平台」的開放資料,我們發現開放資料的資料結構,依據各縣市環保局各事業類別,如一般廢棄物、汙水防治…等科室概念分類資料,僅考慮了各縣市環保局各科室回傳資料的結構,並未將資料進行「儀表板式」的呈現,僅將各分類資料進行簡單疊代呈現,在地理圖資上的呈現,也未能提供各利害關係人方便閱讀。
同時也造成各科室之間的資料橫向溝通較為不易,且針對個別廠商在不同汙染觸法事項上沒辦法及時察覺,造成事業單位的管理困擾。而披露的公開資訊亦不足以造成個別廠商自律的效果。 我們針對這個管理上的困難,針對 Open Data 的資訊整理,進行了便利看板的設計,並結合地理圖資,以汙水防治作為範例,進行資料的整理與分析。
計畫目標希望弭平民眾、政府權責單位、列管廠商之間的資訊落差,透過便利看板的揭露,讓環境污染稽查更有效率,賦權政府機關更有效率提供民眾期待的環保治理,並透過透明化資訊促使各列管廠商自律。
資料來源
新竹縣政府環保局提供內部資料:管制公司
行政院環境保護署.環境資源資料開放平台:下載新竹縣相關資料(包含基本資料、裁處資料、河川管制區、河川水質監控數據等)
透明足跡
全國商工行政服務入口網
公司名稱 & 股票代號對照表
股票網站
系統構想
由於環保署提供之基本資料較為詳細,如下圖所示,因此,首先篩選列管類別為水汙染之公司,藉由管制編號視為 key值,將環保局內部資料之流域別進行join整合,賦予每一家管制公司排放汙水之流域別,並進行地址對位 geocoding。
我們從局處整體的角度思考設計了三個頁面,以瞭解局處內部裁處情形和各公司裁處狀況。
1.各事業別TOP5裁罰公司
以各科室之管制事業進行統計,計算出該時間點發生裁處事實之前五名公司,藉此督促相關單位進行監督。
Fellows:黃卉怡、柯景泰、林芃彣、楊佩雯、游家鑫、張育慈
Mentor:劉嘉凱、梁智程
Project Manager:蔡子揚
Project Partner:誠致教育基金會
緣起
如何衡量學生學得會?
均一教育平台致力於提供所有學生「均等」且「一流」的學習機會,以此做為我們的使命。均一教育平台設計是以個人化學習為概念,我們深信要落實個人化學習,必須尊重每一個孩子不同的特質與現況,並搭配「精熟學習」與「成長心態」之教育理念,讓每個孩子重新體驗自己有學會的機會!
近年來,不論是線上或線下,均一夥伴們皆努力探索不同的可能性,希望能與學校家庭共同合作,幫助孩子們在基本學力上的進步,而我們也常常問自己,孩子們真的學會了嗎?因此在數據上的蒐集與分析不停精進,希望能透過客觀可靠的科學方式,為我們的產品作改善,2016年更與台大林明仁教授進行專案合作,分析宜蘭縣的小學生,經過兩年學習歷程看到,宜蘭縣的學生能使用平台3.5小時,且在均一教育平台上獲得超過13個練習題組精熟,學力檢測能提升14.2個PR值,這讓我們更有信心相信我們確實有幫助孩子們進步。
但是,我們不能因此驕傲自矜,在教育的路上我們仍有很長的一段路要走,證明了我們的產品確實可以幫助學生之後,更要知道是什麼地方確實幫助了學生?學生在學習上如何更有效率,讓進步的幅度能更上一層樓呢?線上線下,平台跟老師家長可以怎麼配合?這些都是我們希望能釐清的題目。
思考
聯合所有正面力量
我們常常聽到說:「不要重新發明輪子」。在誠致內,我們也常常告訴自己,要善用槓桿,聯合所有正面力量,站在巨人的肩膀上,讓自己更有效率地利用資源,於是在今年年中當我們看到 智庫驅動-D4SG資料英雄計畫,與公共服務性組織合作,選擇兼具高度社會影響力與再利用性的資料科學專案,並媒合民間熱血的資料英雄,利用三個月的工作時間共同完成,同時,有著熟稔資料科學的mentor們會帶領專案前進。我們認為這是一個很好的機會,利用均一內部大量的數據,結合外部人才在資料上的知識,希望能夠發揮1+1 > 2 的力量,了解往後平台在資料搜集與功能上可以做什麼改善,做到更緊密結合「網路」、「數據」與「教育領域知識」,進一步發揮教育科技創新。
同時,我們也希望能做到以下:
軟體公司的思維跟經營,重視速度與 O2O(Online to Offline)交叉運作
發揮團隊執行力,善用數據分析,避免斷點
公開透明 – 主動公開使用數據,取信於社會,並拋磚引玉,希望台灣其他MOOC也能公佈數據
過程
高手在民間
鄉民說得好:「高手在民間」。在D4SG計畫中,我們發現參與者背景非常多元,有上班族、主管經理、研究生等,不僅在本身領域上面有所成就,也願意奉獻自己的時間參與公益計畫,真正讓我們體會到 Data