「到院前心肺休止」(OHCA) 風險地圖
為期四個月的資料英雄計畫,一群來自不同背景的資料夥伴被集結。從程式開發、統計分析、資料探勘到系統開發不同的技能,有人是醫學系學生,有人是消防隊緊急救護員志工、還有醫院急診部的醫師。「透過資料力,讓急診救護達到正向的循環」,這樣共同的想法將我們聚在一起。與提案方高雄市衛生局進行合作,引入資料科學的方法論,對高雄地區的歷年救護資料進行分析,為緊急救護與醫療界盡一份力。
OHCA(Out-of-Hospital Cardiac Arrest ,到院前心肺休止)是指病患在送達醫院的急診室前出現心肺功能停止之情況。當心跳停止達四分鐘時,腦部將會因為缺氧而受損;當超過十分後,腦部就可能達到永久損害而成植物人。因此,OHCA 病患的分分秒秒都在與時間拔河,在急重症檢傷分類中視為最優先處理的案例。
搶救黃金時間,不能只靠一己之力,必須仰賴上、中、下游的資源整合。「生命之鏈(Chains of Survival)」從社區、消防端、急診端及照護端整合眾人之力,透過五個環環相扣的流程,提高急救復甦及癒後健康的機會。
(https://i.imgur.com/rGYnl0T.png)
根據「熱區辨識」、「危險因子分析」、「緊急醫療優化」三個角度,定義了下列三個具體的問題,並預期從資料中解析出改善之道:
- 了解 OHCA 發生風險及其因素
- 了解 旁觀者 CPR 介入情況與效益
- 了解 社區救護資源分配優先順序
資料旅程 Data Journey
採用的資料集主要分為兩份資料:
- OHCA 救護資料集 : 2010-2016 的 OHCA 消防端+醫院端資料
- 外部資料集 : 空氣/溫度/人口公開資料
我們針對了「OHCA 救護資料集」當中重要的 36 個欄位進行初步的資料健檢,平均損失率達 24 %。也就是說,約有八成的資料是可以使用的。除了資料缺失之外,總結下列幾種常見的問題:
- 「時間」格式與「年齡」的格式不一致或敘述太雜亂
- 消防端的「送達醫院」,與醫院端的「急救醫院」不同
- 「出勤到達時間」過於口語
- 「姓名」與「ID」加密過程中造成資料重疊
資料清洗的過程中,
資料探索 Data Exploration
在進入資料建模之前,我們利用了描述性統計即資料視覺化的方法對資料進行的初步的探索。
OHCA in Utstein Style(Sankey Diagram)
Utstein style 格式是一種針對心肺功能停止病患之發生與預後所制訂出來的一種報告格式。目標是希望使用相同的資料格式,用來追蹤不同時期與單位對於 OHCA 患者的救護成效。在我們的專案中,我們亦採用類似的方法來整理資料。不過受限到資料不足及考量到本地的需求,我們也對資料呈現上做了一些調整。
首先,我們將所有的 OHCA 病患依據創傷
與非創傷
作為第一層分類。創傷患者大多數來自於外力撞擊所導致,非創傷則可能是病患自發性的心肺休止。第二層我們考量到有無旁觀者 CPR
,在過去的文獻裝,旁觀者 CPR 被視為預後狀況的重要因素之一。第三層我們篩選出了恢復自發性循環心律
的患者,他們通常代表具有較高存活出院可能性的一群。最後,檢視了存活出院
,及恢復良好神經學功能
這兩種條件。從上圖可以看到,所有發生 OHCA 的病患中,一層一層的與死神拔河,最終能夠健康回到生活的只有約 1.5 % 左右。也就是說,在 OHCA 處置的過程中,每一步都相當重要,必須要層層合作與戒備。
資料模型 Data Modeling
OHCA 風險評估
利用Poisson Log Linear for Rate Model
對OHCA個數建模,發現放入的三個解釋變數(溫差/PM2.5/時間區間
)皆具有統計顯著性,溫差: 溫差越大OHCA發生率越高; PM2.5: 空汙指數越高OHCA發生率越高,不過到空汙指數最高的等級區間,反而稍微下降; 時間區間: 以深夜休息時間(十二點到七點)發生率最高。
根據OHCA風險評估,可以了解高雄地區OHCA 發生風險。
環境因素確實會影響 OHCA 發生率,極端的溫差(>10度)與嚴重的空汙(>36μg/m3),著實會讓 OHCA 有更高的機會發生(風險增加1.3倍)。
OHCA 存活模型
根據文獻資料,發現有旁觀者CPR介入會顯著提升存活率與出院神經學表現,因此想觀察高雄是否有類似狀況。
如果只針對旁觀者CPR建模,其 odds ratio 為 1.12,表示當有旁觀者CPR,其恢復自發性循環(ROSC)機率較高(約比沒有旁觀者CPR高出12%的機率)。
再進一步考慮個案基本資料、旁觀者是否介入CPR 、救護車反應時間、溫差、PM2.5等變數,想找出分別影響ROSC、病患離院狀況、出院時意識狀況最大的變數。利用 logistic regression , 並用使用AIC來選出重要變數,隨著每一次逐步回歸的結果,希望讓AIC越來越小。分析結果如下表所示:
根據OHCA存活模型,可以了解高雄地區旁觀者CPR 介入是否如預期顯著提升。
特別針對旁觀者CPR部分,其 odds ratio 為 1.12,表示當有旁觀者CPR,其恢復自發性循環(ROSC)機率較高(約12%)。
結論與展望 Conclusions
從「資料旅程」、「資料探索」到「資料模型」一連串的資料分析中,我們嘗試了各種不同的觀點去俯瞰資料。針對了發案單位高雄市衛生局的問題,我們建立了不同的方法來分析。「資料風險評估」找出了如何從外在環境與時間點來做警示;「資料因子分析」找出了哪些原因屬於重要的影響因子,可以未來資源分配的著手點。
在這次的專案中,我們見證了資料與公益的可能性。OHCA 是緊急救護過程重要的一環,救護端與醫院端扮演著第一線的守護。而我們,D4SG,從資料科學的角度切入,提供了不一樣的觀點,作為未來資源分配予調整時的建議。緊急醫療資料是重要的資產,在這次的機會中,我們探索了這些資料的可貴與價值。這是一場緊急醫療資料生態的⺠主化轉變,希望可以號召更多有志之士進來挖礦,伴隨資訊透明後的洞見產生與當責文化。
從 D4SG 作為一個開始,讓資料科學的種子在整個緊急醫療生態萌芽。
心得回饋
張力中:「到院前心肺休止(OHCA)」病患,能不能有更好的結果(預後),一直以來都是緊急醫療系統所有成員奮鬥的目標。我因「軟體開發者」與「緊急救護技術員志工」雙重身分,剛好能在此專案上貢獻自己的心力,感到無比的雀躍。尤其是能認識這次專案的超強隊友(神隊友),超強顧問(神顧問),大家無私的貢獻己力、互相幫助,讓我對跨界團隊合作、資料數據分析各方面得到了很多衝擊。最後也感謝高雄市衛生局擁有冒險家的精神,願意把重要OHCA資料開放給我們,我們也很慎重地的看待,希望這樣的種子能持續發芽,打造更強韌的「生命之鏈」。
張維元:對於一個 Data Enthusiast 而言,沒有什麼比分析真實資料更令人興奮的事情了。除此之外,還能夠認識一群厲害的隊友、專業的顧問,一起埋首在資料堆當中奮戰與激盪,是一個令人難忘與開心的過程。D4SG 是一個很棒的場域,除了可以接觸到真實的資料,也能夠更踏實的解決問題。
張雅婷:參與專案的收穫遠比我原先預期的多太多。一連串處理資料以及與來自不同背景的夥伴共同激盪的過程,非常的過癮。醫療服務一直是我很感興趣的領域,期待未來能看到更多跨領域的合作,改善整體醫療資源。也感謝D4SG提供這樣的平台,讓每一位默默耕耘、埋首於自己領域的成員們互相遇見,激發出更多的可能。
林晏平:一直有在關注D4SG的活動,很欣賞跟認同「用資料做公益」的理念,所以當得知D4SG在招募資料英雄且主題正好是緊急醫療服務(EMS)時,沒有想太多便決定報名了。(「能救人的資料科學」,光用想的就覺得太性感了呀XD)
經過前期不斷的開會討論與修正,專案目標逐漸清晰,分工也開始明確,雖然這次自己主要是負責建立視覺化動態地圖的部分,不過團隊成員們無論在資料清理或統計建模也都樂於分享交流,團隊氣氛十分融洽!同時這次的專案也讓我有機會檢驗自己在資料分析、資料科學這塊領域中的所學,是否能「經得起考驗」,才知道自己還有好多不足的地方,尤其是統計建模,距離真正拿上戰場實用還有一段不小的差距,這次的體驗對我個人來說是非常大的提升。最後要感謝D4SG、昭文醫師、CK、以及所有夥伴,能有幸參與這次專案,小弟實在獲益良多!
胡中瀚:第一次參與專案,選擇了D4SG—是因為它主打可以真正的解決一些問題,去處理現有社會中存在的現況。參與了一小部分的資料清理以及繪出基本的資料趨勢圖,在課業之餘即早了解醫療產業的現況令我收穫很多,也看到了如昭文醫師這樣的往其他領域學習令人敬佩。邊看邊學習,除了R能力、統計力、模型力甚至繪圖力、簡報力都提升了,感謝這群資料英雄夥伴。
宋培源:D4SG是一個提供多元資料的專案組織,對於資料工程有興趣的學生與社會人士都可以從中找尋到樂趣,透過開放的討論以及技術的交流,都能有效的提升自我的能力,而我覺得讓我學習最多的是如何組織整體專案的流程,有效率的合作以及溝通。另外,如果了解整個OHCA發生的流程與結果,更能體會這筆OHCA資料的寶貴,也讓我理解到在處理資料的同時,應更珍視並且更謹慎以及小心。
王宜婷:利用統計分析從資料中挖掘出有用的資訊,創造出有用的價值回饋社會,我覺得是一件很棒的事。很高興自己遇到了這麼棒的夥伴,還有昭文醫生,從中學習到很多,真的非常感謝。