Emergent Medical Data

◎ 林昕璇 (中央研究院法律學研究所博士後研究學者)

一、Emergent Medical Data(EMD)的語源

學者Mason Marks 2017年發表之短文《Emergent Medical Data》首次提出Emergent Medical Data的概念,並試圖界定為「與健康沒有直接關連,而從各種細瑣零散(trivial)行為中推論(infer)或推測出來的健康資料或醫療資料。」這些資料與傳統醫療數據(Traditional Medical Data)形成一組對立的概念,相對於傳統醫療數據是取自病人自願交付於臨床診斷和醫療院所的病歷資料,從而受到健康保險可攜式及責任法(Health Insurance Portability and Accountability Act of 1996)的保障。EMD則是從社群媒體、影音搜尋引擎等非醫療場域取得,法律保障也因此付之闕如。

演算法可以從人們的行為推斷健康狀況,即使是與他們的健康沒有直接明顯聯繫的行為資料,並從中辨識出「潛力無窮」的訊息,進而成為疾病控制和公共衛生治理的有力工具。 Mason Marks在《Emergent Medical Data》與《Emergent Medical data: Health Information Inferred by Artificial Intelligence》兩篇著作中均指出和主張在演算法和機器學習加持下,科技公司可以分析社交媒體,以偵測傳染病的暴發蔓延,或者透過用戶在Youtube上觀看的影片、信用卡消費紀錄探勘,以識別懷孕的客戶據以投放個人化的商業廣告,並追蹤人們的動向以預測誰可能自殺。這些分析行為之所以成為可能,是因為個人用戶不斷與家庭,工作場所,學校和公共場所所提供的網際網路和科技工具進行交流互動所產生的數位足跡,使得上述的推測、監控與追蹤技術有大量的數據來源足以利用。

二、EMD包括哪些數據?

當一個人與各種科技產品互動時,會留下其行為的數位足跡。 這些數位足跡為AI、機器學習和大數據演算法蒐集並分析,並轉換為敏感醫療數據的資訊。在緊急醫療數據挖掘過程中蒐集的特定資訊來源包括:Facebook的按讚和評論、在Amazon和Target的購買紀錄,以及Twitter和Instagram的貼文。

三、蒐集處理利用EMD之流程

學者Mason Marks歸納EMD如何被探勘的流程如下:

  • Collection Stage 1: 從廣泛人口群體中的個人身上,蒐集數位足跡和健康資訊。稱為「訓練母體」(training population)。
  • Training Stage: 以階段1蒐集而來的資料對原初EMD的探勘演算法進行訓練。
  • Collection Stage 2: 以EMD探勘鎖定的人口母體為對象,蒐集數位足跡。
  • Deployment Stage: 藉由既已經過系統初步訓練的演算法,將數位足跡轉換為EMD。
  • Application Stage: 利用產出的EMD推測標定群體的健康狀況,進行個人健康狀況相關的歸類、定序與分級。

四、科技公司探勘EMD的具體事例

Google與Verily為首的科技公司,藉由探勘EMD預測哪些人可能自傷自殘或企圖自殺。Facebook偵測到使用者企圖自殺的風險偏高後,會聯絡警察並將其引導至使用者的住居所。2019年川普也宣稱將使用類似的科技偵探精神疾患的高風險群並藉以避免大規模槍擊案。值得注意的是,一份Facebook社群網路的研究報告發現,社交媒體上的張貼的訊息和語彙與潛在的醫療狀況相關。該研究包括了999位患者的患者病歷和Facebook狀態。這項研究表明,僅憑藉Facebook的貼文,就可以有效地診斷識別出患有糖尿病和精神疾病的患者。

這項研究探討用戶發表於社交媒體的內容是否可以預測21大類的醫療狀況,實驗數據取自999個已經過自願性同意患者在社群媒體寫下的2000萬個字彙和留言,譬如用戶在臉書貼文「噢!我的胃很痛,等下還是要出門 : (」、「誰來幫幫我!」和「有女兒伴我左右我感到被祝福」,以預測或推測他們患有過度亢奮、消化道症狀或憂鬱的可能。結論上,臉書語言大幅度地提高了21種疾病類別中18種的人口統計學變量的準確性,尤其在預測糖尿病與包括焦慮、憂鬱以及精神錯亂的心理疾患上,尤見效果。

社群媒體在人工智慧和機器學習的演算法加持下,扮演一個量化的鏈結,連結到患者的日常生活中,從而為研究和評估行為和環境疾病風險因子提供了途徑。這一份報告中同時指出Facebook將電子病歷數據與行使同意權的患者的社交媒體數據進行交叉關聯分析後,發現從患者的Facebook動態更新可以預測許多健康狀況,這也意味著使用社交媒體資料確定疾病發作或惡化的機率,藉此作為醫療介入干預措施的理性判斷的正當化基礎,是一個可行的工具。研究流程可視覺化如下表:

Photo Credit: Merchant RM, Asch DA, Crutchley P, Ungar LH, Guntuku SC, Eichstaedt JC, et al. (2019)
Photo Credit: Merchant RM, Asch DA, Crutchley P, Ungar LH, Guntuku SC, Eichstaedt JC, et al. (2019)

此外,2019年11月下旬Google與醫療保健組織Ascension合作的Nightingale計劃的曝光也加劇人們的擔憂,並引發了關於未經患者同意所蒐集的數據是否可以轉換為EMD並用於經濟利益的爭論。這項計畫使Google無需取得醫生知悉及患者同意的就可以獲取近用超過5000萬則患者在社群網路上的發言和貼文。

五、EMD的概念化

目前被廣泛引用,由學者Mason Marks發表之《Emergent Medical data: Health Information Inferred by Artificial Intelligence》一文,提出六大概念化緊急醫療數據探勘(Emergent Medical data Mining)的標準,臚列如下:

(一) 規避隱私法規的套利行為

相較於傳統醫療資料是從正規的臨床管道如醫院,醫事人員在踐行告知後同意(informed consent),與嚴守醫病信任關係下提供之,EMD則是透過各種數位科技手段從人類日常生活中以隱密的方式取得。尤其是EMD的取得與處理利用,是透過智慧型手機中的應用程式暗中蒐集資料,未取得用戶的真正同意,構成不該忽視的個資風險。

(二)違反情境脈絡完整性

此主張由學者Nissenbaum的「情境脈絡完整性」(Contextual Intergrity)理論延伸而來。蓋EMD是取自網路社群的使用者在臨床醫療的場域之外的社群媒體中的發言和行為,用戶在行為當下並未知悉該資訊後續將被科技公司轉換為醫療目的、公共衛生與疾病控制之目的外使用,已逸脫用戶對於合理隱私期待的預設與傳統資訊流的情境規範。

(三)是未經授權下執行醫療行為(Practice of Medicine)

探勘EMD的科技公司聲稱推廣用來偵測焦慮及失眠的App,只是「促進健康福祉」(wellness apps)的應用程式,而非健康程式(health app)。然而這些軟體平台,實質上已具有診斷、預防及處置疾病的功能,從而落入禁止未被授權之公司和個人執行醫療行為的範疇。

(四)是未經規範的健康研究

臉書於2014年「Emotional Contagion」實驗中,操縱689,003位用戶的新聞推播服務,並測量他們的「情緒反應」(the effects on their emotions)。此外,目標廣告投放(Targeted Advertising)也可能構成A/B test 測試,是未經妥善規範的人體實驗 (experimentation on human subjects)。

(五)違反對資料主體的受託與信賴義務

憲法學者Jack Balkin提出資訊受託人義務以課予科技業者合法利用客戶個資的法律義務,試圖平衡公司與個人用戶間資訊權力與知識的不對稱。從此理論以觀,臉書、Google向來主張他們重視並捍衛用戶權利,理當也應該在EMD探勘分析上善盡對資料主體的受托義務,但他們卻沒有善盡此一處理利用受託資訊的善良管理人注意義務。

(六)是未經規範的醫療器材操作

美國FDA宣稱,有鑑於「促進健康福祉」(wellness apps)的APP旨在緩解失眠或焦慮的功能,可能該當聯邦食品、藥品和化妝品法(Food Drug and Cosmetic Act)關於醫療器材(Medical Devices)的定義,但該法採行過時的風險評估機制,僅將規範標的限縮於構成「物理損害的傳統醫療器材」(physical injuries caused by traditional medical devices),如核磁共振和呼吸器,而未能涵蓋這類情緒偵測、管理及緩解治療的線上APP,故EMD探勘的行為可能也可以被評價為未經妥善規範的醫療器材操作行為。


參考文獻

« Back to Glossary Index