咳幾聲咳嗽,在不久的將來,人工智慧的技術就能判斷你有沒有得新冠肺炎

◎ 劉祥裕

*本文經授權轉載自中研院法律所資訊法中心,2021/10/22發佈
*本研究感謝科技部「AI人文法制基礎建置計畫」支持

Image by Samuel F. Johanns from Pixabay

根據英國廣播公司(BBC)最新的報導,英國政府近日開始號召國民,透過簡單的方式,例如個人的智慧型手機或是個人筆記型電腦,對著裝置的收音處咳嗽個幾聲,就能夠藉由人工智慧之技術,判斷你是否得了新冠肺炎1。英國政府與富士通公司(Fujitsu)簽約建立“Cough In A Box”的平台,正希望蒐集更多的資料,來提升預測的準確率。

早在2020年九月底,麻省理工學院(MIT)的研究團隊在IEEE Journal of Engineering in Medicine and Biology 上發表的論文指出,以卷積神經網絡(CNN)為基礎的模型,透過運算經處理之個人咳嗽的聲音檔,得以成功地察覺出無症狀感染者。由於無症狀感染者身體上未出現症狀反應,因此他們較難以判斷自己是否已經感染,或是不是需要篩檢。也因為他們沒有意識到自己可能已經染病,更容易在不自覺的情況下,便把病毒傳染給他人。MIT研究團隊在去年發表的期刊上指出,其所訓練出的人工智慧模型(Artificial Intelligence model)發現無症狀感染者的咳嗽方式與健康者間的方式不太一樣,且這差距是人耳無法辨別卻能由人工智慧挑出2

然而,早在新冠肺炎之前,該團隊就曾訓練出透過以手機錄音的咳嗽聲,成功診斷出肺炎及氣喘的演算法。奠基於相同的方式,該MIT團隊更嘗試以AI模型來分析刻意咳嗽(forced-cough),藉此來偵測阿茲海默症的徵兆(阿茲海默症不僅與記憶衰退相關,也跟神經肌(neuromuscular)衰退,如聲帶萎縮有關)3。當新冠肺炎在2020年初開始肆虐全球時,MIT團隊的主持人便設想能否以該阿茲海默的AI架構來診斷新冠肺炎,特別是當時有越來越多的證據顯示,受病毒感染者往往歷經相同的神經症狀,例如神經肌的損傷4

因此,MIT此計畫於2020年的四月至五月,便蒐集超過七萬份的聲音檔,相當於20萬餘次的刻意咳嗽。在這七萬份之中有2660份為確診案例,而這些確診案例中亦包含無症狀感染者。資料蒐集的過程是請每位自願受試者,用自己的手機或筆記型電腦,錄下平均三次的咳嗽聲,並且再請受試者回答十題的多選題,這些題目攸關於疾病的診斷與受試者的個人基本資料。前者疾病的診斷,包括是否有出現症狀,以及何時出現這種醫療診斷之結果;該診斷結果是由正式檢驗得出、醫師的判定又或為自行認定;幾天前出現哪些症狀?(症狀則涵蓋發燒、疲倦、喉嚨痛、呼吸困難、持續的腹痛、腹瀉與咳嗽等)。後者所指的基本資料則涵蓋年齡、性別、國家、地域等。

從該論文可知,該計畫把全部蒐集的2660例的確診個案全部作為模型的訓練資料, 並再隨機挑出相同數量2660例陰性反應的健康者。故該研究是以總共5320例的刻意咳嗽聲音檔與診斷資料,作為AI模型的資料集。而這之中的80%作為訓練用途,剩下的20%則拿來驗證。該計畫最終發現,此模型能成功地從咳嗽中辨識出確診者的成功率達98.5%,而在這些辨識出的咳嗽中,能精確地篩檢出所有無症狀感染者的咳嗽。他們的新發現,可說成功地開啟透過個人的行動電話即能預測潛在的疑似病例,而毋庸購買快篩試劑來測檢的需求。不過根據報導,此MIT團隊依舊強調這個模型不是用來診斷出有症狀確診者、又或是用症狀來決定是起自於新冠肺炎還是其他原因,例如流感或氣喘,反而強調是區分無症狀感染者的咳嗽與健康者的咳嗽。

筆者認為這個研究相當新穎,不過還是有一些待釐清的地方。令筆者疑惑的地方在於研究中的取樣,當事人所回報填寫的Covid-19診斷,有近乎半數(46%)來自當事人的判斷。在該論文中並未見詳盡說明何謂個人的判斷,筆者姑且暫論為居家快篩試劑之結果,但現今眾所皆知快篩試劑可能有所偏誤,存有偽陰與偽陽的可能性,還需要有PCR檢測才能真正斷定是否確診。因此該模型所訓練的資料有近乎半數是出自個人的診斷,該咳嗽聲是不是自真正確診者及是不是為漏網之魚的可能性,造成嚴謹度受到相當質疑。

回到英國現在正廣泛蒐集的研究計畫,據報導英國政府去年底即以11.8萬英鎊與日本富士通公司締結合約,希望由富士通公司開發潛在可用的應用程式。在今年三月,已展開小規模的研究測試。而現在,英國健康福利照護部 (Department of Health and Social Care) 進一步以11.9萬英鎊之合約,委由Ipsos MORI市調公司擴大該計畫的資料蒐集範圍5。此次計劃資料蒐集的對象是成人,且是72小時內曾做過Covid篩檢測試。在該計畫的網頁上,自願參加的人需上傳他們收到快篩試劑上結果之條碼。

英國政府在此收案的說明中指出,受試者須錄製聲音檔,包括說一段句子、呼吸聲、以及刻意咳嗽。除了音檔,還須填答自己的醫療史、吸菸史、症狀與自己的母語。這些資料填畢後,也須填寫快篩試劑上的編碼,此組編碼會用來連結上述的聲音檔、新冠肺炎測試結果與一些個人資料,個人資料包含何時與何處收到此受測結果、年紀、性別、族群(ethnicity)、接種疫苗之狀態以及現有的症狀。

根據筆者進入官網的受測入口實測,錄音檔的內容首先是念一段句子:「I love nothing more than an afternoon cream tea.」,此研究下方清楚寫道,之所以會請受測者念此段句子,是因為有一些關鍵的音(例如:“aaah”、 “oooh”、 “eee”)能協助判斷受測者的呼吸道健康狀況。接著是測呼吸聲,請受測者在發出一聲「ㄏㄚˋ」之前,大聲的吐氣三次。在「ㄏㄚˋ」時,就想像自己正在對窗戶吐氣。最後一項,則是分別錄製咳嗽一聲與咳嗽三聲的聲音檔。

總體來說,藉由AI來協助我們一般人判斷自己有沒有得新冠肺炎,此研究之發展依舊相當可期。因為當前新冠肺炎逐漸被專家認為有流感化趨勢,代表未來篩檢的需求依然存在。這項技術的成熟,確實能夠運用在無法負荷大規模或天天篩檢而缺乏足夠量能的國家。若改以一項不具侵入性、迅速且低成本的前測工具,作為疫情控制的手段,那未嘗不是件好事。再加上以台灣的例子,現在市面上快篩試劑的售價,對於學生族群來說,是相對難以負荷的價格。況且現在人手一機,用行動裝置來篩檢的方便度遠勝於戳鼻子試劑。惟同時間還是要強調,此檢測工具要能夠精準,才能真正發揮其最大的效用,才有作為替代快篩試劑的可能。

最後,英國現今的收案跟美國研究團隊的方式也略有不同,也值得注意後續的發展以及觀察英國政府如何妥善運用資料。舉例來說,相較於美國的例子,英國政府此次蒐集更多類型的聲音檔,包括受試者的一句話,也蒐集受試者的更多個人資訊,這些都並非MIT團隊的內容。因此,在英國政府試行該項政策的時候,蒐集的相關個人資料,是否能夠妥善運用都是須要留心的地方。