◎彭松嶽 (國立陽明大學科技與社會研究所助理教授)
◎原文發表於《新聞學研究》

AI不僅已經廣泛存在於日常生活當中,且正透過持續的創新,重新定義日常生活進行的方式。智慧手錶、手環和其他穿戴裝置可隨時地搜集個人生理與心理相關的數據,提出以更健康方式生活的建議,還能隨時監督並在建議被忽略時進行提醒。而智慧助理、虛擬管家或未來的伴侶機器人,則能鉅細彌遺地將日常生活的言語、眼神或肢體等互動過程,以數據形式紀錄並分析,來達成使用者渴求的生活或陪伴方式。
數據搜集是能完成這些AI創新的根本,但卻也是需要時時刻刻謹慎檢視的面向。人臉辨識的演算法會有種族、區域、性別等偏見,因為搜集來進行演算法開發與訓練的數據本身即帶有這些偏見。此外,AI創新的過程中,往往會複製科技以及透過科技進行搜集的數據,將其視為客觀、不受外在因素干擾、持續的進行,也因此其分析的結果與進行的判斷也同樣是客觀且未受干預的。然而,這樣的預設是否與實際將日常生活數據化的實作相符,也是同時需要謹慎思考的面向。
究竟日常生活數據化的實作是如何進行,以及對產出的數據有哪些影響,我們可以透過不同的運算日常生活,或將個人與日常生活數值化的實作,如數值化自我(quantified self)和將生活日誌化(lifelogging)進行瞭解。
Google Glass的使用是早期運算日常生活的例子。除需緊貼頭部之外,因為在使用過程中運算會產生熱,所以使用者需要不時地將其移離開頭部降溫、以比較不耗費運算資源的模式使用或是另外撰寫軟體程序(script)以即時監控眼鏡的溫度。這些調整的方式雖然是尋找運算日常生活的最佳化方式,但同時也是對日常生活的重組。穿戴著Google Glass的人需因各自程式語言知識、經驗、技術,和耐熱能力的差異,而產生彼此各異的方式來進行日常生活以及運算。受到這樣的運算實作影響,蒐集到的數據本身不會以穩定與連續的方式產出,而且是不確定、易變的,會隨著穿戴裝置過熱的出現與減緩而變得存在或缺席。
此外,數據搜集的過程也非以不受外在影響的、客觀的方式進行。以穿戴式攝影機為例,雖然市面上有各種不同的攝影機,但這些產品因技術相似性高,所以使用穿戴式攝影機能夠紀錄的範圍是相對特定的:如十呎左右的半徑範圍、約65度的廣度、特定的紅外線紀錄能力等。而且,為了持續地捕捉日常生活進行的片段或影片,攝影機的設計能夠別在外衣或是背包上,如此可讓使用者安裝好後,不需要再介入紀錄的過程。但實際上攝影機不論是繞過脖子掛在身上,或是直接別在衣物上,往往是落在胸口左右的位置。上述科技產品功能的趨同,以及實際穿戴方式的相似性,都會影響數據搜集的過程,使得日常生活的數據是在受到特定的技術與社會邏輯的影響下產生,而非如同最初預想般的以全面、不受干預的方式進行。
日常生活數據的搜集同時還受到其他人直接或間接的、預期中與未預期的影響。在一次與進行生活日誌化的受訪者對談過程中,他重述了數據實作受到直接且未預期的影響的過程:在他進行生活日誌化的期間,參加了一場朋友舉辦的party,同時想藉此機會用攝影機紀錄他的生活;然而在party的現場,他卻開始擔憂這樣的紀錄會不準確,因為在party現場的人即使他不認識,仍然對於穿戴著攝影機的他以及他這樣做的原因感到非常地好奇。也因此,他開始說明他為什麼想要紀錄生活,或怎麼使用攝影機,而對他而言:「我一點都沒有預期到會是這樣。大多數的時候他們先出現的反應是:這個傢伙到底要做什麼?但是當你開始解釋給他們聽,他們開始覺得有趣,而且覺得對這樣的計畫開始有興趣。」(訪談逐字稿)
雖然對這位受訪者而言,他最大的擔憂是這樣的紀錄並沒有「如實」紀載他的「一般」生活,然而這也呈現出日常生活中數據實踐的不確定性,一方面因為眾人的善意與好奇使得數據搜集得以進行,但另一方面因此產生的數據「很可能是錯的,因為某些人跟你說話也許只是因為你穿著一台攝影機」。
Gina Neff與Dawn Nafus在Self-tracking一書中討論他們針對自我數值化的社群與實作進行的研究。在此書中,他們即談到社群聚會中的show and tell,是自我數值化熱衷者討論與分享實作經驗,以及數值化過程中遭遇的挑戰之重要場合。這樣的交流提供熱衷者相關的靈感,與實際數據搜集過程中,哪些日常生活數據可以搜集、可以運用何種數位或非數位之工具進行、搜集過程中若遭遇困難可以如何調整數據搜集方式以持續進行等,也間接促成對這些特定面向持續數據化。
綜合上述對數據實作的探討,可以發現數據搜集的過程乃是受到不同科技與社會秩序的影響,且數據搜集的過程並非完整的、連續的或不受干擾的進行。此外,將新的科技物品引入日常生活當中,會造成日常生活進行方式的改變,也因此,蒐集到的數據是處在特定的社會與時空脈絡之下的,僅能呈現此特定脈絡下的生活風貌。
以此方式思考數據實踐與AI創新,同時也強調運用AI創新運算、分析日常生活,或據此進行社會與國家的治理時,會有超出預期的想像與後果產生。在新冠疫情肆虐的過程當中,症狀追蹤與分析技術、數位藩籬、社交追蹤程式或疫情儀表板等,在如台灣、印度、以色列、捷克、德國等國家受到運用。但相關的技術運用與開發,往往延續既有對數據創新的想像,希望透過更接近日常生活方式進行個人數據搜集,達成及早發現、追蹤與預防疫情擴散的目的。
這些措施如何能夠有效地達到防疫的目的需要持續的探索,且同時也必須考量當這些數位防疫科技成為促進集體健康的重要措施時,有可能造成數據實作與日常生活進行方式兩者的同時轉變。例如進行數位藩籬監控時,都市中擁擠的角落或是非都會區的定位會有較多偏差,因而使得在這些區域進行檢疫或隔離者,會更頻繁地收到警訊而造成更大的心理壓力。對於個人身體體溫或相關肺炎症狀的資料搜集,有可能會因為恐懼而不願如實地登錄資料造成分析與防疫上的誤差。透過地圖或儀表板呈現各地方的疫情訊息時,亦可能因為對數據與健康狀態詮釋的差異,而造成隨著疫情而起的集體恐懼與偏見。此外,運用私有數位搜尋平台、社交媒體或是數據分析架構,則很可能加深對此類平台之依賴程度,並使這些平台更廣泛地擁有個人提供的數據。
因此,在討論AI的創新與對社會的影響時,不得不強調回到數據搜集過程的重要性。一方面強調持續檢視數據搜集過程中的性別、種族、階級和身心障礙等議題的重要性,同時也說明更廣泛且更仔細地探索數據實作進行的過程必要性。希望藉由回到數據實作的思考,能促成更謹慎、更貼近實際生活的數據實踐,以面對未來可能在各種場域發生、全面運算日常生活的論述、想像、與科技創新。
本文的研究與相關討論受到下列研究經費支持:ERC Advanced Investigator Award to Rob Kitchin(ERC-2012-AdG-323636-SOFTCITY)、AI城市在東亞(MOST 109-2410-H-010-001- MY3)與陽明大學防疫科學研究中心(MOST109-2327-B-010-005)