◎高紹芳/臺大社會所碩士生、臺大電機系畢業(輔修社會學及心理學)
*本文為筆者擔任科技部跨領域專案計畫「人工智慧的創新與規範」研究助理期間受到啟發,再經劉靜怡老師於 2020 年春〈資訊法與資訊政策專題〉課程報告改寫而成;感謝王大為老師、林文源老師、蔡政宏老師、邱文聰老師、劉靜怡老師、李建良老師等人的提點與指教,文責皆應由作者自負。有鑑於筆者作為社會學研究生、又在大學期間具備電機資工的訓練,望能以本文提供人文社會學科介入 AI 研究發展進程的跨領域視角。

人工智慧的發跡
人工智慧(artificial intelligence,後又稱 AI)這個詞彙首次出現在學術領域已屆六十餘載,自 2010 年代起行情不斷看漲,卻曾在電腦科學史上歷經兩度低潮,史稱兩次 AI 寒冬。發展至今,此領域早已不是專屬於電腦科學家的學門,社會科學則對於 AI 普及後對於社會層面的衝擊議論紛紛,好似太晚加入賽局而只能望其項背。然而,AI 早在過去六十多年間,就不斷透過汲取跨學科的養分,才得以一再突破技術瓶頸,成為我們今天所認識的 AI——
人工智慧早在今日之前,就已經是個跨領域的學科了。
我們可以著眼三條平行又交錯的時間軸線,從 1960 年代開始,透過電腦發展的歷史軌跡、運算條件的指數革新,以及網際網路的全面普及,來談論「何謂人工智慧」。
從類比到數位的貯存方式
1950 年代以前,大部分科學實驗與技術研究中的計量方式,都是通過測量、得到一個連續的數值。不管是長度(可以進一步推算出大小、或除以時間變成速度等)、溫度(冷熱之別)等,都需要借助測量儀器,也往往有測量過程中的觀察與記錄都不夠精準的問題。舉一個最簡單的例子:以水銀來測量體溫,必須透過對照水銀柱高度及水銀計上的刻度尺,而這幾次觀察上的轉換都有誤差出現的可能。
此時,電機工程學家靈機一動,想借用神經生物學的概念:
既然神經細胞是透過電訊號來溝通的,那能不能製造出元件來模擬神經元傳遞動作電位的方式呢?
休息狀態下的細胞處在大約 -50~-70 mV(毫伏)的膜電位,此階段稱為「極化」,而當某些離子通過後,會導致膜電位升至約 40 mV,稱為「去極化」,之後再回到極化的休息狀態。訊號於是得以透過電位差區分「開」和「關」就好,來製造 0 和 1 這兩種全有全無的訊號類型。
他們發現,只要將十進位的數值轉換成二進位制,傳輸和貯存資料就變得更簡單方便了!
於是,電機工程相關的研發在這段時間突飛猛進,透過將電流、電壓等類比(analog)訊號轉換成具有峰值且有規律間隔的數位(digital)訊號,也就是工學院一定修過的電子學,進一步發展出現在我們所使用並持續開發優化的半導體技術。許多延伸應用開始發展,所謂的電腦(computer)英文原意即為「計算機」,也開始可以進行更複雜、牽涉資料更為龐雜的運算。舉例而言,就日常生活來說,我們測量耳溫使用的耳溫槍,至少就經歷了將冷熱這個指標先是以類比方式測得紅外線的波長,再將之轉換成數位訊號,最後以攝氏度數呈現的過程。

在 1965 年時,稱霸超過半世紀的半導體巨擘英特爾(Intel)創辦人之一戈登・摩爾(Gordon Moore)還只是個普通的工程師,但他投稿了一篇文章到《電子學雜誌(Electronics Magazine)》,預言未來積體電路上將可以放上更多的元件,差不多以一年增加一倍的速度指數成長。此後這個數字被不斷修正,最後成了「每 18 個月,晶片效能就會翻倍」的「摩爾定律(Moore’s Law)」。半導體產業確實也照著這個預言一路走到 2020 年:從一台電腦的體積要佔滿一整個房間,研究生還要在大學圖書館排隊使用,甚至要打孔、透過終端機操作,第一台「個人電腦(PC)」很快就在 1960 年代問世。隨著圖形化介面的發展,PC 也逐步商用化且普及,演變出如今人手一台、以文書操作為主要功能的筆記型電腦。
然而「人工智慧」這個次領域的發展,卻不如預期般樂觀⋯⋯
專家系統前後的 AI 寒冬
有鑒於計算科技的進展,1956 年時以 John McCarthy(當時為 Dartmouth 數學系助理教授)為首的十多位電腦科學家們在新罕布夏州的達茅特斯學院(Dartmouth College, New Hampshire)辦了一場會議,目的是要集結並發展學界對於「會思考的機器(thinking machines)」的想法。他們共同發表的一部宣言被認為是「人工智慧(artificial intelligence)」這個詞的起源(coined the term)。
We propose that a 2-month, 10-man study of artificial intelligence be carried out during the summer of 1956 at Dartmouth College in Hanover, New Hampshire. The study is to proceed on the basis of the conjecture that every aspect of learning or any other feature of intelligence can in principle be so precisely described that a machine can be made to simulate it. An attempt will be made to find how to make machines use language, form abstractions and concepts, solve kinds of problems now reserved for humans, and improve themselves. We think that a significant advance can be made in one or more of these problems if a carefully selected group of scientists work on it together for a summer.
然而二十年過去了,1970 年代的電腦科學家認為,當年 McCarthy 所宣稱的目標是不可能辦到的,史稱第一次 AI 寒冬,使得人工智慧因為缺乏發展性而逐漸冷門。
反觀摩爾定律,卻沒有令人失望。
它精準的預測了技術革新的速度,當晶片效能以 18 個月為單位持續翻倍,意味著一張晶片上能夠貯存的資料、其上處理器的速度都是日新又新。硬碟空間變得便宜,從 1971 年 IBM 開發出直徑 8 吋的磁碟片(floppy disk),到 3.5 吋磁碟片在 1980、90 年代風行;當時磁片的容量只有 1 MB 上下,連一個裝飾比較華麗的Word 檔或是 PowerPoint 都裝不下,2000 年後逐漸被光碟取代。但其實光碟早在 1965 年就被發明了,也仍舊是以類比訊號為主的貯存形式,即使在 1990 年代成為主流,也只能存放不到 1 GB 的資料。
放眼 2020 的現在,小學議長獎獎品送個 8 GB 隨身碟都會被笑,手機容量動輒 64 GB、128 GB 起跳,備份硬碟起碼要 1 TB 才夠用。Gmail 不付費就送 15 GB Google Drive 容量了;和二十年前相比,怎稱不上一日千里!

但不用等到 2020 年,在第一次 AI 寒冬的十年間,電腦科學家就開始發展所謂的「專家系統(expert system)」。在儲存與處理速度日新月異的情況下,產生了我們想像中,像是圖書館中呼叫一書「書本來(Accio book;哈利波特梗)!」,就會出現你所求之物的資料庫(database)雛形。透過向哲學與數學取經,透過邏輯和正規表達式,電腦可以將幾乎所有生活中實際存在或抽象思想的事物賦予名稱,給其定義,此謂「知識表達(knowledge representation)」的發展策略,至今仍是 AI 研發的兩大重要基石之一(註:另一發展重點為現在蔚為風行的「機器學習(machine learning)」,建立在下節所述的大數據時代之上)。
而實際上,當你在搜尋列上輸入關鍵字時,電腦是怎麼幫你找到書的呢?
儘管圖書館已經有系統的將書籍分門別類的排序了,找書並不需要像看地圖一樣按圖索驥,而是透過搜尋演算法(search algorithm),幫你先框定某個範圍,把不相干的東西先刪掉,然後按照相關性排序⋯⋯把和你所想要尋找的最相符的結果推送到你面前。所謂的演算法,不過就是一套電腦做事的步驟,寫成程序指令而已。
於是自 1980 年代起,AI 又蓬勃發展了一段時間。電腦科學家以將所有知識都放進資料庫裡、讓電腦進行搜尋為策略,IBM 研發了一台針對問題能夠提出解答的華生機器人(Watson),並讓它參與綜藝節目《Jeopardy》中的機智問答競賽。2011 年,在沒有連線到網際網路的情況下,Watson 首次打敗另外兩位人類對手,贏得百萬首獎。
然而在這十年間,學界也很快地覺察,像 Watson 這樣的專家系統再怎麼神勇,也只能處理有限、人類已知並且預先餵給它的知識;它沒辦法解決它沒遇過的問題,相關的研發也不知如何向前推進⋯⋯於是迎來了第二次的 AI 寒冬。
不斷生產、蒐集、再進一步分析資料的「大數據(big data)」時代
且慢,讓我們再回到 1960 年代。
當時除了將類比訊號轉換成數位的突破使得半導體產業正式起飛之外,美國軍方單位也委託電腦科學家開始進行傳輸連線相關的研發,爾後這樣的需求也拓展到學術網絡以及私人企業。直到 1980 年代末期,「串起全世界所有的電腦」的這個構想逐步成形,於是1989年提姆・柏內茲-李(Tim Berners-Lee)發明了所謂的「全球資訊網(World Wide Web,通常讀作 “Triple-W”),成為我們現在所使用的網際網路(the Internet)的核心服務之一。
隨著網際網路愈來愈普及,摩爾定律也持續被驗證——當資料傳輸又快、計算速率又高、貯存空間又便宜,於是便有了所謂的「雲端(cloud)」:由於主機都透過網際網路相連,就算儲存資料和進行運算的電腦並不見得在物理上相近,也無損傳輸效率。

不只是電腦,網站和手機、平板上應用程式於是變得愈來愈複雜,基於社交需求,各種即時通訊(instant message, IM)軟體、社群網路服務(social networking services, SNS)如雨後春筍般出現,Facebook、Amazon、Apple、Google 成為 2010 年代後的科技霸主(The “Big Four”,又稱 Big Tech、Tech Giants)。甚至隨著 2020 年代 5G 逐步落實、「萬物皆可連網」的物聯網(IoT, Internet of Things)更在實現的路上⋯⋯
在使用者在操作軟體、使用平台的過程中,為了提升使用體驗、保持「即時」,會在短時間產生非常大量的資料,包含 GPS 位置、在特定網站區塊的停留時間、IP位址、按下哪些鍵⋯⋯這些都會被記錄甚至傳輸回主機。可被蒐集和分析的資料,早已不限於使用者自己上傳或創造的訊息。此時若將與特定使用者相關連的使用者標定起來,就可以進行更精準的網路廣告投遞,而與廣告商分潤正是免費提供搜尋引擎服務的 Google 的盈利模式⋯⋯既然科技來自於人性,只要處處是商機,這樣的發展趨勢就會不斷持續下去。
為了更好地利用、分析使用者需求與輪廓以投其所好,電腦科學家再次向神經生物學借鏡,模擬生物神經網絡的傳輸和組合方式,發展出類神經網絡(Neural Network, NN)這樣的數學運算模型。參照心理學對於人類智慧的衡量,電腦科學家終於可以宣稱「機器也有能力學習!不再被侷限於舊有的知識了」,並將這些新方法統稱為「機器學習(machine learning, ML)」,於是,AI 再次登上關鍵字排行榜,形成我們今日所看到的盛況。
了解之後,從何介入?人工智慧的技術政治
Langdon Winner 在 1980 年發表的〈技術物有政治性嗎?〉一文,堪稱奠定了技術哲學以及科技社會研究(Science and Technology Studies, STS)發展的重要基礎。根據世新大學社發所陳信行老師的簡介,Winner 考察了美國的社會史,發現「技術」在美國政治歷史發展中一直扮演決定性的角色,從而開創了 STS 領域學者自詡為公共知識份子,在科學與技術政策方面積極參與的傳統。
Winner 在該文中提到,大型技術基礎建設早已鑲嵌於當今的政治議程中,關乎糧食與工業生產、軍事準備、通訊等日常生活所需及其分配。若人有政治性(立場、美德)等,那麼技術物和其關聯為何?Winner 主張技術本身,無論使用目的,都不一定是價值中立的;其設計和配置是否可能帶來非預期的政治效果,因此呼籲人們不該忽略技術物所處的情境、位置、與發展脈絡。
筆者認為,面對人工智慧研究,我們可以延續 Winner 的提問,提出兩個思考方向:情境脈絡,以及學科關懷。
考察技術如何誕生和使用情境
舉例而言,如果我們想要製作並應用一套辨識系統,我們會怎麼做?
首先評估預算、考察需求,再看要找人重新設計?會寫程式的話自己抓函式庫刻一個?還是直接買商用的?抑或尋找開源的現成套件?
這些取得技術的來源可能影響辨識系統的品質,但話說回來,我們使用辨識系統,是為了解決什麼問題呢?防盜的保全裝置、和貧民區的犯罪預測,就是完全不同的適用情境,對於何謂「品質好」的辨識系統,也會有不同的評判標準,甚至在工程學上,就是對應著不同的指標(index)或基準(benchmark)。

更甚者,技術不只可以協助人類完成某些目標,甚至可能改變人類看待和體驗生活的方式。Katherine N. Hayles 任教於杜克大學,為後現代文學評論大家,主要貢獻於女性主義文學、賽伯格(cyborg,指人與機器的混合體)等後人類(post-human)的學術論辯。她不但提出後人類相對於人類,是基於科技與文化如何交織又體現(embodiment)在人類身體上的歷史差異,更在 2009 年發表一篇文章,指出傳統心理學上講的「認知」被定義為「人類吸收資訊、理解然後進行詮釋的大腦歷程」,但若加入 RFID(Radio Frequency IDentification,無線射頻辨識,即日常生活中常見的感應卡採用的技術)等等這些我們身邊的標籤(tag),從而把認知的定義擴充成只要「放在脈絡裡並且產生意義」,那麼認知就不一定要經過人腦。因為我們隨手可得的這些條碼、發票、悠遊卡等,在和環境互動的過程中,都不是單純的一個物品,而透過資訊的傳遞與互動,產生了脈絡與意義,藉此得以討論 RFID 這項技術與人類的能動性,以及環境之間如何相互影響又彼此關聯。
我們想解決什麼問題?學科關懷與問題意識的界定
回到指標和基準的界定,跨領域研究的前提,是先能夠承認,每個學科問問題的方式是不一樣的;在一個學科被認為重要的提問,在另一個學科也許並不被重視。而提問方式的不同,正意味著世界觀的差異。Hayles 在大學拿的是化學學士,碩士班才轉而攻讀英國文學,或許正是因著思考方式的衝擊,才讓她提出對於「認知」這個概念的新見解,從而挑戰舊有的討論邏輯,激發出新的火花。
然而,一定要受到跨學科的訓練才能進行好的 AI 研究嗎?
Joy Adowaa Buolamwini 是一位迦納裔的美國人(Ghanian-American,迦納為一曾受英國殖民的西非國家,有超過二十萬人居住在美國,集中在東北數州),她於 2017 年自 MIT 取得電腦科學碩士學位,之後創辦 Algorithmic Justice League,以抵抗軟體裡演算法中存在的偏見與歧視。
對抗歧視的念頭,來自於 Buolamwini 自身的生命經驗。大學時她就讀 Georgia Tech,進行臉部辨識(facial recognition)相關的研究。臉部辨識這項技術現在早已普及到日常生活中,無論是 Instagram 濾鏡還是一般智慧型手機的相機,偵測到人臉時,通常會出現一個正方形框住臉部。Buolamwini 卻發現,身為黑人,她的臉總是無法被系統偵測到,直到唸了研究所,才決定親自動手來解決這個問題。她的研究也被發表成研討會文章 Gender Shades (2018),指出機器學習演算法採用的訓練組(training set)本身如果就不夠多元、不符合現實中的種族比例,那麼這就不可能是一個好的偵測系統,因為這個系統只為特定對象而服務,那麼這就是歧視。於是 Buolamwini 提出的解方是,透過蒐集北歐及非洲國家議員的照片,得以兼顧公開來源以避免侵犯隱私、正面且五官清晰、以及相貌多元性——北歐的樣本可能是膚色最白的高加索人,而黑人的膚色也有深淺之別;況且國會議員和明星不同,不一定長得特別好看,因而更具普遍代表性。透過這組資料集重新訓練演算法,Buolamwini 修正了那套從大學就一直困擾她的辨識系統,甚至發現增加了樣本的多元性之後,其辨識率變得更好了。
結論
確實,有些電腦科學家也意識到了 AI 迅速發展帶來的道德難題(詳見筆者另文),比如說李飛飛在史丹佛大學擔任「以人為本」人工智慧研究中心(Stanford HAI, Human-Centered AI Institute)的共同主持人,除了讓史丹佛的大學生在工程主修之餘也必須修習人文社會學科來培養跨領域思維,也積極發展 Trustworthy AI、Explainable AI 等解開演算法黑盒子之謎,使人們能夠公開檢視、驗證因而信任的機制。
然而,社會科學往往要在已經看到現象之後,才能透過觀察進行判斷,從而回到問題的源頭——程式碼的設計——和工程師討論可能的解決方案;如果是規範性的問題,就會交給法律專家。但技術和商業的發展往往衝在最前線、攔也攔不住,很多開發者或科學家卻沒辦法提前意識到,某些系統設計是會助長威權、摧毀民主、誘發歧視的。
在科學方法中,觀察是實證研究必經的步驟,筆者認為,對於在地脈絡以及技術發展軌跡的認識,應當發生在法學常見的比較法研究之前;在比較過往或當下、甚至當地與異地時,我們必須先意識到,某些習慣或規範之所以會形成,有其歷史脈絡與認識觀。Benedict Anderson 在《想像的共同體(Imagined Communities)》這本書中透過各種歷史和文化的爬梳,指出技術,也就是印刷術的發達,導致了民族主義的誕生。乍看起來是一個很具體的技術物導致一個很抽象的概念產生,然而社會科學的工作,就是來幫助人們更好地理解某些機制之所以會產生的背後脈絡,甚至讓人們看見機制的存在,就是很大的貢獻了。
筆者認為,這才是談起跨領域 AI 研究,我們真正應該面對問題的方式:
在哲學倫理學論何謂真善美、政治學國際關係中的強國博弈、社會學擔憂不平等被系統性的再生產、人類學關心技術怎麼改變社會關係後,法學才在這些實證學問之上探問,我們該如何監管才是合理且可被執行的,並且期待轉過身來,電腦科學家們已準備著豎耳傾聽,交流這些社會後果又該從何共同來解。

參考資料
- 三津村直貴著、陳子安譯,2018,《圖解 AI 人工智慧大未來:關於人工智慧一定要懂的 96 件事》。臺北市:旗標。
- Anderson, B. (2006). Imagined communities: Reflections on the origin and spread of nationalism. Verso books.
- Buolamwini, J. and Timnit Gebru. (2018). “Gender Shades: Intersectional accuracy disparities in commercial gender classification.” Proceedings of Machine Learning Research 81: 1-15.
- Hayles, N. Katherine. (2009). “RFID: Human Agency and Meaning in Information-Intensive Environments.” Theory, Culture & Society, 26(2-3): 47-72.
- Russell, S. and Peter Norvig, eds. (2010). Artificial Intelligence: A Modern Approach. Upper Saddle River, NJ: Pearson-Education, Inc.
- Surden, H. (2019). Artificial Intelligence and Law: An Overview. Georgia State University Law Review, 35.
- Winner, L. (1980). Do artifacts have politics? Daedalus, 121-136.