法律領域人工智能經驗實作網絡分析

◎ 張澄清(科技部人文社會科學研究中心博士後研究員)

Photo by Robynne Hu on Unsplash

人工智能(Artificial Intelligence, AI)技術研發在硬體設備、數據資料及演算法快速發展的基礎之上,近年呈現飛躍性成長,且逐漸落實或應用在各類生活科技與產業,形成高度產業化之競爭。由認識空間之觀點切入,則學術研究機構與出版品構成了重要的經驗實作網絡,而分析相關研究成果將有助於勾勒出現有的知識架構(如理論、學術典範、概念)。本文蒐集既有之法律領域人工智能相關文獻並進行分析,盼有助於提供鳥瞰法律領域內之AI研究,藉由整體研究現況之回顧,歸納分析當前發展的發展趨勢,供推動AI跨領域研究發展之參考。本文藉由隱形學群之探討,期望在整理經驗實作與初步知識架構之變遷外,提供AI研究之國際社群互動狀況,協助瞭解AI研究之發展現況及未來可能之機會及限制。

若以研究出版為基礎來探討AI隱形學群所構成的實作經驗網絡,且著重於跨國界的互動與合作,則文獻資料必須能反映跨國界、跨領域之互動關係,故最終選定Web of Science(WOS)為目標資料庫。不僅能免除研究成果之品質參差不齊的疑慮,也能搭配現有之社會網絡分析工具,系統性的探討研究文獻的合著及引用關係,達成AI隱形學群之認識空間描繪。本文所指涉的AI係採較為廣義的定義,凡研究文獻之主題涉及artificial intelligence、robot、big data analytic、deep learning、machine learning、artificial neural network、data mining、text mining、computational linguistic、computer vision、machine vision、natural language processing、natural language understanding、knowledge representation and reasoning,皆為本次分析之目標文獻。此外,亦參酌了Jason Brownlee(2019)所整理之機器學習演算法,並從中篩選一些常用且具有代表性之演算法,納入本次文獻檢索詞彙中,目的在減少文獻檢索之疏漏,但仍小心避免選用常見的統計方法而導致檢索出與人工智能無關的文獻。至於研究領域之分類,則採WOS之領域分類,且僅限定法律(Law)領域之AI研究;而文件類型則包含 Article、Review、Early Access、Book Chapter、Proceedings Paper等;資料檢索日期為2020年8月26日。

一、研究成果及影響力

近20年法律領域整體文獻之發展,除了於2014-2015年間,可能因資料庫分類架構調整所導致的跳躍性成長之外,歷年都是呈現穩定成長的態勢(見圖1)。人工智能研究雖然在2014-2015年間亦呈倍數成長,但撇開此外部因素,AI研究論文數於2015年後仍顯著成長,2017年112篇、2018年156篇,且2019年就有298篇,2020年截至8月26日已有133(見圖2)。AI逐漸受到重視,論文發表數量大幅成長,歷年論文被引用次數亦快速增加,影響力提升(見圖3)。

圖1:歷年法律領域文獻數量
圖2:歷年法律領域AI研究文獻數量
圖3:法律領域之AI文獻數量與引用次數

二、跨領域研究分析

資料檢索時雖然僅限定法律領域,但部分論文觸及跨領域議題,980篇中有84篇橫跨2個領域,31篇橫跨3個領域,37篇同時橫跨4個領域,整體跨領域文獻僅佔15.7%,比例不算太高。其中以23篇涉及「醫學/法醫」領域的論文居多,其次則是「經濟」領域的19篇,以及數學、「社會科學/數學方法」、「統計/機率」等領域的16篇。前15名的領域分布如圖4所示。

圖4:跨領域AI研究分布

三、研究機構與文獻來源

法律領域中發表AI相關論文之研究者所屬機構以University of California System最多,共發表25篇;其次是New York University及University of London的24篇。前15名的機構分布如圖5。

圖5:法律領域AI研究之重要研究機構

AI相關文獻主要發表在Computer Law Security Review1有83篇,其次是Internet Policy Review2的35篇與 BioLaw Journal – Rivista di BioDiritto3的25篇。上述三本期刊雖然各有其關注的議題,但相同之處在於多以歐洲地區為其主要的地理範疇。前15名的文獻來源(期刊)如圖6所示。

圖6:法律領域AI研究之重要學術期刊

四、國際合作研究

如同一般預測結果,USA發表的論文最多,共有377篇,其次是England的100篇及Australia的78篇。發表數量前15名的國家分布如圖7。

圖7:法律領域AI研究之國家分布

若以論文合著情形分析國家層級的研究網絡。分析結果顯示,全球主要可分為7個研究群,分別是(詳見圖8):

  1. Australia、Austria、Canada、Denmark、Ireland、New Zealand、Norway;
  2. Belgium、England、Italy、Netherlands、South Africa、Sweden;
  3. Brazil、Chile、Colombia、India、Portugal、Spain;
  4. Germany、Poland、Russia、Switzerland;
  5. France、Israel、USA;
  6. Peoples R China、Singapore;Netherlands、Sweden;
  7. Scotland、Wales。
圖8:國家合作網絡

若以研究主題相似性來探討國家研究網絡,研究結果顯示,同樣是可區分為7個隱形學群。各研究群的成員分別是(詳見圖9):

  1. Brazil、Chile、Colombia、India、Portugal、Russia、Spain;
  2. Austria、Germany、Netherlands、Norway、Sweden、Switzerland;
  3. Australia、Denmark、Ireland、Mexico、New Zealand、Poland;
  4. Canada、France、Israel、USA;
  5. Italy、Peoples R China、Singapore;
  6. England、Scotland、Wales;
  7. Belgium、South Africa。
圖9:國家層級之隱形學群
註:此圖乃依據書目耦合(bibliographic coupling)的結果繪製而成

長期合作研究的國家在研究主題的分群結果中,有較大的機會將歸屬於同一個主題群,但透過國家層級的合作研究群與隱形學群的比對,有助於瞭解現有的合作研究群之外,是否有其他的國家同樣進行相同主題的研究。

五、主要研究議題

本文利用關鍵詞同時出現的次數進行社會網絡分析,980篇文獻之關鍵詞共有1468個,出現三次以上的則有313個,可分為14個主題群(見圖10、圖11)。各主題群中的關鍵詞將進一步以文字雲的方式呈現如圖12,文字的大小依連結次數加權,較大的關鍵詞表示常與其他關鍵詞同時出現,可謂關鍵詞群中的核心概念或議題。

圖10:關鍵詞強度
圖11:關鍵詞網絡分析

若蒐集並計算每一個關鍵詞出現之年代的平均數值,並以此作為標示關鍵詞之顏色的依據,愈趨近黃色的文字標籤為則為近期關注的主題(見圖13)。

圖13:關鍵詞群之年代屬性

表1是依據年代的新舊進行排列,由左至右、由上至下依序排列。最近期出現的詞彙是algorithmic regulation,其次則是price discrimination。

algorithmic regulationprice discriminationnew technologiesculturesdigital technologies
preferencesfintechalgorithmic transparencycollusiondata privacy
digital footprintsdigital societiesdisinformationgamepredictive-validity
procedural justiceself-regulationalgorithmic governanceresponsibilitylegal technology
standardsdigitalizationblockchainfundamental rightsautomated decision making
co-regulationconstitutional lawcorruptiondata ethicsdata protection law
表1:關鍵詞之年代排序

此外,若以顏色來區分關鍵詞的平均被引用次數,則黃色代表的是平均被引用15次以上的關鍵詞,如圖14所示。在此,本文另外提供以標準化後平均被引次數進行關鍵詞排序,此排序可以排除因早期出版而傾向有較多被引次數的偏誤,可以凸顯近期出版的重要議題。排序前30之重要詞彙如表2所示。

圖14:關鍵詞群之影響力屬性
participationmanagementnatural language processingdesignimplicit bias
sexequalityprocedural justicedisparate impactclassification
Decisionspowersmodelspredictionsdiscrimination
Actproduct liabilitybigrule-makingrace
Fairnessconsequencesviolenceworkplacesdue process
Creditnewsexplanationlegitimacyself
表2:關鍵詞之平均標準化被引次數排序

六、AI與法律的想像

行動者網絡理論(actor-network theory)最初是由 Michel Callon、Bruno Latour與 John Law 等人發展,認為科學知識與技術的建構是同時由人(社會)與非人(工具、物、被研究的對象)所構成的「異質性網絡」來決定。網絡中的人和非人都是行動者(actor)與(被)行動者(actant),而科學理論或是技術物要能夠持續發展,必須檢視其是否能夠在網絡中得到其他行動者的支持。故科學與科技的發展必須經過轉譯,符合其他行動者的利益才能夠持續壯大,被認為是在科學與科技研究中最成功的理論成就(Sismondo, 2010)。

林文源(2019)曾透過行動者網絡理論的視角,想像人文社會科學(Humanities and Social Sciences, HSS)與AI的關係,指認出可能的關係有:

  • AI 的人社影響(HSS in AI):AI 發展引發哪些人社研究議題?
  • AI 的人社意涵(HSS of AI):人社如何以其架構研究AI ?
  • 人社如何使用AI(HSS by AI):人社如何因應 AI 重新思考研究方式?
  • 人社如何有助於 AI(HSS for AI):人社如何以自身獨特觀點探討AI 的能與不能,對AI 發展提供貢獻?

倘若藉由上述四個面向來引介現有法律領域AI相關重要研究成果,則AI對於法律層面的影響,可以預見的是公民權利保護與AI將發生衝突,眾多討論演算法問責(algorithmic accountability)的研究,彰顯了新科技與法律之間存在著更深層與結構性的緊張關係。Katyal(2019)認為,AI並非僅存在資訊揭露的問題,而是引發了科技、財產和公民權利之間的相互作用。我們必須對私有企業要求更高透明度與問責,不能完全倚賴公共法規(public regulation),行為準則、影響聲明與吹哨者保護或有助於消除AI的不透明度。

此外,AI可引導警務、佐證(evidence)與假釋等階段的結果,刑事司法系統(criminal justice system)趨於自動化。Wexler(2018)指出,現有的論辯忽略了所有權的問題,開發者常聲稱系統的詳細運作方式屬於商業機密,而拒絕透露相關資訊給刑事被告或律師,將知識財產權的主張引入刑事司法系統,將引發生命、自由和財產利益之間理論不足(undertheorized tensions)的緊張關係。進一步探討商業秘密調查將提供證據規則如何,以及應該如何在民事和刑事案件中發揮不同作用的新思路,此或可視為AI的法律意涵。

瞭解如何在長期合作過程中,保持利益相關者的參與對於獲取理想的效果至關重要。Scott、Ulibarri與Scott(2020)觀察了700多位利益相關者在16年中參與大壩運營許可證的開發和實施的過程,並使用文本挖掘和貝氏層級模型(Bayesian hierarchical modeling)來觀察會議出席情況,並記錄會議記錄中的動作。研究結果顯示,自最初的計劃階段之後,參與程度下降,然而通過許可證的開發和實施卻不斷增加。在與外部利益相關者進行磋商的監管任務解散後,總體出勤率下降但出勤率穩定度提高,意味著非強制性階段只需要一小部分認真奉獻的行動者(dedicated actors)。使用AI進行法律研究的研究成果不多,Scott等人(2020)的研究算是少數受到重視的研究。

最後,由於現今對於以演算法工具來預測暴力與犯罪,多集中在此過程之程序正當性的含意,考量了刑事司法系統中長期存在的種族偏見,Huq(2019)嘗試以憲法學說(constitutional doctrine)和逐漸成形的演算法公平性技術標準,做為評估演算刑事司法系統之種族問題的替代視角。Huq進一步提出了一種重新設計的度量標準,用於考量演算法設計中的種族平等問題,則可謂透過法律相關研究協助 AI發展。

七、結語

AI相關之法律研究,最早可追溯自1970年。隨著數據資料、演算法及軟硬體等環境的成熟,AI技術的社會應用將持續深化與廣被。面對AI的強勢進擊,本文分析結果或可供國內學界掌握當前研究成果之參考,但更好的未來社會—技術互動希望不只是想像,能有更多研究者的共同參與及開展。


參考文獻

  • 林文源(2019)。AI的能與不能:以醫療與照護為例發揮人社想像力。人文與社會科學簡訊,20(2),頁99-103。
  • Brownlee, Jason (2019). A tour of machine learning algorithms. Retrieved at Aug. 26, 2020 from: https://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/
  • Huq, A. Z. (2019). Racial equity in algorithmic criminal justice. Duke Law Journal. 68(6), 1043-1134.
  • Katyal, S. (2019). Private accountability in the age of artificial intelligence. 66 UCLA L. REV. 54. Available at SSRN: https://ssrn.com/abstract=3309397.
  • Scott, T. A., Ulibarri, N., & Scott, R. P. (2020). Stakeholder involvement in collaborative regulatory processes: Using automated coding to track attendance and actions. Regulation & Governance, 14(2), 219-237.
  • Sismondo, S. 2010. An introduction to science and technology studies (2nd ed.). Malden, MA: Weliy-Blackwell.
  • Wexler, R. (2018). Life, liberty, and trade secrets: Intellectual property in the criminal justice system. Stanford Law Review, 70(5), 1343-1429.