AI親權判決預測系統:法律、社會、技術與應用面向

人工智慧與法律規範學術研究群
第二年期(2019-2020)

第十二次會議
2020年6月23日(星期四)

主持人:李建良(中央研究院法律學研究所特聘研究員兼所長)
主講人:林昀嫻副教授(國立清華大學科技法律研究所)、王道維教授(國立清華大學物理系)

◎ 整理:洪于庭
◎ 定稿:李建良

Photo by Juan Pablo Serrano Arenas from Pexels

一、問題意識

當初一開始是從紛爭解決發想,我將研究聚焦在家事紛爭解決,在家事法院所會面臨到的困境,較不適合由訴訟解決,較適合由調解、諮商方式等,以解決長久以來家中不公平、正義之狀況。因為家中的狀況不太容易由訴訟解決,當進去訴訟程序時就希望勝訴,兩造關係進一步撕裂。故我希望尤其是離婚或是親權酌定由訴訟以外途徑解決,這對很多兒童少年一生有很大影響。

離婚後親權酌定之案件研究

兒童權利公約中提到,應以兒童最佳利益為優先考量。但這是不確定法律概念,兒童最佳利益的範疇為何,有許多文獻對之有相關探討。其實我們的民法中有提到應以子女最佳利益為參考,而親權酌定應有具體判斷因素,故民法第1055條-1有幾樣具體參考因素。選這個主題其中一個原因是因為有許多人研究過,才不會閉門造車。

AI應用在家事判決的可能性

  1. 可能性
    1. 案量大增
    2. 案件多屬單純
    3. 可減少訴訟
  2. 對法學研究與審判品質的幫助
    1. 對於家事案件做更全面的研究
    2. 讓法官能專注於負責和困難的案件
  3. 法院判決書的文字應用在自然語言處理(NLP)的優點
    1. 品質較高
    2. 數量龐大
    3. 生活相關
    4. 可解釋性
  4. 研究AI技術應用時可能的爭議:AI在司法審判的爭議,如State v. Loomis的案件。但我們還是必須發展國內AI在司法上的應用,如國內未應用僅討論國外案例會有點可惜。

二、以法實證研究議題為例

我們搜集2015~2017年所有的判決,總共2620件,酌定親權有1343件,我們就看1343件,我們的研究發現:

  1. 親權歸屬於父或母
  2. 判決考量因素的分析:我們把民法第1055條-1考量的因素分成13種,統計這13個因素在案件中出現頻率。
  3. 城鄉差異:母親獨任比例在都市較高,但不會差很多。
  4. 從未進入司法體系的侵權分配事件:進入法院前,就因為雙方有共識而不用進入法院者,父親單獨行使親權狀況比較多。

三、標注資料庫的建置

技術部份是關於自然語言模型的處理,我知道在法律方面觀之會有很多人權問題。

判決書理據標註舉例

於我們的研究而言會教有利文字(得到親權)、不利文字,先做對申請人有無利判斷,較不會出錯,就此可以看到法官的態度為何。有一個好處這樣的標注方式是在文字內容,會減少偏見情況。那該因素是否重要,法官發現可以將其他因素寫入判決中,法官可以寫別的理由,可能會造成不同解讀方式,法官會有看孩子意願會這樣判,即便不看孩子意願也會這樣判,就會產生差異。

標註並沒有單一方法,特別是從判決書內容預測判決結果,這些標註資料在外來可以做資料擴增、偏見研究,不等於判決書但把判決書重要部分提出,好的判決書因為各項資料與論述相當充分,即便指標到其中部分亦足以做判決預測。

為什麼學習應用在判決之可行的,我們將判決整理成等效判決書,在做資料預處理,提取特徵或向量化,我們的判決預測適用深度學習的結構,我們輸入的資料是聲請人有利不利的文字、相對人有利不利的文字,將文字轉成向量,將向量投入類神經網絡學習,綜合向量出來的是800維向量,這是為何在應用上會有人認為好像有點像黑箱的意義,電腦是看不懂單個字的意思,但可以根據單個詞對於該判決有多重要。

初步結果:三分類的文句意象判斷

將六千多條有利不利文字段落,我們亦可用隨機選取的中性文字做三分類的預測,顯示我們的模型已有相當能力來判斷包括中性的文字意象,有助於提升對於整體判決的預測準確度。

兩分類的侵權裁定預測

判給聲請人或相對人我們的預測準確率是93%,在做文字分析,因為法院是高品質文字所以效果非常好。如果我們今天適用勾選方式,數目很多,判決準確性很高是沒意外的情形。但就法院是不確定文字,本系統可輸入不固定的文字長度或句數分析,方便於實務情境

三分類親權裁定預測

判給雙方的案件差異是較大的,容易有誤差。

解釋性問題

  1. 解釋對象:最近有文獻討論,工程師會認為並沒有問題,他看這個城市的運算結果知道原因,但一般人看不懂,語言不同
  2. 配合統計分析:AI預測應該與統計分析或法實證研究互相配合
  3. 演算法的改進:有些演算法會有一定的解釋力,目前也有將文字中的主要因素凸顯,如self attention model(自我注意力模型),他可以把文字自我標註,在superviselearning在某些句子會與這個結果有關的,會將此呈現出來。一開始對兩造有利不利的句子是人標的,我們希望是AI可以自己標的。

四、建構自然語言

五、建構親權預測系統與未來發展

  1. 仍有使用上不足之處
    1. 一般大眾的表達語法與法官的專業語法仍有不同
    2. 關於兩造雙方的事實認知可能會有偏袒、不全或錯誤
  2. 我提供影片供大家參考我們系統運用方式
  3. AI侵權判決預測系統的使用情境:原則上當事人自己就可以上網使用,但若能透過第三方會更理想,社福人員可斡旋,有助於庭外和解,減少花費對簿公堂的傷害。但是還是需要各種輔助環境的支援。
  4. 未來發展方向:擴展到其他案件
    1. 發展新的AI技術:亦可用此NLP方式開發自動標註、訴狀
    2. 法學相關議題:可更深度研究AI應用限制或人權、倫理等
    3. 促進司法的透明性:類似案件一般人民可以預期結果,促進透明性、穩定性與可親性,對於和解應有幫助的。

結語:以AI與法律的結合促進社會公義

希望能帶來以下幾項正面影響

  1. 以法實證研究提升司法穩定性可預測性
  2. 減輕法官負擔
  3. 協助弱勢當事人
  4. 利用審判書大量高品質的文字資料,發展可解釋性AI
  5. 促進科技與法律更多合作
Photo by Franck V. on Unsplash

問題與討論(敬稱省略)

黃詩淳:

我上次報告的民事判決的應用,查了一些文獻,在事實認定方面在AI的幫助較小,法律適用方面較大,剛剛王老師提的也是法律適用方面。那我們將之稱為預測判決系統是否恰當,好像只是在測試AI是否看得懂裁判書,會能夠幫助司法人員嗎,因為還是必須自己判斷事實

王道維:

這是參考性的,並不會代替法官,在陳述時可能給出的意見會是偏頗的,在協調時雙方給出的意見給雙方律師在訴訟前,在訴訟策略上可以使用。大概功能是,雖然有些限制,但在這些限制內時,也許可使使用者判斷法官想法為何。又如可能在鄉間使用者,事實可能沒問題,但在法律認定上較無知,如使用此系統,較能知道法官不會這樣想,可能不會提起訴訟。

李建良:

用判決書的內容去預測判決結果,是下個判決的結果,那正確率的結果。

王道維:

都還是既有判決中做預測,該網頁是就未知判決,所以不知道結果,我認為可以與法扶合作,就看如何使用。

黃詩淳:

在做測試組時,也是讓30%的裁判,並不是讀全文只是讀原因。

邱文聰:

黃老師上個月的是今天作業的前端部分,看是否有讀懂判決,今天做的是標註,預測親權判決結果。

黃詩淳:

如果要真的知道法官為何要判給父母,還是要透過判決書才能知道要因為何。實證也是很重要的,前段林老師的部分會是很重要的部分。

林昀嫻:

我們有與司法院的人報告,他們比較想知道法實證的部分,我們的角度是此系統無法取代法官,黃老師剛剛提的,網站上提出的事實及系統被餵養的資料,這兩者是需要轉換的,所以一開始在講減輕法官的負擔,並非一部份取代法官,僅是在紛爭解決流程中,未進入司法體系,是否可先解決部分紛爭,以減輕法官負擔,法實證部分也還在發展中。

陳弘儒:

這套系統的目的是正式進入法院的案件量變少,當一個親權爭議出現後,會進入訴訟的關鍵性原因是什麼,該閾值為何。如果可以與王老師的部分搭配,會有相輔相成的作用。

林昀嫻:

我常與家事法官談,有一個案例是,夫妻已進入法院,先調解、調解不成才進入法院,女方是貴婦,男方稱離婚後小孩歸女方,每個月50萬,不包括子女教育費,後來談不攏的原因是因為,女方主張房子的管理費誰付,一般來說很難會想到進入訴訟的關鍵點是管理費。

陳弘儒:

所以這樣系統有可能沒辦法很大量減少案件進入家事法院。

王道維:

也許我們一開始設定是這樣,但用途可能不一樣。有人認為可能會取代律師角色,但也有人認為可以看出訴訟策略方式

楊岳平:

我想請問有無要回歸分析,如果我們只看百分比很難看清楚。

王道維:

有我們現在在寫paper,做回歸可讓一般人看懂。事實上AI也是可以做這樣的研究。

楊岳平:

在這基礎上,我們在做回歸,要找的是Causation,剛剛在分析中提到有些真正原因不會揭露在其中,會有疑慮,可能我們找到是法官再分配親權時會用什麼措詞,在這系統中是否為重要,還是找到correlation即已足。在這過程中是否會讓correlation 與causation模糊。

王道維:

這問題幾乎是對所有AI研究都相同的,判決書中法官是否會有心證決定判給誰。我們目前所有研究的數據從這裡來,故我們也很避免這種質疑,但至少這種方式能告訴我們這是可能的。如果法院能把所有卷宗電子化,我們去做標註,才有可能。至少現在法官所講原因與最後有一致性,最後再去訓練較複雜案件,這是針對資料部分。針對演算法部分,我認為是會有更多進步,他可能沒辦法100%告訴原因,他適用後設的方式檢驗,科學方式就是這樣,但可以用不同方式檢驗。中間可能會有些差異,最後結果是問誰較有機率勝訴,這系統整體而言還是可靠的,我們可以用其他方式檢驗是否有問題,如果沒有實證方式。

楊岳平:

我們需要知道因果關係嗎,還是一個系統只要有correlation就好,上次討論的是,若不是做判決以一個預測目的來說是不用causation。

王道維:

必須要看使用目的,這並非定量計算,他會抓到句中哪些對判決重要的,如果這樣結果可以幫助這樣結果是合理的,那麼這問題並非想像中重要。

陳弘儒:

回歸其實沒有探討因果關係,沒辦法決定原因跟結果,當然社會科學做很多。所謂的原因或許不是在一群數據中且為未成年子女的主要關係者,應該是將所有判決都拿掉。

王道維:

我其實想做,若將此因素完全拿掉,才能完全體現其他事實

邱文聰:

我們在談因果關係時,必須要有前提時基礎事實。

王道維:

有些研究會把因果關係放入其中,將整套演算法放入。

蘇凱平:

我最大期待是correlation取代 causation,人類想法會想找出原因,但該原因是否存在,我覺得NLP如果可以擴大範圍,如果可以訓練機器的方式,將範圍拉大,有沒有可能我們知道這樣因素會導致這樣結果,不用知道特定因素,因為法官也是這樣做的,他們會有insight不會以 causation存在,NLP是針對此,我有相當期待。我在做律師時,與高等法院庭長學習時,他修改我的訴狀會將‘將’改成‘使’,他認為較會勝訴,美國與有許多文獻有討論此,如果你將‘將’單獨預測是不會有意義,透過NLP前後文可以得出標註結果,可能會有correlation。

楊岳平:

這個沒辦法做判決預測系統,並不會單輸入‘將‘。

蘇凱平:

司法院的量刑資訊系統很多法官不願意用,於高等法院105年度交上易字第117號刑事判決,該案中一審判六個月,檢察官說太輕,被告說太重,量刑資訊系統中相類似的案件判刑,一個是四個月、六個月,是判在該區間中,故並無激輕激重,該判決也選為最具參考價值裁判,至個案子因子很單純,沒有人死傷、沒有上訴審,不需要解釋原因,就是審理上訴理由,沒有激輕激重就是他的說理方式。

鄭瑞健:

假設某個系統很好,如果之後有法官與系統的意見大相逕提,那請問該如何處理。

林昀嫻:

我們並沒有認為係作為訴訟一環、為必經程序。

王道維:

如果我們持續發展,的確有可能會有這樣發展,當事人雙方如果都做該預測,這項有個好處是,為了預測結果,可能需要填寫,自身與對方的有利不利條件填寫,法官可以透過此做整合,可以從事實面得知可以採取何作為其理由,可以使法官心證更明確知道來自為何,在系統中可能會得到應該判給母親,法官應有責任在判決書中寫的更明確。

王道維:

你們有無考慮舉證責任配置為題,如有些欄位我沒填,但舉證責任在對方,法院應該判對方敗訴,這樣是否有問題,同樣這套自然語言學習是否有可能。如果沒有大量資料可供學習,這部分將會較困難。如果有教,會有機會。因為對AI而言並不完全了解我們想要什麼,但會根據資料,如果資料不多都是根據特殊例子,這樣很難以學習、判斷。

黃相博:

在這樣親權案件當中,有無律師代理會影響判決結果嗎。

林昀嫻:

我們當初標註並沒有特別標注有無訴訟代理人,如果之後有在延伸會在參考。

黃詩淳:

在贍養費是否給付我們有做律師,被告有無律師代理,對是否勝訴會有顯著性,如果沒請律師敗訴的可能性就會顯著提高。

李建良:

第一點,可能輸入而不用透過訴訟解決,那當事人可能為質疑為何要相信,背後可能會有些因素,因為是未來是沒被驗證過,某種程度也是一種顧問的功能,這讓我想到德國在當年投墮胎合法化的問題,一定consulting才能墮胎。

第二點,實證研究部分有一套系統,AI是一套系統,也是回歸預測,那是否有比較過哪個系統較準確,有沒有可能這兩個系統做交互比較。

第三點,王老師有提到AI對是事實認定較弱,學習與預測是文字,未來案件是沒有被認定的,事實認定與事實判定,判決書是被認定過的文字。