人工智慧與法律規範學術研究群
第二年期(2019-2020)
第十二次會議
2020年6月23日(星期四)
主持人:李建良(中央研究院法律學研究所特聘研究員兼所長)
主講人:林昀嫻副教授(國立清華大學科技法律研究所)、王道維教授(國立清華大學物理系)
◎ 整理:洪于庭
◎ 定稿:李建良

一、問題意識
當初一開始是從紛爭解決發想,我將研究聚焦在家事紛爭解決,在家事法院所會面臨到的困境,較不適合由訴訟解決,較適合由調解、諮商方式等,以解決長久以來家中不公平、正義之狀況。因為家中的狀況不太容易由訴訟解決,當進去訴訟程序時就希望勝訴,兩造關係進一步撕裂。故我希望尤其是離婚或是親權酌定由訴訟以外途徑解決,這對很多兒童少年一生有很大影響。
離婚後親權酌定之案件研究
兒童權利公約中提到,應以兒童最佳利益為優先考量。但這是不確定法律概念,兒童最佳利益的範疇為何,有許多文獻對之有相關探討。其實我們的民法中有提到應以子女最佳利益為參考,而親權酌定應有具體判斷因素,故民法第1055條-1有幾樣具體參考因素。選這個主題其中一個原因是因為有許多人研究過,才不會閉門造車。
AI應用在家事判決的可能性
- 可能性
- 案量大增
- 案件多屬單純
- 可減少訴訟
- 對法學研究與審判品質的幫助
- 對於家事案件做更全面的研究
- 讓法官能專注於負責和困難的案件
- 法院判決書的文字應用在自然語言處理(NLP)的優點
- 品質較高
- 數量龐大
- 生活相關
- 可解釋性
- 研究AI技術應用時可能的爭議:AI在司法審判的爭議,如State v. Loomis的案件。但我們還是必須發展國內AI在司法上的應用,如國內未應用僅討論國外案例會有點可惜。
二、以法實證研究議題為例
我們搜集2015~2017年所有的判決,總共2620件,酌定親權有1343件,我們就看1343件,我們的研究發現:
- 親權歸屬於父或母
- 判決考量因素的分析:我們把民法第1055條-1考量的因素分成13種,統計這13個因素在案件中出現頻率。
- 城鄉差異:母親獨任比例在都市較高,但不會差很多。
- 從未進入司法體系的侵權分配事件:進入法院前,就因為雙方有共識而不用進入法院者,父親單獨行使親權狀況比較多。
三、標注資料庫的建置
技術部份是關於自然語言模型的處理,我知道在法律方面觀之會有很多人權問題。
判決書理據標註舉例
於我們的研究而言會教有利文字(得到親權)、不利文字,先做對申請人有無利判斷,較不會出錯,就此可以看到法官的態度為何。有一個好處這樣的標注方式是在文字內容,會減少偏見情況。那該因素是否重要,法官發現可以將其他因素寫入判決中,法官可以寫別的理由,可能會造成不同解讀方式,法官會有看孩子意願會這樣判,即便不看孩子意願也會這樣判,就會產生差異。
標註並沒有單一方法,特別是從判決書內容預測判決結果,這些標註資料在外來可以做資料擴增、偏見研究,不等於判決書但把判決書重要部分提出,好的判決書因為各項資料與論述相當充分,即便指標到其中部分亦足以做判決預測。
為什麼學習應用在判決之可行的,我們將判決整理成等效判決書,在做資料預處理,提取特徵或向量化,我們的判決預測適用深度學習的結構,我們輸入的資料是聲請人有利不利的文字、相對人有利不利的文字,將文字轉成向量,將向量投入類神經網絡學習,綜合向量出來的是800維向量,這是為何在應用上會有人認為好像有點像黑箱的意義,電腦是看不懂單個字的意思,但可以根據單個詞對於該判決有多重要。
初步結果:三分類的文句意象判斷
將六千多條有利不利文字段落,我們亦可用隨機選取的中性文字做三分類的預測,顯示我們的模型已有相當能力來判斷包括中性的文字意象,有助於提升對於整體判決的預測準確度。
兩分類的侵權裁定預測
判給聲請人或相對人我們的預測準確率是93%,在做文字分析,因為法院是高品質文字所以效果非常好。如果我們今天適用勾選方式,數目很多,判決準確性很高是沒意外的情形。但就法院是不確定文字,本系統可輸入不固定的文字長度或句數分析,方便於實務情境
三分類親權裁定預測
判給雙方的案件差異是較大的,容易有誤差。
解釋性問題
- 解釋對象:最近有文獻討論,工程師會認為並沒有問題,他看這個城市的運算結果知道原因,但一般人看不懂,語言不同
- 配合統計分析:AI預測應該與統計分析或法實證研究互相配合
- 演算法的改進:有些演算法會有一定的解釋力,目前也有將文字中的主要因素凸顯,如self attention model(自我注意力模型),他可以把文字自我標註,在superviselearning在某些句子會與這個結果有關的,會將此呈現出來。一開始對兩造有利不利的句子是人標的,我們希望是AI可以自己標的。
四、建構自然語言
五、建構親權預測系統與未來發展
- 仍有使用上不足之處
- 一般大眾的表達語法與法官的專業語法仍有不同
- 關於兩造雙方的事實認知可能會有偏袒、不全或錯誤
- 我提供影片供大家參考我們系統運用方式
- AI侵權判決預測系統的使用情境:原則上當事人自己就可以上網使用,但若能透過第三方會更理想,社福人員可斡旋,有助於庭外和解,減少花費對簿公堂的傷害。但是還是需要各種輔助環境的支援。
- 未來發展方向:擴展到其他案件
- 發展新的AI技術:亦可用此NLP方式開發自動標註、訴狀
- 法學相關議題:可更深度研究AI應用限制或人權、倫理等
- 促進司法的透明性:類似案件一般人民可以預期結果,促進透明性、穩定性與可親性,對於和解應有幫助的。
結語:以AI與法律的結合促進社會公義
希望能帶來以下幾項正面影響
- 以法實證研究提升司法穩定性可預測性
- 減輕法官負擔
- 協助弱勢當事人
- 利用審判書大量高品質的文字資料,發展可解釋性AI
- 促進科技與法律更多合作

問題與討論(敬稱省略)
黃詩淳:
我上次報告的民事判決的應用,查了一些文獻,在事實認定方面在AI的幫助較小,法律適用方面較大,剛剛王老師提的也是法律適用方面。那我們將之稱為預測判決系統是否恰當,好像只是在測試AI是否看得懂裁判書,會能夠幫助司法人員嗎,因為還是必須自己判斷事實
王道維:
這是參考性的,並不會代替法官,在陳述時可能給出的意見會是偏頗的,在協調時雙方給出的意見給雙方律師在訴訟前,在訴訟策略上可以使用。大概功能是,雖然有些限制,但在這些限制內時,也許可使使用者判斷法官想法為何。又如可能在鄉間使用者,事實可能沒問題,但在法律認定上較無知,如使用此系統,較能知道法官不會這樣想,可能不會提起訴訟。
李建良:
用判決書的內容去預測判決結果,是下個判決的結果,那正確率的結果。
王道維:
都還是既有判決中做預測,該網頁是就未知判決,所以不知道結果,我認為可以與法扶合作,就看如何使用。
黃詩淳:
在做測試組時,也是讓30%的裁判,並不是讀全文只是讀原因。
邱文聰:
黃老師上個月的是今天作業的前端部分,看是否有讀懂判決,今天做的是標註,預測親權判決結果。
黃詩淳:
如果要真的知道法官為何要判給父母,還是要透過判決書才能知道要因為何。實證也是很重要的,前段林老師的部分會是很重要的部分。
林昀嫻:
我們有與司法院的人報告,他們比較想知道法實證的部分,我們的角度是此系統無法取代法官,黃老師剛剛提的,網站上提出的事實及系統被餵養的資料,這兩者是需要轉換的,所以一開始在講減輕法官的負擔,並非一部份取代法官,僅是在紛爭解決流程中,未進入司法體系,是否可先解決部分紛爭,以減輕法官負擔,法實證部分也還在發展中。
陳弘儒:
這套系統的目的是正式進入法院的案件量變少,當一個親權爭議出現後,會進入訴訟的關鍵性原因是什麼,該閾值為何。如果可以與王老師的部分搭配,會有相輔相成的作用。
林昀嫻:
我常與家事法官談,有一個案例是,夫妻已進入法院,先調解、調解不成才進入法院,女方是貴婦,男方稱離婚後小孩歸女方,每個月50萬,不包括子女教育費,後來談不攏的原因是因為,女方主張房子的管理費誰付,一般來說很難會想到進入訴訟的關鍵點是管理費。
陳弘儒:
所以這樣系統有可能沒辦法很大量減少案件進入家事法院。
王道維:
也許我們一開始設定是這樣,但用途可能不一樣。有人認為可能會取代律師角色,但也有人認為可以看出訴訟策略方式
楊岳平:
我想請問有無要回歸分析,如果我們只看百分比很難看清楚。
王道維:
有我們現在在寫paper,做回歸可讓一般人看懂。事實上AI也是可以做這樣的研究。
楊岳平:
在這基礎上,我們在做回歸,要找的是Causation,剛剛在分析中提到有些真正原因不會揭露在其中,會有疑慮,可能我們找到是法官再分配親權時會用什麼措詞,在這系統中是否為重要,還是找到correlation即已足。在這過程中是否會讓correlation 與causation模糊。
王道維:
這問題幾乎是對所有AI研究都相同的,判決書中法官是否會有心證決定判給誰。我們目前所有研究的數據從這裡來,故我們也很避免這種質疑,但至少這種方式能告訴我們這是可能的。如果法院能把所有卷宗電子化,我們去做標註,才有可能。至少現在法官所講原因與最後有一致性,最後再去訓練較複雜案件,這是針對資料部分。針對演算法部分,我認為是會有更多進步,他可能沒辦法100%告訴原因,他適用後設的方式檢驗,科學方式就是這樣,但可以用不同方式檢驗。中間可能會有些差異,最後結果是問誰較有機率勝訴,這系統整體而言還是可靠的,我們可以用其他方式檢驗是否有問題,如果沒有實證方式。
楊岳平:
我們需要知道因果關係嗎,還是一個系統只要有correlation就好,上次討論的是,若不是做判決以一個預測目的來說是不用causation。
王道維:
必須要看使用目的,這並非定量計算,他會抓到句中哪些對判決重要的,如果這樣結果可以幫助這樣結果是合理的,那麼這問題並非想像中重要。
陳弘儒:
回歸其實沒有探討因果關係,沒辦法決定原因跟結果,當然社會科學做很多。所謂的原因或許不是在一群數據中且為未成年子女的主要關係者,應該是將所有判決都拿掉。
王道維:
我其實想做,若將此因素完全拿掉,才能完全體現其他事實
邱文聰:
我們在談因果關係時,必須要有前提時基礎事實。
王道維:
有些研究會把因果關係放入其中,將整套演算法放入。
蘇凱平:
我最大期待是correlation取代 causation,人類想法會想找出原因,但該原因是否存在,我覺得NLP如果可以擴大範圍,如果可以訓練機器的方式,將範圍拉大,有沒有可能我們知道這樣因素會導致這樣結果,不用知道特定因素,因為法官也是這樣做的,他們會有insight不會以 causation存在,NLP是針對此,我有相當期待。我在做律師時,與高等法院庭長學習時,他修改我的訴狀會將‘將’改成‘使’,他認為較會勝訴,美國與有許多文獻有討論此,如果你將‘將’單獨預測是不會有意義,透過NLP前後文可以得出標註結果,可能會有correlation。
楊岳平:
這個沒辦法做判決預測系統,並不會單輸入‘將‘。
蘇凱平:
司法院的量刑資訊系統很多法官不願意用,於高等法院105年度交上易字第117號刑事判決,該案中一審判六個月,檢察官說太輕,被告說太重,量刑資訊系統中相類似的案件判刑,一個是四個月、六個月,是判在該區間中,故並無激輕激重,該判決也選為最具參考價值裁判,至個案子因子很單純,沒有人死傷、沒有上訴審,不需要解釋原因,就是審理上訴理由,沒有激輕激重就是他的說理方式。
鄭瑞健:
假設某個系統很好,如果之後有法官與系統的意見大相逕提,那請問該如何處理。
林昀嫻:
我們並沒有認為係作為訴訟一環、為必經程序。
王道維:
如果我們持續發展,的確有可能會有這樣發展,當事人雙方如果都做該預測,這項有個好處是,為了預測結果,可能需要填寫,自身與對方的有利不利條件填寫,法官可以透過此做整合,可以從事實面得知可以採取何作為其理由,可以使法官心證更明確知道來自為何,在系統中可能會得到應該判給母親,法官應有責任在判決書中寫的更明確。
王道維:
你們有無考慮舉證責任配置為題,如有些欄位我沒填,但舉證責任在對方,法院應該判對方敗訴,這樣是否有問題,同樣這套自然語言學習是否有可能。如果沒有大量資料可供學習,這部分將會較困難。如果有教,會有機會。因為對AI而言並不完全了解我們想要什麼,但會根據資料,如果資料不多都是根據特殊例子,這樣很難以學習、判斷。
黃相博:
在這樣親權案件當中,有無律師代理會影響判決結果嗎。
林昀嫻:
我們當初標註並沒有特別標注有無訴訟代理人,如果之後有在延伸會在參考。
黃詩淳:
在贍養費是否給付我們有做律師,被告有無律師代理,對是否勝訴會有顯著性,如果沒請律師敗訴的可能性就會顯著提高。
李建良:
第一點,可能輸入而不用透過訴訟解決,那當事人可能為質疑為何要相信,背後可能會有些因素,因為是未來是沒被驗證過,某種程度也是一種顧問的功能,這讓我想到德國在當年投墮胎合法化的問題,一定consulting才能墮胎。
第二點,實證研究部分有一套系統,AI是一套系統,也是回歸預測,那是否有比較過哪個系統較準確,有沒有可能這兩個系統做交互比較。
第三點,王老師有提到AI對是事實認定較弱,學習與預測是文字,未來案件是沒有被認定的,事實認定與事實判定,判決書是被認定過的文字。