關於LegalTech,有甚麼事對律師來說是不變的?

0

CoverPhotoCredit:Georges Lemmen,  Man Reading, WikiArt

沒有一個律師敢說,在執行業務的時候,可以完全不用查資料。查資料這件事,對於一個年輕律師,大概佔了30%的時間甚至更多,然後隨著經驗的累積(或是受雇律師的增加)而逐漸變少。如果不考慮業務開發或是行政管理等等的事宜,把律師業務的核心限縮在處理案件上,那律師的業務大概可以分為四個部分:

其中大多數的業務類型,律師會把大量的時間花在researching和production…

 

過去的法學資料庫發展

大約20年前,電子法學資料庫(後來逐漸轉為線上資料庫)的誕生,把律師們從紙本research的工作中解放出來。那時在技術上最大的突破,就是電腦運算速度的提升,足以把關鍵字和文本的比對速度,壓縮到大家在工作上可以接受的程度。

這20年來我們所理解到、所認知到的『搜尋』,基本上就是構築在『關鍵字和文本的比對』這件事情上。

在電子資料庫誕生前,律師們還在仰賴紙本research的時候,索引是最重要的搜尋工具,透過人工把所有文本分類完成並建立索引,以節省律師在查閱的時間。但在關鍵字和文本比對的搜尋功能下,索引所能節省的時間和能完成的工作,已經微不足道。

把所有符合關鍵字的文本搜尋出來,這就是第一代搜尋引擎的概念。

隨著搜尋引擎技術成熟,搜尋引擎設置門檻下降,政府機關也建立自己免費、開放的搜尋功能。民營的法學資料庫開始把資源投入在兩件事情上以提高自己的價值:

1.進一步協助使用者過濾資料
2.跨平台資料整合

由於第一代搜尋引擎只是把所有符合關鍵字的資料找出來,律師們還是必須靠自己一筆一筆過濾不需要的資料。法學資料庫為了協助律師們過濾這些資料,『裁判要旨』因應而生,『要旨』提供了使用者一個快速確認這筆資料是否符合需求的欄位,進一步節省律師的時間。

法學資料庫公司請了許多人,就是專門產出裁判要旨,以便協助律師們過濾判決書,加快搜尋速度。另一個就是透過人工建立不同資料間的連結,來加速不同資料間的交互參照,達到以資料找資料的目的,這些功夫都是為了協助使用者過濾及加快搜尋資料。

同時,由於許多法學資料散落在不同的機關網站資料庫中,律師們查找的時候非常困難,因此法學資料庫必須承包政府法學資料維護,並且透過這樣的方始把分散四處的資料集中到同一個平台,也就是『跨平台資料整合』

這兩件事造成了進入法學資料庫市場的高門檻,在『沒有裁判要旨』與『無法取得跨平台資料』的法學資料庫,幾乎無法有效切入市場。也因此過去20年來,台灣的法學資料庫版圖幾乎沒有改變。

但法學搜尋市場在資料取得的高門檻,卻也造成在『搜尋』這件事情上和外界的技術落差。

時間來到了20年後的現在

事實上,所有的搜尋引擎都專注在三件事情上。

更全面、更快速、更精確

在這20年間,法學資料庫不斷墊高『更全面』和『更快速』這兩個門檻,然而在搜尋引擎領域發展最具代表性的,其實是『更精確』。

很多人一直以為『搜尋』本質是把符合關鍵字的資料找出來,而搜尋的過程應該像上面這個圖。

但搜尋的本質應該是像上圖。每一個人是希望得到一筆(或數筆)想像中的資料,才去搜尋,而關鍵字是使用者把希望得到的資料轉換後的工具。也就是說,符合關鍵字的資料,未必就是使用者想找的資料(如果關鍵字下得不好)。

而什麼是『使用者想找的資料』,就是這20年來所有搜尋引擎不斷嘗試努力的目標。我們可以發現google從page rank的關聯度演算法,到自動修正關鍵字功能、或是『你是不是要找…』等等,都是嘗試去猜測使用者輸入關鍵字真正的『意圖』。

因此,在法學資料搜尋上,『Lawsnote』採取的就是專注在『更精確』這個功能上,來與傳統的法學資料庫做出區分。

因為深知在『資料完整性』與產出『裁判要旨』無法與傳統的法學資料庫競爭,Lawsnote索性專心研究『關鍵字辨識』與『關聯度排序演算法』,並透過這兩個優勢打造一框式的的搜尋方式,進一步節省律師在找資料上所花的時間。

很難說哪一種方法比較好或效率更高,當然有不同的產品問世,是使用者所樂見的。

法律系統的未來

人工智慧!

今年,精確一點,從AlphaGo初試啼聲以來,法律人便不斷被這四個字轟炸著,但人工智慧如果用法律術語來說,他是一個不確定的法律概念,我們回到通用搜尋引擎,來想想法律搜尋系統的未來。

剛才有提到,一個理想的『搜尋』,是我想找資料—->給我我想找的資料這樣一個過程,而過去20年來,所有搜尋引擎都不斷在深入挖掘到底什麼是『我想找的資料』,這個挖掘在第三代搜尋引擎,也就是以使用者為中心的搜尋引擎問世後達到一個里程碑。

那麼下一代,也就是第四代搜尋引擎會往哪裡去呢?

 

大部份人認為會往這裡發展,也就是搜尋引擎給出的,不再是符合搜尋結果的資料,而是一個『結果』。

舉例來說:當一個人搜尋Lebron James的時候,他想要得到什麼?

是Lebron James的官方網站、最近的新聞,還是『誰是Lebron James?』

第三代以前的搜尋引擎,沒有辦法告訴你誰是Lebron James,只能給你相關資料,讓使用者從相關資料拼湊出『誰是Lebron James?』搜尋引擎的下一個目標,將轉向提供使用者一個實體(entity)用來補充搜尋結果。而Google透過不斷擴充的『知識圖譜』來達到這個目標。

那對於法律系統呢?

我認為方向是一樣的。

法律系統將會往提供一個結果的方向前進,用來補充只是單純的提供資料。

這件事有沒有可能做到呢?有!而且正在發生。

在deep learning技術的成熟下,理論上,只要給予適當的訓練,電腦可以做到和人類類似的判斷邏輯。而許多legal tech公司也正在研究如何讓電腦『理解』法律文件,進而產出更有價值的結果。

記得上面的律師工作流程嗎?

目前很可能的想像是,法律系統將會從協助research進一步提供統整分析甚至是production的協助。

因此,在我們知道deep learning可以徹底改變資料科學rule base的資料處理方式,並且已經具體應用在包含翻譯在內的許多領域中,法學系統發生翻天覆地的改變也只是時間上的問題而已。

也因此,那些未來10年內都不會改變的事,對現在的律師來說顯得更重要。在未來10年有什麼不會變?應該有幾件事情:

  1. deep learning訓練電腦需要律師的協助,這也說明了大多數legal tech公司的創辦人通常是律師。
  2. 懂法律的資料科學家永遠是稀缺。(基本上任何領域都是)
  3. 信任、溝通、說服、理解對律師仍然很重要,那些事情電腦無法處理。
  4. 審判程序仍是以人為中心來進行,因為這是人類制定的規則,機器人法官這件事我們有生之年都不會發生。
  5. 考試不會廢除

 責任編輯:Leona

這篇文對你有幫助嗎?歡迎分享轉發!

About Author

熱愛科技的法律人,喜歡啤酒、喜劇和狗。

Comments are closed.