我國電商採取演算法訂價之實務初探及模擬

公共性與AI論壇(三十)

時間:2024/3/11(一)10:00-12:00
地點:中研院法律所第一會議室

主講人:林常青(國立成功大學經濟學系教授/中研院經濟研究所兼任研究員)
主持人:李建良(中央研究院法律學研究所特聘研究員兼所長)

Photo by Peter Bond on Unsplash

一、研究起因與大綱

此研究起源於政府公平會委託之企劃,主要處理我國電商利用演算法來進行聯合行為;此演講的第一、二部分先介紹目前聯合行為的態樣以及被廣泛使用在聯合行為的演算法Q-learning,第三、第四部分則為眾人討論哪些聯合行為具有違法性、未來立法的可能,以及針對演算法技術本身的探討。

二、聯合行為態樣介紹

(一)領導與跟隨

市場中的小廠商根據大廠商對價格的調整來競價與回應,通常大廠商做出價格的調整,小廠商便會跟著調漲,至於是否有聯合行為的疑慮,則在於大廠商做市場價格調整之前,是否先釋放訊息給小廠商,使其做好準備。

(二)分割定價

以飛機機票的附加燃料稅為例,此時若附加燃料費由各廠商來做決定,這就使其成為強制費用,廠商們可以開會串通勾結,讓原本的機票金額強制再加上其他費用。

(三)差別取價

差別取價可分為多階,以二階差別取價為例:買一個橘子50元,而買兩個橘子則為每個45元。許多文獻對差別取價行為進行探討,主要在於其中是否存在成本的空間限制,因為以經濟學模型來說,差別取價是沒有空間成本的,因此人們會想知道,若加入空間成本,對於差別取價的行為將有何種影響。

(四)價格匹配保證

價格匹配保證的有趣之處在於,一般情況下大多數人可能會認為顧客在與電商交易時,會商議若甲家的價格比乙家低,則用原價格向甲電商進行購買,若比較高,則用乙家的價格來向甲家購買;然而事實上各電商們會逆向操作,聯合將價格漸漸調漲。

林老師在此先給出一個判斷標準:以上四類行為是否有違法律,基準點在電商之間對價格調整的行為是否具有合意,然而要證明有合意太過困難,因此在我國的官司上,幾乎沒有斷定具有聯合行為的判例。

三、Q-learning(Q學習法)

(一)前言

演算法之所以重要,主要在做聯合行為時的第一步,是向其他的電商釋放訊息,然而執行面會碰到的困難為對方的背叛,如何快速監測到對方的背叛並進行處罰,就成了電商們是否能完成聯合行為的關鍵點。

(二)進行方式

Q-learning考慮狀態(state)與採取行為(action)所構成矩陣下,預測每個組合下期望的最終獲利,在某個實際狀態 s 下,可以窮舉所有的可能動作 (定價),找到最大最終獲利的就是最佳動作。這是一個不斷的try and error的過程,然而這同時是一項非常龐大的工程,因此又有了深度Q-learning,也就是把前述的矩陣,變成神經網絡(neural network)去計算。在深度Q-learning之下,可以投入的狀態與行為比傳統多、速度快,即為深度Q-learning。簡言Q-learning和深度Q-learning的最大差別在於,前者是逐一慢慢更新(update),而後者有一個神經網絡同時去抓取每一個點所對應的好處,並同時全部算出來。

廠商的實務操作是利用爬蟲技術做大量抓取,不只是每十分鐘或十五分鐘抓一次價格變動,甚至可以達到每三十秒一次,替廠商進行高頻率的相互監控;小廠商即使自己無法寫出這樣的程式,然而可以請相同的軟體公司幫忙代寫;因此只要使用這個程式的公司,基本上就可以獲取較高的利潤;即使在差別取價中,沒有主要供應商的情況下,一般的廠商仍可用這個軟體來上下偵測價格,尋找市場反應的途徑。

而總結來說,若單純以結果論,其他三項以目前的法律來說很難找到有合意的聯絡。

(三)定義聯合行為的困難性——難以確立合意行為

廠商總有各種理由來說明己身所為並非公平交易法第14條所稱的聯合行為,廠商們辯稱自己的行為並非在合意之下所進行,如是經由:市場狀況、商品服務的特性、成本利潤的考量或事業行為經濟合理性等因素,所推定出的價格,實務上也很難去抓到真的有契約的協定;而且如上所述,除了差別取價違法之外,利用AI演算法,完全不需要現今法條所規定的聯合行為,就可以達到一樣的效果。最終,政府希望這些研究能夠從AI的編碼中去抓出廠商們藏匿的合意訊息。

至於目前協助公平會的任務可分為下列幾項:

  1. 廠商的定價有沒有使用演算法去做?
  2. 如果前述的答案是肯定的,那廠商靠著演算法實際做出來的行為和演算法的結果差距到底有多遠?
  3. 廠商在成本高或低時,上述的聯合行為是否較容易產生?

然而以目前的技術可以做到前兩項,第三項還在模型的階段。

另外所遭遇的難題在於,什麼是合理價格的基準?在自由市場裡面很難去定義什麼時候價格偏離競爭所得出的價格,所以此計畫所給予的「標準價格」也是一個假設,政府實際上只能有「合理的懷疑」。然而在國外還是有些案例,在領導跟隨當中,用小廠商對大廠商定價改變反應的速度來做標準。

 (四)OECD的管制

OECD於2020年開始意識到電商演算法需要管制,因此出現許多對電商演算法的研究,這些研究總體而言可用實驗性和實證性劃分:實驗性的研究,使用大量電腦及工程師加入,假想一種需求或是市場狀態,並測試AI能否達到聯合行為的結果。通常在模擬領導與跟隨的情況,會挑選一大兩小的廠商,這是在實際上比較容易引起領導跟隨情境的緣故,如A廠商具有極大的市佔率,其他廠商就會跟隨著他的定價來做變動;實證性的研究則較實驗性研究晚出現,OCED開始蒐集整個歐洲最大的電商平台——Amazon的資料,進而分析在什麼樣的狀況之下,Amazon會出現探測並定價的行為。

四、聯合默示行為

(一)聯合默示行為與默契協調行為

相較於法律對於聯合行為要有明確合意的嚴格規定,經濟學家Green等人(2014)提出「聯合默示行為」,將行為分成「發起」和「執行」兩階段:在發起階段有溝通者,稱為「弱勢聯合行為」,倘若在發起和執行階段皆有溝通者,則為「強勢聯合行為」;然而以達到聯合行為的結果來說,廠商們甚至在任何階段都不需要進行溝通,只要經由市場接觸、公開市場披露、結合領導跟隨、共同所有權以及產業協會等等管道,就可以達到聯合行為的結果,在經濟學上稱為「默契協調」。然而在法律和經濟學上儘管知道廠商們可能有以上行為,但即使以是否有溝通行為為基準,也很難從嫌疑階段到掌握實體證據,而且說不定這樣的市場價格,確實是自然的默契所得出的結果。

(二)相關判例

目前能找到與默契聯合行為相關的判例僅有三例:

  1. 聯合訂機票系統

在聯合訂票系統的機制下,理論上各家航空公司就可以透過這個公開市場披露的行為,對價格進行協議;法院的見解則認定,允許聯合訂票系統的存在,然而禁止廠商後續的商議行為,該行為是違法的。

  1. 煙草公司

煙草公司的壟斷行為則是法院的確有找到相關的聯合行為證據,並且利用這背後的證據,推斷出菸草商們確實有利用主導地位在進行聯合行為。

  1. 有意識的平行行為

基本上廠商們並沒有合意,事情就自然地發生了;這在實務上不僅案例稀少,並且有些認定這根本不算聯合行為,在調查的過程當中,要證明有罪之前,需要花費極高的精力去證明沒有罪的狀態。

(三)市場價格是否受到演算法影響判斷方法

即使市場的價格看起來和演算法的價格合致,然而就如同上述所言,合意的證明是一個困難,另一個困難在於,廠商們不見得會一直待在演算法位置,極可能在觀察的時間,又忽然回到競爭市場價格,並且無法證明廠商是否有使用演算法,因此有以下判斷模式:

  1. 價格的改變是否十分快速?並且是否幾乎都在同一時間改變價格?
  2. 賣家與賣家之間的相關性,如:德國零售車市場的油價,就是由上述的變動次數還有反應時間判斷其有聯合行為;Massow (2022) 年利用Amazon的資料來進行調價。值得注意的是後者和Q-learning沒有關係,是尚未受到演算法干涉的領導與跟隨現象。
  3. 在價格突升突降中廠商對於背離聯合行為廠商的懲罰機制。

(四)小結

以電商來說,進行的方式是使用Python程式將可能有聯合行為的商品抓出,商品必須同質性高且規格統一(或是規格容易轉換),並挑選出價格變動高、數量多、就資料庫事實是可以驗證者,而後分為四個階段,看電商是否在同一個階段調價一致;目前尚未做到跨平台的比較,所以有可能在挑選的平台中,剛好只是該廠商的定錨價格,而非真正的競爭平台;而在民生商品方面,調價的速度因買家眾多,所以較電商和電腦產品慢,但在同一階段調價的行為,也存在聯合的可能性,並且電腦商品有一些管道可以互相跟隨,但民生用品有時在這樣沒有相互即時性的情況下,很難以傳統的方式、每日價格的評斷來判斷是否有聯合,因此實驗的時間拉長到一年半,且民生商品的演算法極可能為半人工演算,然而這個實驗至少可以偵測出民生用品的跟隨狀態。

接下來則以經濟學為基礎,用成本、需求和競爭價格來算出調價行為和原本應當有的競爭價格相差多少,並有一條競爭價格線以及用演算法算出的聯合價格線,最初價格會在兩條線之間波動,最終會比聯合價格低一點;這個現象目前可能以小廠商估算自己的利潤來決定最後定價作為解釋;然而其中最重要的是,這些模擬的背後都有著非常強的假設,無論是成本或是消費者需求或是競爭狀態;總結來說,模擬需要假設各種需求線、各種狀態——競爭或聯合,目前還有許多地方不能完全使用演算法施做,需要人工了解市場真實的情況,才能全然理解演算法對於市場的影響。

五、提問與回答

提問者

在第一部分的結論中,三家廠商都採用不同的定價方式,是因為成本的不同,或者這是他們依據演算法運算之後的結果?

林老師

這是我們用演算法算出來的結果。依據我的推測,是因為領導商的價格沒有上去,而這可能是因為領導商根據過去的模式判斷,告知其他小廠商將價格提升上去,利潤也不會提升多少,因此結果定價不同,看似沒有聯合行為。

提問者

  1. 我們可否根據老師的研究知道甚麼時候購入電子產品價格最低?
  2. Q-learning會抓每一個價格變動的反應,其他的模型不一定是這樣子,Q-learning對於每一個變動一直都是這麼敏感嗎?

林老師:

  1. 透過長期觀察,我們的確可以知道比方說Amazon在哪個時間點會調降價格,如深夜兩點可能可以用不錯的價格買到東西。
  2. 的確Q-learning速度快但耗費大量過去的資料,所以即使它的學習效率高,有些研究也不見得使用這個演算法;我們之所以使用Q-learning其實是經濟學本來就對Bertrand 均衡情有獨鍾,而Q-learning的架構和經濟學有無限多期、行動能夠收益多少的設定非常接近,並且執行起來成效不錯。

提問者

然而Q-learning的缺點在無法給予一個區間,只能顯示IQS是多少,這樣於實際應用上會不會有些僵化?

林老師

對。因此當針對Q-learning這個問題的文獻出來時,帶給公平交易經濟學很大的震撼,因為直接從結論來看,就是沒有合意都可以達到刻意去壟斷的聯合行為價格;因此要使用Q-learning是有辛苦的地方沒錯。

提問者

  1. 在領導者與獨佔者的模型當中,假設的商品是同質性的嗎?如果答案為是的話,為甚麼會有領導者和跟隨者的差別存在?
  2. 雖然在這個研究市場之後,政府對於市場的控管可以從寡佔市場到非寡佔市場,監控性好像變強了,然而首先演算法定價不一定如我們所假設的那麼強,直接把寡佔市場延伸到非寡佔市場;其次,研究對產品的分級和一般消費者腦中的分級可能不一樣;最後,這個研究挑戰了原本既定的寡佔市場很容易逼近聯合市場的概念,不知道團隊對這一點有沒有更進一步的分析?

林老師

  1. 就模型的部分來說,其實我們所假設的需求線並不是完全的統一值,至於異質的來源目前還沒有仍有許多擴充的空間。但目前以需求線的異質性來設計,並且容許不確定性在需求線中而以誤差項呈現。
  2. 的確,同意提問者的論述,並且這個技術的發明的確讓即使沒有聯合行為都可以形成寡佔市場的界線變得模糊,因此我們希望將來的科技可以找出他們演算法中是否有程式來進行溝通,而達聯合行為的標準。

提問者:

會不會其實現在的業者所使用的演算法其實沒有那麼進步,還沒有用到Q-learning?因此真實的結果和你們研究做出來的有差異?

林老師

就我所知,目前市面上Q-learning的確還不是主流被運用的模式,廠商可能直接進行聯合行為,或是要機器人定點監控,但用Q-learning這樣操作的或許還不多。

提問者

請問領導商是否有特別的定義?

林老師

通常稱領導商就是可以自己決定定價以及販賣數量,決定完之後下面的廠商再根據其行為進行後續的買入。

提問者

  1. 那主流廠商如何定義呢?因為這和我們消費者想像的不太一樣,通常會想像價格較低者為主流廠商,然而就老師的圖而言領導的反而價格高?領導商是否會知道自己為領導商?
  2. 為什麼廠商的價格調動會這麼勤?

林老師:

  1. 主流廠商通常會知道自己是主流廠商;而主流廠商除了看市佔率之外,也要看其對於市場的影響力,比如有些咖啡就有非常特定的客戶群,而其他咖啡店不敢亂調價,因為客戶忠誠度沒那麼高,會流失,因此咖啡的價格就看那個影響力大的廠商。
  2. 調動勤其實也來自於消費者對於價格的敏感度。(比如:精緻電子產品)

提問者:

公平會本身可以委託研究者來使用演算法更快速的掌握市場,然而從弱勢的消費者來講,在資訊取得上其實能力有限,想請問從消費者保護的角度,是否就這點應該要有法律管制的保護?

林老師:

消費者在面對廠商的聯合行為時,的確屬於比較弱勢的狀態;但就資訊取得而言,目前市面上有許多爬蟲軟體可以讓消費者知道廠商的評價、賣出數目、各家價格等等,因此消費者的監控能力其實也很強勢。

提問者:

這個演講似乎是在表達演算法可以達成一些原本需要聯合行為才能達成的結果,那有沒有可能,從演算法本身開始就去進行管制呢?

林老師

提問者將此次演講總結得很好。沒錯,OECD在2017年的文獻當中有建議,檢查演算法本身的CODE或是看看是否廠商們皆將軟體交由同一家廠商來設計,然而有很多層面還是目前法規規範不到的待解決議題。

提問者

Q-learning是專門為了這個計劃來設計的嗎?

林老師

不是,其他方面只要有相類似的情境都可以使用。