教授Gary Marcus就對深度學(xué)習(xí)展開了系統(tǒng)性的批判。此前,圖靈獎獲得者,UCLA教授Judea Pearl的題為Theoretical Impediments to Machine Learning with Seven Sparks from the Causal Revolution的論文中,就已探討了當(dāng)前機(jī)器學(xué)習(xí)存在的理論局限性,并給出了面向解決這些問題,來自因果推理的七個啟發(fā)。Pearl教授在NIPS 2017系列活動中對本文進(jìn)行了討論,隨后,他也對一些人們關(guān)心的問題進(jìn)行了解答。 當(dāng)前的機(jī)器學(xué)習(xí)幾乎完全是統(tǒng)計學(xué)或黑箱的形式,從而為其性能帶來了嚴(yán)重的理論局限性。這樣的系統(tǒng)不能推斷干預(yù)和反思,因此不能作為強(qiáng)人工智能的基礎(chǔ)。為了達(dá)到人類級別的智能,學(xué)習(xí)機(jī)器需要現(xiàn)實模型(類似于因果推理的模型)的引導(dǎo)。為了展示此類模型的關(guān)鍵性,我將總結(jié)展示7種當(dāng)前機(jī)器學(xué)習(xí)系統(tǒng)無法完成的任務(wù),并使用因果推理的工具完成它們。 圖1:因果關(guān)系的類型 因果推理模型的 7 種特性 考慮以下5個問題: 給定的療法在治療某種疾病上的有效性? 是新的稅收優(yōu)惠導(dǎo)致了銷量上升嗎? 每年的醫(yī)療費(fèi)用上升是由于肥胖癥人數(shù)的增多嗎? 招聘記錄可以證明雇主的性別歧視罪嗎? 我應(yīng)該放棄我的工作嗎? 這些問題的一般特征是它們關(guān)心的都是原因和效應(yīng)的關(guān)系,可以通過諸如「治療」、「導(dǎo)致」、「由于」、「證明」和「我應(yīng)該」等詞識別出這類關(guān)系。這些詞在日常語言中很常見,并且我們的社會一直都需要這些問題的答案。然而,直到最近也沒有足夠好的科學(xué)方法對這些問題進(jìn)行表達(dá),更不用說回答這些問題了。和幾何學(xué)、機(jī)械學(xué)、光學(xué)或概率論的規(guī)律不同,原因和效應(yīng)的規(guī)律曾被認(rèn)為不適合應(yīng)用數(shù)學(xué)方法進(jìn)行分析。 這種誤解有多嚴(yán)重呢?實際上僅幾十年前科學(xué)家還不能為明顯的事實「mud does not cause rain」寫下一個數(shù)學(xué)方程。即使是今天,也只有頂尖的科學(xué)家能寫出這樣的方程并形式地區(qū)分「mud causes rain」和「rain causes mud」。 據(jù)所了解,過去三十年的事情已發(fā)生巨大變化,一種強(qiáng)大而透明的數(shù)學(xué)語言已被開發(fā)用于處理因果關(guān)系。伴隨著一套把因果分析轉(zhuǎn)化為數(shù)學(xué)博弈的工具,這些工具允許我們表達(dá)因果問題,用圖和代數(shù)形式正式編纂我們現(xiàn)有的知識,然后利用我們的數(shù)據(jù)來估計答案。進(jìn)而,這警告我們當(dāng)現(xiàn)有知識或可獲得的數(shù)據(jù)不足以回答我們的問題時,額外的知識或數(shù)據(jù)源能使問題變的可回答。 我把這種轉(zhuǎn)化稱為「因果革命」(Pearl and Mackenzie, 2018, forthcoming),而導(dǎo)致因果革命的數(shù)理框架我稱之為「結(jié)構(gòu)性因果模型」(SCM)。 據(jù)羿戓設(shè)計所了解,SCM由三部分構(gòu)成: 圖模型 結(jié)構(gòu)化方程 反事實和介入式邏輯 圖模型作為表征知識的語言,反事實邏輯幫助表達(dá)問題,結(jié)構(gòu)化方程以清晰的語義將前兩者關(guān)聯(lián)起來。 接下來介紹SCM框架的7項最重要的特性,并討論每項特性對自動化推理做出的獨(dú)特貢獻(xiàn)。 1. 編碼因果假設(shè)—透明性和可試性 圖模型可以用緊湊的格式編碼因果假設(shè),同時保留透明性和可試性。其透明性使我們可以了解編碼的假設(shè)是否可信(科學(xué)意義上),以及是否有必要添加其它假設(shè)?稍囆允刮覀儯ㄗ鳛槿祟惢驒C(jī)器)決定編碼的假設(shè)是否與可用的數(shù)據(jù)相容,如果不相容,分辨出需要修改的假設(shè)。利用d-分離(d-separate)的圖形標(biāo)準(zhǔn)有助于以上過程的執(zhí)行,d-分離構(gòu)成了原因和概率之間的關(guān)聯(lián)。通過d-分離可以知道,對模型中任意給定的路徑模式,哪些依賴關(guān)系的模式才是數(shù)據(jù)中應(yīng)該存在的(Pearl,1988)。 2. do-calculus和混雜控制 混雜是從數(shù)據(jù)中提取因果推理的主要障礙,通過利用一種稱為「back-door」的圖形標(biāo)準(zhǔn)可以完全地「解混雜」。特別地,為混雜控制選擇一個合適的協(xié)變量集合的任務(wù)已被簡化為一種簡單的「roadblocks」問題,并可用簡單的算法求解。(Pearl,1993) 為了應(yīng)對「back-door」標(biāo)準(zhǔn)不適用的情況,人們開發(fā)了一種符號引擎,稱為 do-calculus,只要條件適宜,它可以預(yù)測策略干預(yù)的效應(yīng)。每當(dāng)預(yù)測不能由具體的假設(shè)確定的時候,會以失敗退出(Pearl, 1995; Tian and Pearl, 2002; Shpitser and Pearl, 2008)。 3. 反事實算法 反事實分析處理的是特定個體的行為,以確定清晰的特征集合。例如,假定Joe的薪水為Y=y,他上過X=x年的大學(xué),那么Joe接受多一年教育的話,他的薪水將會是多少? 在圖形表示中使用反事實推理是將因果推理應(yīng)用于編碼科學(xué)知識的非常有代表性的研究,每一個結(jié)構(gòu)化方程都決定了每一個反事實語句的真值。因此,我們可以確定關(guān)于語句真實性的概率是不是可以從實驗或觀察研究(或?qū)嶒灱佑^察)中進(jìn)行估計(Balke and Pearl, 1994; Pearl, 2000, Chapter 7)。 人們在因果論述中特別感興趣的是關(guān)注「效應(yīng)的原因」的反事實問題(和「原因的效應(yīng)」相對)。(Pearl,2015) 4. 調(diào)解分析和直接、間接效應(yīng)的評估 調(diào)解分析關(guān)心的是將變化從原因傳遞到效應(yīng)的機(jī)制。對中間機(jī)制的檢測是生成解釋的基礎(chǔ),且必須應(yīng)用反事實邏輯幫助進(jìn)行檢測。反事實的圖形表征使我們能定義直接和間接效應(yīng),并確定這些效應(yīng)可從數(shù)據(jù)或?qū)嶒炛性u估的條件(Robins and Greenland, 1992; Pearl, 2001; VanderWeele, 2015) 5. 外部效度和樣本選擇偏差 每項實驗研究的有效性都需要考慮實驗和現(xiàn)實設(shè)置的差異。不能期待在某個環(huán)境中訓(xùn)練的模型可以在環(huán)境改變的時候保持高性能,除非變化是局域的、可識別的。上面討論的do-calculus提供了完整的方法論用于克服這種偏差來源。它可以用于重新調(diào)整學(xué)習(xí)策略、規(guī)避環(huán)境變化,以及控制由非代表性樣本帶來的偏差(Bareinboim and Pearl, 2016)。 6. 數(shù)據(jù)丟失 數(shù)據(jù)丟失的問題困擾著實驗科學(xué)的所有領(lǐng)域;卮鹫卟粫谡{(diào)查問卷上填寫所有的條目,傳感器無法捕捉環(huán)境中的所有變化,以及病人經(jīng)常不知為何從臨床研究中突然退出。對于這個問題,大量的文獻(xiàn)致力于統(tǒng)計分析的黑箱模型范式。使用缺失過程的因果模型,我們可以形式化從不完整數(shù)據(jù)中恢復(fù)因果和概率的關(guān)系的條件,并且只要條件被滿足,就可以生成對所需關(guān)系的一致性估計(Mohan and Pearl, 2017)。 7. 挖掘因果關(guān)系 上述的d-分離標(biāo)準(zhǔn)使我們能檢測和列舉給定因果模型的可測試推斷。這為利用不精確的假設(shè)、和數(shù)據(jù)相容的模型集合進(jìn)行推理提供了可能,并可以對模型集合進(jìn)行緊湊的表征。人們已在特定的情景中做過系統(tǒng)化的研究,可以顯著地精簡緊湊模型的集合,從而可以直接從該集合中評估因果問詢。 NIPS 2017 研討會 Q&A 我在一個關(guān)于機(jī)器學(xué)習(xí)與因果性的研討會(長灘NIPS 2017會議之后)上發(fā)表了講話。隨后我就現(xiàn)場若干個問題作了回應(yīng)。我希望從中你可以發(fā)現(xiàn)與博客主題相關(guān)的問題和回答。 一些人也想拷貝我的PPT,下面的鏈接即是,并附上論文: http://ftp.cs.ucla.edu/pub/stat_ser/r475.pdf NIPS 17 – What If? Workshop Slides (PDF)(http://causality.cs.ucla.edu/blog/wp-content/uploads/2017/12/nips-dec2017-bw.pdf) NIPS 17 – What If? Workshop Slides (PPT [zipped])(http://causality.cs.ucla.edu/blog/wp- content/uploads/2017/12/nips-dec2017-bw.pdf) 問題 1:「因果革命」是什么意思? 回答:「革命」是詩意用法,以總結(jié)Gary King的奇跡般的發(fā)現(xiàn):「在過去幾十年里,對于因果推斷的了解比以前所有歷史記載的總和還要多」(參見Morgan和Winship合著的書的封面,2015)。三十年之前,我們還無法為「Mud does not cause Rain」編寫一個公式;現(xiàn)在,我們可以公式化和評估每一個因果或反事實陳述。 問題 2:由圖模型產(chǎn)生的評估與由潛在結(jié)果的方法產(chǎn)生的評估相同嗎? 回答:是的,假設(shè)兩種方法開始于相同的假設(shè)。圖方法(graphical approach)中的假設(shè)在圖中被展示,而潛在結(jié)果方法(potential outcome approach)中的假設(shè)則通過使用反事實詞匯被審查者單獨(dú)表達(dá)。 問題 3:把潛在的結(jié)果歸因于表格個體單元的方法似乎完全不同于圖方法中所使用的方法。它們的區(qū)別是什么? 回答:只在有可條件忽略的特定假設(shè)成立的情況下,歸因才有效。表格本身并未向我們展示假設(shè)是什么,其意義是什么?為了搞明白其意義,我們需要一個圖,因為沒有人可在頭腦中處理這些假設(shè)。流程上的明顯差異反映了對假設(shè)可見的堅持(在圖框架中),而不是使其隱藏。 問題 4:有人說經(jīng)濟(jì)學(xué)家并不使用圖,因為其問題不同,并且也沒能力建模整個經(jīng)濟(jì)。你同意這種解釋嗎? 回答:不同意!從數(shù)學(xué)上講,經(jīng)濟(jì)問題與流行病學(xué)家(或其他科學(xué)家)面臨的問題并無不同,對于后者來講,圖模型已經(jīng)成為了第二語言。此外,流行病學(xué)家從未抱怨圖迫使其建模整個人體解剖結(jié)構(gòu)。(一些)經(jīng)濟(jì)學(xué)家中的圖規(guī)避(graph-avoidance)是一種文化現(xiàn)象,讓人聯(lián)想到17世紀(jì)意大利教會天文學(xué)家會避開望遠(yuǎn)鏡。流行病學(xué)家可以判斷他們的假設(shè)的合理性——規(guī)避掉圖的經(jīng)濟(jì)學(xué)家卻做不到(我提供給他們很多公開證明的機(jī)會,并且我不責(zé)怪他們保持沉默;沒有外援,這個問題無法被處理)。 問題 5:深度學(xué)習(xí)不僅僅是盛贊曲線擬合?畢竟,曲線擬合的目標(biāo)是最大化擬合,同時深度學(xué)習(xí)中很多努力也在最小化過擬合。 回答:在你的學(xué)習(xí)策略中不管你使用何種技巧來最小化過擬合或其他問題,你依然在優(yōu)化已觀察數(shù)據(jù)的一些屬性,同時不涉及數(shù)據(jù)之外的世界。這使你立即回到因果關(guān)系階梯的第一階段,其中包含了第一階段要求的所有限制。 |