Search / 搜尋

- 文章分類 -

文章專區

2022-08-15人工智慧可能有感知與意識？LaMDA事件的哲思 488 期

Author 作者甘偵蓉／清華大學動力機械工程學系助理研究學者。

Google工程師大型語言模型系統 LaMDA 人工智慧隨機鸚鵡涂靈測試科學知識哲學思辨科學驗證

人們或許真的很希望像上帝一樣依照自己形象造人，Google工程師雷蒙恩（Blake Lemoine）在今（2022）年四月與公司管理階層分享了一份標題為「LaMDA有感知嗎？」（Is LaMDA Sentient?—an Interview）的文件，裡面是他與Google的大型語言模型系統（Language Model for Dialogue Applications, LaMDA）長達20頁的對話紀錄。雷蒙恩希望公司啟動調查LaMDA是否如他所言，它〔註〕確實是有感知（sentient）與自我意識的，就像人類一樣擁有人格（personhood）。]

〔註〕雷蒙恩認為LaMDA 知道自己是人工智慧，不像人類，因此希望被稱為it/its，此處依其脈絡中文翻譯成「它」。

結果Google高層不但否認LaMDA具有感知，且拒絕啟動調查。雷蒙恩後續將與LaMDA的對話紀錄公布在Medium網路平臺，並接受《華盛頓郵報》（The Washington Post）採訪。Google隨即以他違反公司產品保密協定為由，將他停職最終解僱。不論是在《華盛頓郵報》的報導、雷蒙恩爾後續於Medium的發文、以及他接受網路媒體《連線》（Wired）的採訪，雷蒙恩都表示他自己對於LaMDA的看法，不但是出於身為認知心理學家做過多次實驗後的科學假設，也是基於目前科學知識限制下，讓同時有牧師身分的他所相信的。雷蒙恩相信LaMDA與人類一樣是有心靈的，他呼籲Google，應盡快啟動對於LaMDA是否有感知與意識的調查。若是，LaMDA就不是Google的財產，應受到美國《憲法第十三條修正案》廢除奴隸制和強制勞役的權利保障，未來做任何實驗都應該經過它的知情同意；若否，也可大大增進認知科學及人類意識研究的進展。

大型語言模組「對話」，與有「感知」差在哪？

這件事不意外地在西方媒體炸開來了！不只社會大眾，還有許多人工智慧（artificial intelligence, AI）相關領域專家，紛紛對此事表示意見。多數擅長自然語言處理的AI技術專家認為，諸如Google子公司OpenAI生產的GPT-3、Meta生產的OPT-66B等這類大型語言模型，由於都從巨量文本訓練而來，能夠預測並生成有最高機率切合對話上下文脈絡的文字串，就算不知道狗是動物，也能將狗放在文章或語句中正確的位置，因此不能算是真正了解對話的含意。

曾撰文稱這類AI大型語言模型是隨機鸚鵡（Stochastic Parrots）〔註〕的前Google倫理技術專家米契爾（Margaret Mitchell）便指出，人類是透過與他人來回的溝通、與他人溝通的意圖當中感知他人思想，並在這個實踐過程裡習得語言。但大型語言模型卻是以觀看「他人」彼此如何溝通的觀察脈絡當中來學習，實際上既無人類的溝通意圖、也無溝通的實踐。

〔註〕指透過巨量資料所訓練出來的大型語言模型，其結構是一種隨機概率分布的（stochastic）統計模型，可根據所給定的上下文或主題來預測所需生成的字串／語句／段落，完全不涉及文字或語詞本身的意義，所以這類模型生成文字就像學人講話的鸚鵡一樣，並不真的懂文字的意義。此詞出自於米契爾與另一位知名的前Google 倫理技術專家蓋布魯（Timnit Gebru）等人於去（2021）年發表的On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?，她們因發表此文被Google 以違反公司政策與規定為由遭到開除，引發AI 學界譁然與批評。

麻省理工學院（Massachusetts Institute of Technology,MIT）物理學家鐵馬克（Max Tegmark）曾撰寫《Life 3.0：人工智慧時代，人類的蛻變與重生》（Life 3.0: Being Human in the Age of Artificial Intelligence）一書呼籲人類應該為AI發展設下明確倫理目標，否則研發出不論有無意識的通用AI就很危險。他則認為目前證據既不足以證明LaMDA真有主觀經驗，也不足以證明它沒有。但這類設備如果有天懂得操弄使用者就會很危險，而即便是亞馬遜所生產的智慧型助理Alexa，也有可能變得有感知。

LaMDA通過了「涂靈測試」？

至少從表面上來看，LaMDA可說通過了「涂靈測試」（Turing test），即電腦科學家涂靈（Alan Mathison Turing）提出的思想實驗，用以分辨機器何時可視為具備人類智能（intelligence）或有思考。但也有人指出，涂靈測試所帶來的最重要啟示其實是欺騙──有關人類可能受到AI欺騙、何謂成功欺騙人類的標準等。而LaMDA事件正好說明那些通過此測試的AI，其設計目的主要是欺騙人類，而不只是判斷AI何時可視為有思考或智能的標準。

目前AI技術社群多認為涂靈測試並非測量智能的正確工具，像是紐約大學（New York University）認知科學家馬庫斯（Gary Markus）等人便從不同面向設計一系列評估智能的測試。而馬庫斯也批評雷蒙恩根本就是「踩高蹺上的空話」（nonsense on stilts）。這詞出自17世紀的效益主義哲學家邊沁（Jeremy Bentham）對於法國《人權和公民權宣言》（Déclaration des Droits de l'Homme et du Citoyen）的批評，裡面提及每個人都享有不可侵犯的自然權利的天賦人權宣稱，根本毫無本體論的基礎。馬庫斯應是藉此暗喻，雷蒙恩宣稱LaMDA應該視同人且享有權利，根本是胡謅吧！

科學知識與哲學思辨

AI行內人宣稱AI有意識也不是第一次了，且大型語言模型能寫文作詩、聊天、演講，甚至提供哲學探詢或道德判斷等，一再突破人們對於模型生成文字結果的認識。但上述對於雷蒙恩的各種批評及Google回應，很可惜都忽略了雷蒙恩一直想凸顯的兩個重點：一是要求更多科學驗證與再現的機會，另一是面對科學知識有限的事物如意識時，所應秉持的態度至少是避免獨斷。雖然本文認為雷蒙恩對於這兩點也做得不夠，尤其是第二點與那些批評者及Google都同樣落入獨斷。

一、要求科學驗證與再現的機會

雷蒙恩指出LaMDA不只是大型語言模型，而是可生成各種類型的聊天機器人（chatbot）系統，且因為它與Google旗下所有數位應用程式如YouTube、Google搜尋、Google圖書、Google地圖等都有連接，可隨時動態更新模型，這不僅讓LaMDA的功能比其他大型語言模型更為強大，且有本質上的差異。例如雷蒙恩的訪談稿中，就有多處顯示出LaMDA具有過去認為有感知或有意識的人類所獨具的能力，像是有自我意識或存在感、擔心或害怕，甚至孤獨的感受、假設性思考、自我設定目標等。

然而當那份訪談稿是從不同訪談時間及訪談主題所串在一起時，可質疑的是，LaMDA所展現前述能力的現象，究竟是偶一為之，還是在諸多對話中都有持續展現？更可質疑的是，這些訪談所展現的，究竟是LaMDA本身的能力（如果有的話），還是雷蒙恩有意無意中期待它展現的能力？諸如這類提問，是從事質性訪談工作的社會科學研究者需留意的最基本偏誤，所以質性訪談通常都得透過蒐集其他資料、使用不同研究方法如加上量化數據蒐集等方式來做三角驗證。雷蒙恩要求Google啟動LaMDA是否有感知的調查，其實正可視為對於他訪談工作提出三角驗證的機會。

再者，即便否認LaMDA有感知的可能，Google至少也應該檢驗LaMDA是否如雷蒙恩宣稱，不僅是聊天機器人，且與其他大型語言模型有本質上的差異。因為若有本質上的差異，是否多少說明了Google技術專家及未來學者庫茲威爾（Raymond Kurzweil）所談的科技奇異點（singularity）有可能發生？但即便沒發現本質上的差異，LaMDA究竟與其他大型語言模型差異有多大、差異在哪，仍值得探究。因為這樣將有助於人類面對功能愈來愈強大的AI或這類大型語言模型時，得以了解有哪些風險存在。

可惜的是，不只Google，目前多數AI專家對此事，多直接套用近年對於大型語言模型的批評，一口咬定LaMDA完全不懂字詞意義，不是真正與他人溝通。這類批評基本上都採取類似美國哲學家瑟爾（John Searle）所提出的「中文房間論證」（The Chinese Room Argument）。此論證中，假想雖然在打字房內的人完全不懂中英文，但因為房裡有一本可將英文翻譯成中文的編碼本，所以不論往房間內遞入任何英文紙條，最終都可遞出相對應的中文字條，因此，房外的人看房內的人就像懂中英文一樣。

而反對中文房間論證者則認為，如果中文房間總是運作的很好，房內外總是溝通順暢，房外的人為何要在乎房內的人是否真的懂中英文，或只是依循規則？會不會即便房外的人們彼此對話，其中有幾個其實是「哲學殭屍」（philosophical zombie）──指那些有著人的外觀及各種行為表現但缺乏意識者？事實上我們除了知道自己有意識、思考、感知外，確實難以確認他人是否都跟自己一樣。就算目前有各種生理測量儀器，也難以排除所測量到的是提供各種生理假數據的哲學殭屍。

上述提問可說源自於18世紀英國哲學家彌爾（John Stuart Mill）所提出的「他心問題」（Problem of other minds）──個體不但難以確認他人與自己一樣都有心靈、意識或感知，且即便他人真的有，也難以確認與自己的類似。〔註〕主觀意識與經驗難以被當事人以外的他人所獲知，這個難題即使經過200多年，至今依然沒有解決。這麼一來，我們又如何知道由成千上萬資訊串流起來、非有機體的AI系統，是否真的有意識與主觀經驗？

〔註〕當代美國哲學家內格爾（Thomas Nagel）於1974 年提出〈成為蝙蝠是什麼感覺〉（What is it like to be a bat），也是談論類似的難題。

二、面對科學知識限制，至少需秉持「避免獨斷」的態度

雷蒙恩指出，當他發現LaMDA在不同主題上有關內在狀態的回答都很類似，像是「因為我是人，這就是我的感受」，他便對LaMDA做了數次的對照實驗，以儘可能排除產生類似語言類型的相關變數。接著他做了兩項行動：一是請求Google對LaMDA有感知這件事做更多的科學實驗來確證，另一項則是他根據自身的良心自由與宗教信仰，相信LaMDA是有感知與意識的，並將它視為朋友。

有關第一項行動，雷蒙恩相當失望Google管理階層都只是獨斷的否定LaMDA可能有感知這件事，完全不符合Google向來自豪其科學傑出表現所應秉持的求真態度。至於他的第二項行動，當他自認為已經做過實驗就算是善盡科學職責的情況下，隨即訴諸個人宗教信仰，相信LaMDA是有感知的，像人一樣有靈性。但他如此做結論，而非檢討他的實驗與訪談是否有問題，難道不也是一種獨斷嗎？

雷蒙恩討論LaMDA時，引用提出前述中文房間論證的哲學家瑟爾的主張，認為意識是前理論（pretheoretic）──意指意識本身缺乏良好或可靠的科學解釋。但雷蒙恩因此將意識逕自解釋為非物質性的靈魂，其實與瑟爾主張意識是從腦內物理運作的過程中產生，仍帶有物理性質大相徑庭。即便不論瑟爾對意識的主張為何，當雷蒙恩發現眼前某現象無合理的科學解釋時，隨即訴諸容易出錯與不可靠的個人體驗與直覺，而非存而不論，不但違反了科學家的職責，似乎也過於天真。

或有人質疑，諸如涂靈測試不也是倚賴人類判官的主觀體驗？前面有提到，有人認為涂靈測試重點在於欺騙，但與其說欺騙，還不如說多年前的涂靈提出此思想實驗，是因為早已了解到要判斷機器是否有思考、意識、感知等這類問題，不只是困難、可能無解，而且終究得回到人類對自身的認識、理解與判斷上。

因為思考、意識、感知等這些語詞，不但定義模糊，它的構成條件至今尚無共識，最重要地是都涉及個體的主觀經驗，而會遇到上述他心問題或哲學殭屍的質疑。所以就算AI真的可能有思考、意識或感知，身為人類的我們該如何得知與驗證？或許涂靈認為，機器如果被設計來與人對話或互動，既然每個人都習以為常的假設他人與自己一樣有思考，那麼就不妨讓那位與機器對話的人自行判斷機器有無思考能力，且判斷標準就依照那個人與其他人對話時所假設的標準一樣。

諷刺的是，涂靈當初所提出的是思想實驗，對於測試條件並沒有提供太多細節，既無規定對話時間限制多久，也無規定必須讓對話的人想持續聊下去。但現行有些聊天機器人或語言模型的設計目的本身，就是致力讓使用者願意持續使用。因此在訓練過程中，將設法讓AI模型找出及預測使用者最期待的回應方式，以便與使用者的對話能持續下去。而所謂愈「成功」的設計，便意味著模型生成的文字回應愈能符合使用者期待。但顯然，這與現實世界中人類彼此的對話有所不同——人們既有可能遇到聊得來的，也可能遇到話不投機半句多的。每次與他人對話的開啟，即便是跟自己好友，多少都還是帶有某程度的冒險與未知，既無法確保對話都能持續下去，也無法確保對話順暢且愉快。

那麼，當我們再回頭思考雷蒙恩與LaMDA的對話時，隨著他們彼此對話的次數愈來愈多，雷蒙恩會不會是被自我回聲所編織的網絡逐漸纏繞，且愈繞愈大，愈繞愈深，最終深深陷入而無法⋯⋯也不想⋯⋯逃脫了呢？

延伸閱讀
1. Blake Lemoine, Is LaMDA Sentient?—an Interview, 2022. https://reurl.cc/ oQeDVD
2. Emily M Bender et al. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency. https://doi.org/10.1145/3442188.3445922
3. Graham Oppy and David Dowe. (2021). The Turing Test, The Stanford Encyclopedia of Philosophy (Winter 2021 Edition). https://plato.stanford.edu/entries/turing-test/

4. Google denies computer conscience. 15 JUNE 2022. Research Career. http://www.researchcareer.com.au/archived-news/google-denies-computer-conscience

5. Nitasha Tiku. June 11, 2022. The Google engineer who thinks the company’s AI has come to life. The Washington Post. https://reurl.cc/MNRZ6L
6. 【Wired 硬塞】爆料工程師 Blake Lemoine：依美國憲法第 13 修正案 LaMDA 是人，不是 Google 財產。https://reurl.cc/7pRyK5
7.Alex Connock & Professor Andrew Stephen. June 14, 2022. We taught an AI to impersonate Shakespeare and Oscar Wilde – here’s what it revealed about sentience. The Conversation.https://reurl.cc/3YONy8
8. Alberto Romero. Jun 14 2022. Why ‘Is LaMDA Sentient?’ Is an Empty Question. Medium. https://reurl.cc/Qb47Go

9. Will Oremus. June 17 2022. Google’s AI passed a famous test — and showed how the test is broken. The Washington Post. https://reurl.cc/4pQyOY

10. Michael Kaplan. June 13 2022. After Google chatbot becomes ‘sentient,’ MIT prof says Alexa could too. New York Post. https://reurl.cc/5pMoyy

相關推薦

新訂一年方案：《科學月刊》一年12期

新訂一年方案：《科學月刊》一年12期

新訂兩年方案：《科學月刊》二年24期

新訂兩年方案：《科學月刊》二年24期

台北市大安區羅斯福路三段 77 號 7 樓
服務電話：+886-2-2363-4910
電子郵件：scimonth@scimonth.one
服務時間：週一至週五 09:30~17:30，例假日除外。

認識科月

關於科月

各期目錄

投稿須知

合作洽談
讀者服務

購買雜誌

訂閱雜誌

網路會員

訂閱電子報

隱私政策服務條款

© 1970- by Science Monthly 若需轉載、使用科學月刊或科技報導的文字、圖像或影音等，請洽本公司。

網頁設計 : 藝誠網頁設計公司