我們周圍充斥著對于人工智能和機器人未來的歇斯底里——關于人工智能和機器人將會何等有力、何等迅速以及他們將對工作崗位造成何種沖擊。
我最近在 MarketWatch 讀到一篇文章。文章講的是,在未來 10 到 20 年內,機器人將取代一半的現有工作崗位。文中甚至給出了柱狀圖來證明這些數字的有效性。
文章的結論太荒唐了。(我盡量使用學術語言,但有時候面對這種情況確實詞窮。)比如文章說,在未來 10 到 20 年內,地面維修工人數量將由 100 萬名縮減到 5 萬名,因為機器人將會取代這些工作崗位。那現在這些崗位上有多少機器人在運行?一個都沒有。這一領域有多少具備實用價值的演示模型機器人工作著呢?一個都沒有。還有很多類似的文章認為,對于那些目前需要在特定場合進行體力勞動的崗位,超過 90% 都將會被終結。這些適用于其他所有領域的文章也存在同樣的問題。
錯誤的預測將導致我們害怕那些不會發生的事情,不論是對工作崗位的大范圍取代,奇點,還是與人類價值觀不同的甚至試圖毀滅人類的 AI 。對于這些錯誤,我們需要反擊。但是,為什么人們會產生這些錯誤呢?我找到了七個常見的原因。
1. 高估和低估
Roy Amara 是未來研究所(the Institute for the Future)的聯合創始人。該研究所位于 Palo Alto,也就是硅谷的智慧中心。他以現在被稱為 Amara 定律的格言而聞名:
技術的作用總是在短期內被高估,而在長期內被低估。
這短短的句子凝結了太多東西。樂觀主義者會有一種解讀,而悲觀主義者會有另一種解讀。
有關 Amara 定律兩面性的一個絕佳例子就是美國的全球定位系統 GPS。1978 年開始的時候,GPS 的衛星軌道上包含由 24 顆衛星(現在是 31 顆衛星,含冗余)組成的星系。GPS 的目標是為美國軍隊的彈藥投放提供精準的位置支持。但是這一項目在 20 世紀 80 年代幾乎被一次次取消。符合 GPS 設計目的的第一次實戰使用是 1991 年的沙漠風暴行動,GPS 額外取得了數次成功,才使得軍方接受它。
錯誤的預測將導致我們害怕那些不會發生的事情。
現在,GPS 已經到了 Amara 所說的“長期”,而它現在的應用方式是起初無法想象的。我外出跑步時,我的蘋果手表 2 代就會使用 GPS 功能足夠精確的記錄我的位置,精確到能夠確定我跑步時是在馬路的哪一側。蘋果手表中 GPS 接收器的微小尺寸和低廉價格是初期的 GPS 工程師們無法想象的。GPS 技術在全球范圍內同步進行物理實驗的時間,并在同步美國電網的時間和保持電網運轉方面發揮重要作用。它甚至允許那些真正操縱著股市的高頻交易員避免毀滅性的定時錯誤。所有的飛機,無論大小,都使用 GPS 導航,GPS 還用來跟蹤假釋出獄的人。GPS 決定了世界各地的哪些地區種植哪種種子。GPS 技術可以跟蹤卡車車隊并匯報司機的駕駛行為。
GPS 最開始時只有一個軍事目標,然而,要讓它像最初預期的那樣工作,絕沒那么簡單。現在 GPS 已經滲透到我們生活的方方面面。如果沒有 GPS ,我們不僅會迷路 ,而且會受凍、挨餓,甚至很可能會死掉。
在過去 30 年中,其他技術有著相似的模式。起初人們抱有巨大的期待,然后是巨大的失望,之后慢慢地對超出最初預期的結果產生了信心。這一模式在大規模計算、基因組測序、太陽能、風能,甚至是購物送貨上門等方面都是如此。
在 20 世紀 60 年代,在 20 世紀 80 年代,AI 一次又一次地被高估。我相信,現在它又被高估了。但它的長期前景也可能被低估了。問題在于,長期是多長?后面的 6 個錯誤能幫我們解釋,為什么對于 AI 的未來而言,時間尺度被嚴重低估了。
2. 想象中的魔法
在我十幾歲的時候,亞瑟·克拉克是科幻小說作家“三巨頭”之一,其余兩位是羅伯特·海因萊因和艾薩克·阿西莫夫。但是克拉克還是一位發明家、科學作家和未來主義者。在 1962 年到 1973 年之間,他發明了后來被稱為克拉克三定律的三條格言:
如果一位年高德劭的科學家認為某事是可能的,那他幾乎肯定是正確的;如果他認為某事是不可能的,那他很可能是錯誤的。
發現可能性的邊界的唯一途徑,就是跨越這一邊界,進入到不可能的領域。
任何非常先進的技術,初看都與魔法無異。
從個人角度而言,我對克拉克三定律的第一定律的后半句持保留意見,因為我在有關 AI 將在多久時間內占據優勢地位一事上比其他人更為保守。但是現在我要在克拉克第三定律上展開論述。
想象一下,我們有一臺時光機可以把艾薩克·牛頓從 18 世紀晚期穿越到現在,并把他安頓在他熟悉的環境中:劍橋大學三一學院教堂。
現在給牛頓看一臺蘋果公司的產品。從你口袋中取出 iPhone,開機讓屏幕亮起來并布滿圖標,把 iPhone 給牛頓。牛頓曾經利用菱鏡將太陽光分解,揭示了白光是由不同顏色的光組成的,并將不同顏色的光又混合成了白光,但他毫無疑問地將對在黑暗教堂中能發出如此耀眼色彩的裝置感到詫異。現在播放一部英國鄉村場景的電影和一些他應該聽過的教堂音樂。然后向他展示這個網頁,網頁中有他個人批注的 500 多頁的皇皇巨著《自然哲學的數學原理》。教給他如何通過縮放手勢來放大網頁細節。
要留意那些有關未來技術是不是魔法的爭論。
牛頓有可能解釋這個小裝置是如何實現這一切的嗎?盡管他發明了微積分,還解釋了光學和重力的原理,但是他卻從未能正確區分煉金術和化學。所以我認為他會非常困惑,并且根本想不出這個設備的最基本的輪廓。對他而言,這和超自然的化身沒什么不同。這個跟魔法是沒辦法區別的。同時要記住,牛頓可是那個年代相當聰明的人物。
如果某個事物是魔法,我們就很難知道它的邊界。假設我們更進一步地給牛頓展示了這個裝置如何照亮黑暗,如何照相、錄像、錄音,如何用作放大鏡和鏡子。然后我們向他展示,它可以用來以極高的速度和極高的精度進行算術計算。我們展示一下,牛頓拿著 iPhone 的時候,iPhone 記錄了他的步數,繼續向牛頓展示他可以用 iPhone 與世界任何地方的人們即時通話,就在教堂中即可。
牛頓可能會推測這個設備能做的其他事情是什么?用來分散太陽光的菱鏡是永遠有效的。他會不會推斷 iPhone 可以一直用下去,忽略了自己沒有理解它還需要充電?回想一下,我們把牛頓從邁克爾·法拉利出生前 100 年的時代抓回來了,所以他根本沒有對于電力概念的科學理解。如果 iPhone 能在沒有火的情況下產生光,那它也有可能會將鉛變為金子吧?
這就是我們在猜想未來科技時遇到的問題。如果未來科技距離我們現有的目前能理解的科技足夠遙遠,那么我們就不知道未來科技的邊界。如果未來科技與魔術無法區分,那人們說的有關未來科技的任何事情都將無法證偽。
這就是我與人們爭論是否應當害怕廣義人工智能(artificial general intelligence,縮寫為 AGI ) 時常常遇到的問題。廣義人工智能(AGI)指的是我們將建造出與人類一樣運作的自主機器人。我被告知自己還沒明白廣義人工智能會有多么強大。這不是爭論所在。我們對于廣義人工智能是否存在都沒有概念。我希望它是存在的——這一直都是我自己在機器人和 AI 領域工作的動力所在。但是現代廣義人工智能(AGI)研究的進展十分不好,不論是在廣義上還是在支持持續存在的獨立個體上。廣義人工智能(AGI)貌似主要受困于人工智能至少 50 年來一直存在的問題上,即推理和常識。我看到的所有證據都證明我們目前在如何建造廣義人工智能方面毫無頭緒。它的特性完全未知,所以在修辭上他就很快變成了魔法,強大而沒有任何邊界限制。
宇宙萬物無不有邊界。
小心有關未來科技是魔法的爭論。這樣的爭論永遠無法駁斥,因為它是信仰之爭,而不是科學之爭。
3. 性能與能力
我們一直都在利用人們完成某一特定任務的表現作為線索,來推斷他們完成其他任務的能力。我們在國外城市向一位陌生人問路,她自信地給出回復并指給我們看起來說得通的方向,所以我們會覺得,想要乘坐公交的時候,還可以問她如何支付公交車費。
現在,假設有人告訴我們,一張特定的照片展示的是人們在公園里玩飛盤。我們自然會認定此人能夠回答以下問題:飛盤是什么形狀的?一個人大概能把飛盤扔多遠?人能吃飛盤嗎?大概一次可以有多少人同時扔飛盤?三個月大的小孩兒可以扔飛盤嗎?今天的天氣適合扔飛盤嗎?
計算機能夠給圖片打上“人們在公園里扔飛盤”的標簽,卻不可能回答那些問題。除去他們僅僅會給更多的圖片打標簽卻根本不能回答前述問題的事實之外,他們對于以下內容根本沒有概念:人是什么、公園通常在室外、人是有年齡的、天氣除了讓照片顯示為照片之外還有更多內涵,諸如此類。
這并不意味著這些系統是毫無用處的;他們對于搜索引擎具有極高價值。但是這正是問題所在。人們聽說某些機器人或者某些 AI 系統已經完成了某些任務。然后他們將這一性能(performance)歸納為一種能力(performance),即一個完成同樣任務的人被認為會具備的能力。他們把這一歸納應用到了機器人或 AI 系統。
現在的機器人和 AI 系統在他們能做的事情方面還極其狹隘。人類風格的歸納還不適用。
4. 手提箱文字
Marvin Minsky 將那些具有多重含義的文字稱為“手提箱文字”。“學習”(learning)就是一個很強大的手提箱文字;他可以指代如此眾多不同類型的體驗。學習使用筷子是跟學習一首新歌非常不同的體驗。學習寫代碼是跟學習在城市里認路非常不同的體驗。
當人們聽說機器學習正在某一新領域取得巨大進步的時候 ,他們傾向于將其作為一種新的思維模式,即人類學習新領域的思維模式。然而,機器學習是非常脆弱的,他需要人類研究人員或者工程師的大量準備工作,特殊用途的編碼,特殊用途的訓練數據集以及為每一個新的問題領域定制的學習結構。現在的機器學習完全不像是人類那樣的海綿式學習,人類不需要外科手術改變什么或者是特殊用途的設計就能夠在新的領域取得快速突破。
與之類似的是,當人們聽說計算機可以打敗國際象棋冠軍( 1997 年)或者世界頂尖圍棋選手( 2016 年)的時候,他們傾向于認為,計算機在像人類一樣“下”棋。當然了,現實中那些程序根本不知道游戲是什么,甚至是他們在玩兒什么。他們的適應性也很差。人類玩游戲的時候,規則的微小變動對人類影響不大。對于 打敗世界頂尖圍棋選手的 AlphaGo 或者打敗國際象棋冠軍的 Deep Blue 而言卻并非如此。
手提箱文字導致人們錯誤理解了機器能夠在人類從事的任務中做得多好。這部分歸咎于 AI 研究人員——更不可饒恕的是他們所在的研究機構的新聞辦公司——急于采用手提箱概念的實例來聲明研究進展。這里的重點是“實例”(an instance)。這一細節很快就消逝了。標題黨們宣揚手提箱文字,并扭曲了大眾對于人工智能當前進展和未來前景的理解。
5. 指數定律
很多人都在遭受“指數主義”濫用的折磨。
每個人都對摩爾定律有些見解。摩爾定律說的是,計算機會按照時鐘般的時間表變得越來越好。戈登·摩爾實際上說的是,裝在微芯片上的元件數量每年都會翻倍。這在過去的 50 年是成立的,盡管翻番所需的時間常量從一年延長到了超過兩年,但這種模式即將終結。
芯片上的元件數量翻番已經使得計算機速度持續翻番,引發內存容量每兩年翻兩番,還使數碼相機分辨率越來越高、LCD 屏幕像素數也呈指數級增加。
摩爾定律生效的原因在于,它適用于非真即假問題的數字化抽象。在任何給定的電路中,是否存在電荷或電壓?只要芯片原件越來越小,這一答案就始終是明確的——直到達到物理尺寸極限,我們面對的是只有幾個電子存在的元件,量子效應開始占據主導。這就是我們現在的硅基芯片技術面臨的問題。
在人們遭受指數主義折磨的時候,他們可能會覺得,用來證明論點的指數會繼續快速增長。但摩爾定律和其他看似有指數關系的定律可能都會失敗,因為它們根本都不是真正的指數級的。
本世紀初期,我在領導麻省理工學院的計算機科學與人工智能實驗室(CSAIL)并需要幫助超過 90 個不同的研究項目組籌集資金時,我盡量利用 iPods 的內存增長向捐贈者展示事物在何等快速地變化。以下是用 400 美金或者更低價格買到的 iPod 中存儲的歌曲的數據。
隨后,我會推斷出未來幾年的數據,并問捐贈者這些隨身攜帶的內存空間可以用來做什么。
按照上述方法推斷到今天,我們應該得到的是一個有著超過 160000 GB 內存的、價格為 400 美元的 iPod。然而今天的頂配 iPhone (價格遠不止 400 美元)也只有 256 GB 的內存,還不到 2007 年的 iPod 內存的兩倍。一旦內存容量大到足夠容納任何一個普通人的音樂、APP、照片和視頻的時候,這個指數定律就突然失效了。在達到物理極限,或者沒有更多經濟理由繼續下去的時候,指數定律就會失效。
類似的,得益于深度學習的成果,AI 系統的性能獲得了迅速的提升。很多人似乎認為,這就意味著我們會持續看到 AI 性能在正常基礎上的同等倍數的提升。但是,深度學習的成果是 30 年的歷史積累,而且是個孤立事件。
這并不意味著不會有更多的孤立事件,平淡的 AI 研究中出現的孤立事件會突然極大地提高許多 AI 應用的性能。但是,并沒有說明孤立事件多久發生一次的“定律”。
6. 好萊塢的場景
許多好萊塢科幻電影的情節都是,世界和現在完全一樣,除了有個新的轉折。
在《機器管家》中,Sam Neill 扮演的理查德·馬丁在坐著吃早餐,由 Robin Williams 扮演的人形機器人服侍著他。理查德拿起了一份報紙,邊吃早餐邊讀著。一份報紙!紙質報紙。不是平板電腦,不是亞馬遜 Echo 這樣的播放設備,也沒有與互聯網直接進行神經連接。
事實證明,許多人工智能研究人員和人工智能專家,尤其是那些沉溺于人工智能失控和屠戮人類的預測的悲觀主義者,都是同樣的想象力匱乏的。他們忽略了這樣一個事實,如果我們最終能夠制造出如此智能的設備,彼時世界將已經發生了巨大變化。我們不會瞬間驚訝于這種超級智能的存在。人工智能會隨著時間的推移而不斷進化,我們的世界會被許多其他智能填充,并且我們將會擁有豐富的經驗。早在想要擺脫人類控制的邪惡超級智能出現之前,就會有不那么智能、不那么好戰的機器出現。在此之前,就會有脾氣相當暴躁的機器出現。在那之前,就會有相當煩人的機器出現。在他們之前,還會有傲慢和不開心的機器出現。我們將在這個過程中一點點改變我們的世界,同時不斷調整新技術及其應用環境。我并不是說未來不會有什么挑戰。我要說的是,挑戰不會像很多人想的那樣突然而至和不期而至。
7. 部署速度
在某些行業,新版本軟件部署非常頻繁。像 Facebook 這樣的平臺,幾乎是每小時都會部署新功能。許多新特性只要通過了集成測試,如果出現問題需要回滾,都不會有多大的負面經濟影響。這是硅谷和網絡軟件開發人員已經習慣了的節奏。因為新部署的代碼的邊際成本低到接近于零,所以這是可行的。
另一方面,部署新的硬件需要昂貴的邊際成本。我們從自身生活中都能知道這一點。我們現在買的很多轎車都不是自動駕駛的,也不是軟件驅動的,他們很可能在 2040 年仍會行駛在路上。這就給所有汽車實現自動駕駛設定了內在的時間限制。我們估計,現在建造的新房子可能會存在超過 100 年。我住的房子建成于 1904 年,這還不是附近年代最久的建筑。
資本成本導致物理硬件的長期使用,即使有高科技的硬件可以替代或者硬件內置其他任務功能時也是如此。
美國空軍的 B-52 轟炸機改進型 B-52H 依舊在列。這一型轟炸機是在 1961 年引入的,迄今已有 56 年之久。這一型轟炸機的最后一架是在 55 年前的 1962 年建造的。當前這些飛機應當會一直執行飛行任務到 2040 年或者更久——目前已經存在將其壽命延長到 100 年的討論。
我經常在世界各地的工廠里見到幾十年的陳舊設備。我甚至見到過運行 Windows 3.0 的電腦——Windows 3.0 是在 1990 年發布的。這里的理念是“只要它沒壞,那我就不修。”這些電腦及其軟件已經穩定運行了二十多年,運行著執行不變任務的不變程序。
幾乎所有的機器人和 AI 領域的創新要想真正廣泛地應用,都要比行業內外的人們想象的難得多。
工廠的主要控制機制,包括在美國、歐洲、日本、韓國和中國的全新工廠里,都是基于可編程邏輯控制器的,即 PLCs。PLCs 是在 1968 年引入的,用來取代機電繼電器。“線圈”現在仍然是在用的主要抽象單元,PLCs 被視為 24 伏的機電繼電器的網絡而進行編程。現在依然如此。一些直流電線已經被以太網電纜取代。但它們不是開放網絡的一部分。相反,它們是單獨的電纜,點到點運行,物理傳輸這些全新而又古老的自動化控制器中的控制流——控制流就是所有步驟的執行順序。在世界上大多數工廠里,當你想要改變信息流或控制流時,咨詢師要花好幾周時間才能弄明白已有的內容、設計新的配置方案,然后供應商團隊才會重新布線和配置硬件。這種設備的主要制造商之一的人最近告訴我,他們的目標是每 20 年進行 3 次軟件升級。
原則上可以換一種方式完成此事,實踐中則不然。我剛剛看了一份招聘清單,甚至在今天,特斯拉公司都在為加州弗里蒙特的工廠招聘 PLC 技術人員。生產現存的具備最強 AI 功能的汽車時,他們還在使用電磁繼電器仿真。
許多 AI 研究人員和權威人士都以為世界已經數字化了,簡單地引入新的 AI 系統將會直接向下影響到 AI 領域、供應鏈、工廠車間和產品設計上的運營變化。
沒什么比這個更離譜了。幾乎所有的機器人和 AI 領域的創新要想真正廣泛地應用,都要比行業內外的人們想象的難得多。