前不久,Google的CEO桑達爾·皮查伊在接受Forbes專訪時,非常明確地指出了:Google將在一切服務和設備中,或早或晚地采用人工智能技術。
Back Channel的一篇來自Steven Levy的文章描述了Google從培訓、雇傭、管理、技術等各個方面的措施和轉變,并且介紹了機器學習在Google崛起的歷史、克服的阻力、以及勢不可擋的未來。
Google正在打造機器學習的“忍者團隊”
Carson Colgate,一名Google機器學習隊伍的新成員。她正在訓練自己成為一名“忍者”。
她今年26歲,之前已經在跆拳道里拿過一個二級的黑帶。這次,她要做的是在算法上成為一名“忍者”。她在Google的Android部門擔任工程師,現在則被收錄到Google內部的一個機器學習“忍者項目”。這個項目只招收了18個人,這18個人卻都是Google各個產品部門的精英。他們將要把學習到的人工智能技巧,用于打造他們各自負責的產品。
在Google負責內部機器學習、管理此“忍者項目”的產品經理Christine Robson說:“這個項目邀請Google全公司對機器學習感興趣的工程師,與機器學習團隊一起學習6個月,跟導師取取經,做一些項目,然后開展和實施項目,從中學習經驗和教訓。”
Carson Colgate
很多年來,機器學習被認為是一個只有技術精英才懂的技術專項。但是現在,機器學習成為了將人類智慧與電腦智慧結合在一起的不二途徑。Google致力于在公司內部制作多一點機器學習的“精英”,甚至想要讓機器學習成為工程師的常規技巧。
Google是一個龐大的公司,六萬個雇員里面,有將近一半都是工程師。對比之下,這個目前只有18個人的機器學習忍者項目,實在很小。但是這個項目表明了Google一個認知上的轉變——機器學習已經成為最受重視的新方向之一。
雖然Google一直都有采用機器學習的技術,也一直致力于雇傭這個領域的人才,但是直到2016年,Google才開始執迷于機器學習這項科技。去年年末,Google的總裁Sundar Pichai就說出了Google的新態度:
“機器學習是一個核心的、轉變式的改變,它將改變我們做每一件事的方式和想法。我們有目的地在我們的各項產品中運用機器學習,無論是搜索,廣告,You Tube,還是Play。我們目前所處的階段還早,但是你會看到我們一個系統性、規模性的進展——我們將在眾多的領域使用機器學習。”
因而這個邏輯很清晰:如果Google真的想要在全線的產品中運用機器學習,它的工程師也必須掌握機器學習的技巧,這個技巧將和傳統的編程很不同。正如知名的機器學習宣言《高超算法》一書的作者Pedro Domingos所言:
“機器學習確實是太陽底下的新鮮事:它將自己建造(和實現)自己。”
機器學習是如何在Google崛起的?
Jeff Dean,Google的神級人物,正在帶領Google轉向機器學習的時代。
做好機器學習,意味著辨識正確的數據,選擇正確的算法,并且確保所有的其他條件都正確,才能成功。
Jeff Dean,Google軟件部的神級人物,如今帶領著機器學習團隊,建造各種工具,幫助Google工程師加深機器學習的技能。根據他的預測:今天Google25000個工程師中,只有幾千個工程師精通于機器學習。而Jeff Dean的愿景是:所有的Google工程師都要懂得機器學習的一些知識。“我們將要嘗試實現這個目標。”
John Giannandrea一直以來都在Google內部提倡機器學習的重要性,而時代造英雄,在Google的機器學習時代,Giannandrea成為了搜索業務的負責人。但是當他2010年剛到公司的時候,他并沒與多少機器學習的經驗。2011年的時候,他在一個會議上得知“神經信息處理系統”(Neural Information Processing Systems,NIPS),從此欲罷不能。
從此,每一年,NIPS都使用機器學習創造著科技界的神話,解決著如翻譯、聲音辨識、或者視覺辨識等諸多領域的難題。Giannandrea回憶道當時參加這個NIPS會議的時候,這個會議非常不知名,“但是這個領域在學術和科技界都在過去三年高速成長。去年參會者達到了6000人。”
不只是Giannandrea認為機器學習將會成為科技的核心。Google內部的機器學習擁護者越來越多。比如,Google Brain的聯合創始人Dean,他曾在Google X負責一個神經網絡的研究計劃。這些在Google進行的機器學習運動,說明了Google對計算機的決心和信心。
Jeff Dean
如今在機器學習領域最領先的為“深度學習”算法,這個算法的模型由人腦啟發,建立在復雜的神經網絡之上。Google Brain以及Google在2014年1月以5億美元收購的Deep Mind,都在深度學習這一塊集中力量開發。Deep Mind開發了Apha Go,并在圍棋比賽中將人類的冠軍打敗了,這件事激發了人類對人工智能深深的恐懼。Giannandrea覺得人工智能絕對不會把人類趕盡殺絕或者取代人類,但是,它將要深刻地變革我們生活的每一個方面。
機器學習的概念在Google絕不是新鮮事。Google的創始人一直以來相信人工智能的力量。十年前,Google已經開始在公司內部給工程師教授機器學習的課程。2005年的時候,研究科學家Peter Norvig開始在每周三在43號樓給感興趣的Google工程師講授機器學習。課程如此受歡迎,以至于在Bangladesh的工程師熬夜到凌晨,只為了遠程打個電話過來一起聽課。而2013年,整個Google都意識到了機器學習的重要性。
隨著機器學習的重要性在Google內部崛起,Jeff Dean也開始認真思考:
“在過往,我們可能會使用機器學習,去改善系統的某幾個方面。但現在我們真的是要用機器學習去取代整個舊的系統。”
機器學習正在讓產品有著以往不可想象的新功能。比如去年11月發布的Gmail上的智能回復功能,就是緣起于Google Brain與Gmail團隊的一次對話。Google一直鼓勵著這種合作,讓這兩個團隊保持密切的聯系。
傳統的對人工智能語言的理解是:人們需要將語言的規則嵌入到系統,但是在Gmail的智能回復中,這個系統擁有足夠多的數據,它自己就可以學習和完善自己。
不過當這個團隊在開始測試智能回復的時候,這個軟件有一個很詭異的問題:它總是在建議一些不太符合場合的浪漫性的回復。當它感到困惑的時候,它就會開始說:我愛你。這不是什么軟件上的故障。這個錯誤可能就是它從人類行為中學習而來的:如果你處于不知所措或者困窘的狀態,說“我愛你”是個很好的防范策略。
克服重重阻力,機器學習滲透到了搜索算法中
自從去年11月發布智能回復之后,GmailInbox應用的用戶就可以選擇三個自動生成的回復,而且這些自動生成的回復準確性一般很高。現在,從手機移動端的Gmail用戶發出的回復中,十分之一都是由機器學習系統創造的。Gmail的成功只是Google成功運用機器學習的一個極小的例子。
但是當機器學習被運用到搜索功能,這就是極大的轉折點了。一直以來,搜索都有運用到機器學習,但是很多年以來,這個公司最重要的搜索算法,都被認為太過于神圣,而不能被機器學習算法所玷污。機器學習對于搜索的作用,一直都受到懷疑。
這種懷疑,部分源自于一種文化上的抵抗:一直以來,高超的黑客們都想要對程序有完全的掌控,而機器學習難免有點太禪意般的“放任自流”。Amit Singhal是一個經驗豐富的搜索工程師,是傳奇式的電腦科學家Gerald Salton的學徒,Singhal當年修改了Google創始人布林和佩奇的編程作業,讓他們的程序變為可以量化擴大的工具。Singhai對于把機器學習并入搜索算法,曾經抱著懷疑的態度。Google的工程師David Pablo Cohn證實當時他們用機器學習提高搜索的沮喪的嘗試:
“Amit Singhai的算法當時是世界上最棒的,我們只能通過復制他的想法來做好。當時我們找不到任何比他的方法要好的東西。”
Greg Corrado為Google Brain的聯合創始人
到2014年早期的時候,Google的機器學習專家們繼續挑戰這種局面。結果,機器學習團隊的實驗成為了搜索的一個核心部分:通過看用戶是否點擊了搜索詞條,來判斷搜索呈現的結果是否更好地匹配搜索的詞條。
如今,機器學習所建立的搜索匹配的成果Rank Brain,已經是搜索算法的一部分。Rank Brain于2015年4月的時候上線。Google一直以來對于搜索功能如何運作都是閃乎其辭,但是Jeff Dean很明確地說:
“Rank Brain這個機器學習的產物在每一次檢索中都發揮作用,并且在大部分的檢索中影響著排名。”
并且,這個機器學習的算法證明是非常有效的。每一次的Google搜索都要用上幾百個信息點(比如,用戶所處的地理位置,以及頁面的標題是否與搜索詞條匹配),而Rank Brain提供的信息點,是所有信息點中的重要性排在了第三。
打敗了傳統編程后,機器學習該如何在Google普及
Christine Robson是Google內外機器學習活動的組織者和帶動者。
機器學習在搜索中獲得成功,對于Google而言非常重要,這讓很多人開始真的注意起機器學習來。而華盛頓大學的教授Pedro Domingos用更直白的語言說:
“一直以來,在傳統編程者與機器學習者之間都存在著一場戰爭。結果機器學習者在戰斗中獲勝了。”
Google目前的挑戰是要將他們的工程師隊伍過渡到機器學習的隊伍,不要求每個人都熟悉掌握機器學習,但起碼需要熟悉機器學習。不僅Google在這么做,很多其他的公司(比如Facebook)都在積極邁進機器學習的時代。Google正在各個名校的機器學習領域搶奪人才。Google也即將在蘇黎世開設一個機器學習研究中心,搶奪機器學習人才的戰爭,延伸到了歐洲。
基于目前學術界并沒有造出很多的機器學習人才,保持這方面的人才就顯得至關重要。在Google,這并不是易事。因為大部分的頂級工程師一輩子都通過傳統的編程取得成就。但是機器學習所要求的,是全新的思維。編程者一般通過對編程的控制來進行創造,但是機器學習要求掌控的是某些具體類型的數學和統計學,但是這些領域的知識,甚至對于一些頂級的、可以解決復雜問題的工程師而言,都是陌生的,他們之前也根本不愿意學。
Christine Robson正在致力于給Google的工作人員創造更好的機器學習的環境:
“機器學習與靜止不變的編程不同:你要經常給它提供新數據,我們要一直更新模型,一直學習,要一直添加更多的數據,一直轉變我們預測的方式。機器學習就像是一個活生生的、會呼吸的家伙,它和傳統的計算機編程完全不同。”
但是,Google對訓練工程師學會機器學習的前景是樂觀的:如今在機器學習中使用的數學不算太復雜,大部分Google的工程師都可以學會。Google并且建造了類似Tensor Flow的工具,幫助工程師學習機器學習。Tensor Flow也為Google在雇用人才方面增加了吸引力。當Google開設Tensor Flow公開課時,有75000人報名參加。
目前Google最大的任務,就打造更多可以完善這些機器學習工具的人才。他們也在內部建立了大量的機器學習的課程,“下一次的課程,已經有好幾千的工程師報名參加。”JeffDean說。
毫無疑問,機器學習,將會是Google一個重大的發展方向。我們的未來,將會是一個機器學習和人工智能的未來。