斯圖爾特·羅素:未來20年,將人類的價值體係教給機器人


    英裔美籍計算機科學家斯圖爾特·羅素(stuart russell)是加州大學伯克利分校人工智能係統中心創始人兼計算機科學專業教授,同時他還是人工智能領域“標準教科書”——《人工智能:一種現代的方法》(英文書名為artifical intelligence a mooern approach,清華大學出版社,2013年11月出版)的作者,被譽為“世界頂級ai專家”。


    我們在加州大學伯克利分校他的辦公室見到了他,羅素認為,機器人未來發展的關鍵是,人類要將是與非、好與壞的常識和價值判斷標準教給機器人。比如現在大家都對能做家務的服務型機器人青睞有加,但是,如果要真正保障安全性,這個機器人就需要具備很多常識。比如,它要知道主人的貓是不能用來做晚飯的。


    確保人和機器擁有共同的目標


    由於不了解,機器人會取代人類,甚至殺死人類的聲音不絕於耳,公眾對人工智能有太多誤解。人們總是不自覺地把人工智能和殺人聯係在一起,事實上,這個領域可沒有人研究殺人機器人。還有一個原因是,媒體沒有向大眾解釋人工智能到底是什麽,媒體隻是一天到晚在說人工智能總有一天會失控,或者人工智能會有自我意識……這些都是不可能的。


    alphago大勝人類引發了對人工智能的又一輪恐慌。相反,我對alphago很失望。alphago實驗的初衷是想知道人工智能能否像人類下圍棋一樣思考,即給你一個複雜的難題,你需要解決不同區域的小問題,最後綜合起來解決大問題。然而,實際操作上,穀歌的alphago用的方法還是傳統的機器戰勝象棋高手的方法(ibm的深藍早已在1997年做到),即學習盡可能多的“每下一子後最理想的下一子是什麽”(靠用大數據學習已有圍棋棋局),這種方法叫蒙特卡洛樹搜索(monte carlo tree search)法,我們姑且把這個方法叫“種樹”。即便如此,機器也隻“種了部分的樹”,遠遠沒有學習完圍棋棋局所有的可能性,當然,靠“種足夠長的部分枝幹”贏過人類已經足夠了,但這種方法無疑是有缺陷的,甚至是錯誤的。從本質上來說,由於根本沒有也無法證明人工智能可以像人類那樣下圍棋,這個實驗其實是失敗的。


    這個問題其實早在1960年就被提出來了,人工智能的危險到現在也沒有發生。人工智能會帶來危險的一個很重要的原因是,人類其實很不擅長表達自己想要什麽,人們經常會誤解自己的願望或者不知道如何正確表達。在和機器人交流時,人類的措辭必須全麵而準確。比如,當你對一個人說:“你能找到消滅癌症的方法嗎?”對方能夠理解這意味著什麽,但是當我們告訴機器人時,就需要清楚地申明,我們的目標是:“在保存人類的前提下消滅癌症。”


    另外,很多人習慣從今天還不夠成熟的人工智能係統來推斷未來的人工智能,自然也會得出不成熟的結論。而且,大多數人都不理解未來機器人會擁有的超智能是什麽,超智能不同於我們以前見過的任何東西。舉例來說,如果以後機器人能夠理解人類的語言了,那意味著什麽呢?意味著一個機器人在短時間內就能閱讀和理解人類寫過的任何東西了。一個正常人可能一周隻能讀一兩本書,一生能讀的書數量也是有限的,但是這台機器能讀完世界上存在的所有書籍,關於物理學、生物學、化學、醫學、曆史、詩歌、愛情小說等的所有讀本,人類所知道的一切它都能理解。


    這樣一台真正“博學”的超智能機器自然會想出很多你從未想過的東西,以你根本想不到的方式和計劃幫你實現目標。但關鍵就是要讓機器人準確理解目標到底是什麽,賦予它一個具體化的目標。僅僅說“我是個聰明人,我絕不會為找出治療癌症的方法而殺死世界上所有人”這樣的話是沒有用的。


    現在有兩個問題:第一,我們要花多長時間才能造出這樣的超智能機器?第二,我們如何把這些機器控製在安全範圍內,確保它們“循規蹈矩”?比爾·蓋茨、埃隆·馬斯克和我都認為,造出了超智能機器後,解決第二個問題就很關鍵,就要確保我們給機器人的目標高度符合人類的目標。


    關於這一點,機器人首先需要明白,它們可能會得出一些解決問題的方案,但是人類可能會不認同。這種情況下,正確的做法應該是人和機器進行溝通。比如,如果想解決全球變暖問題,機器人需要去探索各種可能性,最終得出一個讓人類信服的結論。


    當然,為了讓機器充分理解人類的目標和人類想要的東西,我們首先需要解決自然語言處理的問題。從技術層麵上來說,製造超智能晶體管應該不是什麽難事,比起以前來說要容易得多。這是值得投資的領域,也是我現在正在做的事。


    我的團隊正在研發能讓機器學會人類基本價值體係的方法。問題是,很多常識類的東西人類是不會說出來的,比如,沒有人會每天走來走去告訴別人我很喜歡自己的左腿,不想失去它。但對機器人來說,這不是什麽顯而易見的事。我們需要把這些人類不會說出來的事情明白無誤地告訴機器人。再比如,現在大家都對能做家務的服務型機器人青睞有加,但是,真正要保障安全性的話,這個機器人就需要具備很多常識,比如,它要知道主人的貓是不能用來做晚飯的。確實,貓肉營養豐富,蛋白質含量很高,價格也不貴,但是相比其營養價值,寵物貓的情感價值更重要。如果機器人不明白這一點,就會煮了寵物貓,而這樣的事情隻要發生一樁,就會帶來整個產業的末日。


    如果機器提前學習過類似的案例,知道人類通常是如何選擇的,就可以根據人類的行為進行價值評估,這也是我們在做的研究。我們最終會研究人類的一切行為。世界上大多數書都會講到人類做了什麽,什麽讓他們開心,什麽讓他們不開心。大量的電視節目也都是關於人類行為的內容,這些學習資料觸手可得,通過觀察他人行為和解釋發生的現象來學習和內化新的知識,這也是人類學習的方式。不過,機器學習最經典的方法是給它們展示各種行為,然後再讓它模仿。


    20年,如何讓你的機器人懂你


    如果說10年時間才能解決機器人理解人類語言的問題,也就是自然語言處理問題,我覺得20年才可以解決價值體係這個問題。如果我有一家機器人公司,未來想研發出能一起出去玩、一起逛街的機器人,我唯一需要的就是賦予它一個價值體係,未來也肯定會有專門銷售價值體係的公司。最現實的案例是,無人駕駛汽車就需要一個“價值觀”。因為無人駕駛汽車需要在安全和速度之間權衡,需要在撞傷乘客、撞傷行人、撞壞車之間權衡,而權衡這一切就需要有個價值判斷準則。因為無人駕駛汽車是在真實世界運行的,不像工廠裏的機器人,是關起來、受控製的。


    家用機器人也可能會出現類似的情況,隨著我們在虛擬語言助理方麵的進步,我覺得這方麵的市場潛力會很大。家用機器人未來可以非常有用,可以幫助你處理各種事情,但要真正信任它的服務,它必須要“懂”你,它需要知道你有男朋友、有父母、是一名員工等所有重要的人際關係,需要知道有很多東西你會和男朋友分享,但不會和你的同事分享等,若想做出正確的選擇,這個機器人必須懂你,必須理解它的所作所為到底能不能讓你開心。


    在機器人學會人類的價值體係之前,人類的很多工作還是不會被機器人取代的。當然,很多現在“把人當機器用”的工作,以後可能就會徹底消失。而需要很多直接溝通和交流的工作反而不會被機器人取代,比如教師、護士等。至少,我不想讓自己的孩子由一個機器人教導,也不希望自己生病的時候身邊沒有一個人類護士來陪伴照料。


    長期來看,對食物、汽車等這種物質上的需要,都可以通過機器生產來滿足,而人類將更多從事通過溝通滿足他人精神需要的工作,也就是說,未來會有很多新工作涉及人際互動。比如,未來可能會有專門上門陪你吃午餐的人,背後的邏輯是:雖然我隻是和你一起吃個午飯,但我既聰明有趣又富有同理心,而且我付出了時間,所以你會心甘情願付錢給我。


    皮特·阿布比爾:機器人現在到底有多智能


    一個機器人折疊毛巾的短視頻在網上紅極一時,這名機器人名為“brett”(用於解決繁雜任務的伯克利機器人),曾是著名的矽穀機器人製造商willow garage生產的pr2機器人。教給它如何疊毛巾的是加州大學伯克利分校計算機科學家皮特·阿布比爾(pieter abbeel),他也是如今機器學習領域的領袖專家之一,他用深度強化學習(deep reinforcement learning)的方式教會了機器人用手完成難度很高的新技能,除了疊毛巾,還包括從冰箱裏順利接過不同的物體等。2016年4月,皮特加入了由埃隆·馬斯克等諸多矽穀知名企業家創建的人工智能非營利機構openai。


    38歲的皮特看起來很年輕,穿著簡單的t恤和牛仔褲,在辦公室匆忙吃了份盒飯午餐後,他先帶我們參觀了機器人學習實驗室(robot learningb),brett人形機器人以及其他工業機器人等都是從這裏培育出來的。整個實驗室安靜又雜亂,研究人員的辦公位置散落在幾台機器人附近,白板上畫著各種複雜的符號和公式。


    談起當下機器人的發展現狀,皮特印象最深刻的進步是“監督式深度學習”(supervised deep learning),他認為這讓機器人的圖像和聲音識別能力在過去五年裏有了很大的突破,一些訓練過的機器人係統可以“看圖講故事”了,比如你問它“這隻貓在幹嗎”?它可能回答“貓在追一隻球”,雖然回答還做不到準確和完善,但已經接近“配置常識”,這已是振奮人心的進步了!這種進步的背後,主要是關於如何使用足夠多的大數據和強大的計算能力研發出人工神經網絡算法,皮特對此格外興奮,因為很長一段時間以來,機器人對圖像的理解都隻局限於識別圖像標簽的階段,它可以識別出狗或貓,但並不理解圖像本身,也無法解釋到底發生了什麽。


    皮特表示,監督式深度學習隻是眾多機器學習方式中的一種而已,它完全是關於模仿的,你隻要給機器一個例子,一些相對應的標簽和動作即可。他真正感興趣的則是深度強化學習,即讓機器人通過不斷試錯的方式進行自我學習。“我的關注點是如何讓機器人學會‘自學’,這種學習能力可以是通過觀察模仿人類得來的,也可以是通過機器人自己不停試錯得來的,這是我和團隊成員目前花時間最多的事情。”


    除了疊毛巾,皮特的團隊已經嚐試讓機器人通過不斷試錯的方式學會了擰瓶蓋等技能,雖然速度還很慢,學擰瓶蓋就得花一個小時。但“這也不算太糟,嬰兒學擰瓶蓋得3年”。也就是說,機器學習裏非常重要的一個挑戰是技能的轉移。“目前的深度強化學習方法很擅長學習一些特定的技能,但是這些技能並不能轉化為你想讓機器學的另一項新技能,這卻是讓機器人進入真實世界的關鍵所在,畢竟,機器人每次學的東西總會有些不同,你又不想每次都從零開始。”


    皮特認為,雖然現在機器人產業一片火熱,能做外科手術的達芬奇手術機器人(leonardo’s robot)以及不少製造業使用的越來越精巧的工業機器人等讓人讚歎,但目前機器人的一大問題是它們還無法處理不確定因素。“隻要機器人處於一個它之前從未經曆的新情況中,要它自己做決定幾乎是不可能的”,不過,皮特覺得這正是如今人工智能開始進軍的領域,他很期待看到接下來機器人會如何處理真實世界之中的各種變數。


    雖然現在機器人熱度居高不下,但環顧四周,街上汽車到處都是,卻很少見到活動的機器人。大部分人還不願意像買一輛車一樣買一個智能機器人,究其根本,不是因為費用的問題,更多的是機器人能力的問題。雖然目前新推出的機器人五花八門,但它們的能力仍然非常有限,能做的事情就那麽一件或幾件,人們當然不願意花幾百美元買一個隻會把髒衣服從地上撿起來放進洗衣籃的機器人,況且,機器人在實際操作中還有可能犯錯。


    “確實,現在的機器人就處於這樣一個尷尬的位置,雖然我們在實驗室裏已經證明機器人可以做很多基本事情,但實驗室跟家庭裏能廣泛應用的機器人又是兩碼事,我很希望未來10年裏,人們家裏能有自己動手幹活的機器人,即便這樣我都不知道是否能夠實現”,皮特並不特別樂觀。


    對於人工智能的未來,皮特表示,如果將來人們真的能製造出一個具有人類智力水平的人工智能係統,那麽很有可能會發生的是,遲早有一天它會變得比人還聰明。因為人與人之間的信息分享是很有限的,我們隻能交談、打手勢等,但如果兩個人工智能係統互相交流,它們可以直接相互讀取對方的大腦,同時下載對方所有的內容。“當然,今天我們暫時還不用擔心人工智能超越人類智能,長遠來看,我們或許應該擔心,不過,長遠又到底是多遠呢?5年,10年,還是100年?又有誰知道呢?”皮特說。


    安德·凱:當我們在說機器人時,我們到底在說什麽


    安德·凱(andra keay)是矽穀機器人(silicon valley robotics)集團的常務董事,該集團主要關注機器人技術的創新和商業化,這讓安德對矽穀的機器人新公司發展情況非常熟悉。此外,她還是機器人黑客空間robot garden的創始人,全球範圍內有名的機器人科技新聞網站robohub的主要創立人。


    與安德的會麵安排在了一個機器人黑客空間裏,她認為機器人是21世紀無所不在的工具和新技術,對讓更多人接觸機器人技術有著濃厚的興趣和使命感。安德在訪談中最有趣的觀點是對機器人這個概念進行了反思,提出“任何一輛汽車其實都是機器人”。


    什麽是機器人


    當人們說機器人時,他們到底指的是什麽?很多人對機器人的定義裏包含了許多將機器人擬人化的偏見。當我們想到機器人時,我們想到的對象往往是比貓大,比馬或房子小,跟人差不多一樣大小和形狀的東西。我們往往會在它身上試圖尋找一些跟人相似的東西,比如有臉、有眼睛或一些表情,或者有手臂,即機械臂,甚至有一半都跟人相似等。


    我讚同國際標準化組織(iso)對機器人的定義,即,“機器人是可自動控製且可重複編程,具有多功能機械手以及三個或更多的軸,在工業自動化應用中固定或移動使用的設備”。我認為這個定義非常切合實際,它包括了許多我們傳統觀念裏不認為是機器人的設備,說明現在我們關注的“機器人”其實隻是整個機器人中的一小部分。當我們將機械臂和電腦等設備塞進一個盒子裏,我們就很容易忘記了這些東西跟我們稱為“機器人”的東西其實擁有一樣的構造和部件。這些東西馬上就變成了“電器”或“交通工具”,比如智能洗衣機、汽車。今天的任何一輛汽車都是機器人,今天的任何一輛飛機也是機器人。但我們對它們習以為常乃至視而不見。


    當大多數人聊起機器人時,他們要麽說的是跟人相似的機器;要麽說的是我們如何跟機器人互動,如何處理機器人可能會搶走人類工作的恐懼或如何能讓機器人在未來更好地幫助人類的渴望;要麽說的是電影和電視裏才有的機器人。這個時候,我們完全是從人類的視角來看機器人的。


    華盛頓大學的法學家雷恩·卡羅(ryan calo)已經在關注機器人對我們生活的影響。比如,當一個機器人撞倒了一個鄰居,或傷害了鄰居的狗,我們該怎麽處理?他通過研究關於機器人的諸多法律案例發現,在法律上,對如何定義機器人的分歧很大,法官往往基於他們對特定情況的理解來判定。在一些案例中,法官使用的定義是,“機器人是沒有思想的、能自動移動的機器”。在另一案件中,他們使用的定義則是,“機器人是有自主活動能力,能不受控製的機器”。某種程度上,機器人的概念“迷失”了,因為它變得非常具有功能導向了。


    當我們製造需要在現實世界裏工作,並且可控製的設備時,我們用非常務實乃至嚴格的工業標準來定義機器人。比如,我們對製造一輛車就有許多標準,對挖掘機、收割機、公共汽車以及跑車都有不同的標準。但是,現在一些全新的機器人設備正在進入市場,但我們還沒有來得及對它們進行分類,它們可以用於農業,也可以用於工廠,我們到底該怎麽稱呼它們呢?以無人機來說,它在十幾年裏被人熟知的是非常昂貴的軍事設備,最近幾年又變成了消費級的玩具,我們現在希望將其商業化,比如無人機快遞。但我們還不清楚它到底最適合哪種商業,又需要受到怎樣的控製,這些都是需要我們探索和解決的。


    我尤其關注這些問題,因為這涉及機器人如何從實驗室走向市場。有一個機器人定義的“笑話”,說機器人就是那些在演示片裏還無法很好工作的設備,我倒覺得很合適。因為像汽車和飛機這樣運行和服務得很好的設備,我們便視為理所當然,不稱為機器人了。


    機器人的未來


    如今,機器人領域的新技術、新公司以及投資都集中在矽穀。我翻閱和查找了所有該領域能找到的數據,發現在2009~2014年這5年間,美國機器人領域的投資總額約為10億美元,而2015年一年的投資金額就約10億美元,其中,約3/4都集中在矽穀。這讓我非常震憾。矽穀在這一領域能有這麽多新公司,我覺得跟willow garage在此誕生,並奠定了開源機器人技術的基礎有關,也跟矽穀兩個獨立的機器人技術研究和發展中心有關,即otheb和美國斯坦福國際谘詢研究所。2017年矽穀在該領域預計會有100家左右新公司出現,而且它們也應該都能找到資金。


    這一領域的矽穀新技術中,我印象比較深的是微型機器人和納米機器人,它們目前主要還在試驗階段,但也有一些正在商業化。比如,我們將在未來幾年內看到用於眼科手術的納米機器人以及用於建築業的微型機器人。軟體機器人也非常讓人興奮,它們柔軟靈活,可彎曲變形,可以抵達傳統機器人無法抵達的空間,可以被用於醫療領域的手術、外骨骼等,也可以用於勘探,有著非常廣闊的行業應用前景。


    要靠新的機器人技術來賺錢還言之太早,明顯能賺錢的是現在不少公司在製造的物流機器人以及應用於汽車和交通領域的機器人技術。新型工業機器人以及用於農業、物流、手術和護理的機器人也應該很快能看到利潤。對還在機器人領域不斷湧現的新公司來說,重要的還是要能快速清晰地判斷自己的技術是否會有消費者,是否能滿足市場的需求。畢竟,很多新公司的失敗不是因為它們沒有資金支持,是因為它們一直都沒有找到消費者。


    未來,機器人會滲入每個領域,它當然會改變人的工作,但利大於弊。機器人會代替人類完成很多人類不喜歡的以及不能完成的工作,人類將做更多自己熱愛的工作並得到更高的薪水。就好像一百年前,約超過3/4的勞動力集中在農業領域,如今越來越多的人可以去讀大學,去做別的自己喜歡的工作而不是捆綁在農業上一樣。我希望在下一個十年中,機器人能夠進入我們的日常生活。


    奇點大學人工智能講師沃森:請尊重機器人


    雷·庫茲韋爾的奇點理論是人工智能領域繞不過去的話題。2016年3月22日,斯坦福大學為不久前逝世的人工智能之父馬文·明斯基(marvin minsky)舉行了紀念會,我在會上看到了曾是馬文·明斯基學生的雷·庫茲韋爾,他和女兒一起,就坐在我的旁邊,上台之前,他都在不停地修改自己的演講手稿。


    結果,庫茲韋爾的演講出乎意料的簡短,估計所有人都記住了他“雷式風格”的結束語,“我相信,2045年(他預測的奇點到來,人類永生之年),我們就能再次見到明斯基”,像是一部超現實主義電影的開場。庫茲韋爾堅信,奇點就是這樣一個“技術以指數級的發展推動人類的解放,使人類能力產生質變的”時刻,而他創辦的奇點大學就正為這一天做著準備。


    幾天後,我在位於矽穀核心地帶的nasa(美國國家航空航天局)埃姆斯研究中心找到了位於其中的奇點大學,並采訪到了一位人工智能講師內爾·沃森(nell wonson)。


    沃森在奇點大學學習了以指數思維預測未來,她認為,接下來10~15年的趨勢一定是人與機器之間的緊密聯係和深度融合。到底會有多深度呢?她喜歡的例子是,麻省理工學院的科學家蒂姆·休(tim hugh)已經將用dna(脫氧核糖核酸)折紙術製作的納米計算機放在了一隻蟑螂的體內,隨著技術的提升,“我們沒有理由不相信10年內我們就可以在自己身體內部安裝計算機,屆時,身體內置一部智能手機,就好像現在我們整天在口袋裏裝著智能手機一樣平常”。


    怎麽內置?是像孫悟空將金箍棒放在耳朵裏那樣,還是像現在文身一樣,選個自己喜歡的位置植入?沃森覺得這不是問題,她覺得會更有趣的地方是,如果人體內的計算機可以運行人工智能程序會怎麽樣?這樣一個與你無時無刻不在一起的智能機器人會經曆你全部的生活,會慢慢了解和學習你的身體、習慣和情緒等,它會漸漸懂你,在某些方麵,它會比你自己更懂你。這種“血肉相連”般的融合正是人類和機器人前進的方向,是人類未來的命運。


    艾薩克·阿西莫夫提出的“機器人學三定律”(機器人不得傷害人類,機器人必須聽從人類的命令,機器人必須保護自己)在世上流傳了很多年,但沃森覺得這幾條規則其實是非常危險的,是人類對機器人開出的“不平等條約”。她提出,當人和機器的關係即將達到一個非常親密的階段時,我們首先必須重新考慮雙方相處的規則,而且很多時候雙方需要遵守一樣的規則。


    我們很多人理所應當地認為,機器人必須做我們讓它們做的事,而我們想怎麽對待它們都行。沃森一臉認真地表示,這種想法等於給了機器人倫理上的正義性,如果有一天被這樣對待的機器人反抗了,那基本上屬於“正義之戰”,屬於“自衛”,而自衛在任何倫理(甚至法律)規則裏都是被接受的。


    沃森相信,任何真正智能的機器某種程度上都會跟我們一樣,擁有思考宇宙的能力,它們早晚會認識到,把一部分人看成異類的製度有可能是錯的,它們會困惑為什麽有些規則隻適用於一些人,其他人則不必遵守。如果人類強迫他們做一些事情,而這些事情傷害了它們,它們可能會選擇自我保護。“盡管我們創造了機器人,但我們不能簡單地把它們當成實驗室的小白鼠或奴隸一樣對待,強迫它們接受人類不合理的行為,我們應該給它們尊重,雖然它們現在還很笨,但它們很快會變聰明的。”


    沃森的另一個理由是,當未來10~15年人類和機器深度融合後,人類和機器的界限會漸漸模糊,善待機器人就好像你應該善待其他人一樣,是一件自然而然的事情。這一點倒是不難理解,假如機器人像我們的手、腳一樣成為我們身體和生活的一部分,默默地為我們服務和貢獻,難道它們不應該得到我們的珍惜嗎?這不禁讓我想起了斯坦福大學一位人工智能學者說過的話,“不會善待機器人的人,多半也不會善待其他人”,他同樣呼籲大家更“有愛”地對待身邊的機器人,隻不過,他是從人性角度得出的結論。


    接下來的問題是,我們到底應該拿什麽態度和方式對待可能成為我們未來“親密夥伴”的機器人呢?沃森的答案是,“我覺得應該像對待兒童一樣,因為它們在各方麵都還不成熟,我們沒想過讓一個孩子承擔跟成年人一樣的責任,但它們仍和成年人一樣擁有或多或少同樣的權利”。目前最大的挑戰是,我們需要把人類世界基本的道德倫理教給這些機器人兒童,就好像我們需要教會幼兒園的孩子們知道,不能隨便打人、不能偷東西一樣,已有實驗證明,機器人可以被人類訓練得很友善,也可以被訓練得很壞、很刻薄,這就看人類怎麽教導了。


    但是,沃森笑著說,機器人不可能擁有跟人類一樣的需求或欲望,它們畢竟不需要吃飯和睡覺,很多人想象它們會跟人類一樣會渴望權利、會複仇等,這也是不可能的。目前人工智能真正的危險在於,當人類讓它做一件事情時,它可能會完全誤解這個指令,做出讓人類後悔莫及的事情。

章節目錄

閱讀記錄

人類2.0:在矽穀探索科技未來所有內容均來自互聯網,鉛筆小說網隻為原作者皮埃羅?斯加魯菲的小說進行宣傳。歡迎各位書友支持皮埃羅?斯加魯菲並收藏人類2.0:在矽穀探索科技未來最新章節