考慮到圖靈提出的另一個論點,到目前為止,我們隻是構建了相當簡單和可預見的人工產品。當我們增加了機器的複雜性,或許我們會為我們的存儲感到驚訝。他列舉了反應堆分裂的例子,如果低於某一“關鍵”值,那麽什麽也不會發生,但是如果高過這個值,就會迅速發生爆發。因此,大腦和機器也可能如此。大多數大腦和所有的機器目前都處於“次臨界”狀態——他們僅僅以平常的方式回應刺激,而沒有自己的思想,隻能產生平常的回應。但現在也有一些大腦,或是一些未來的機器正處於超臨界狀態,它們有自己的思想。圖靈表明這隻是一個複雜的問題,如果複雜性超過一定的級別,那麽將會出現質的區別,因此“超臨界”機器與之前的簡單機器相比,將是與眾不同的。
——盧卡斯,牛津大學哲學家,寫於1961年的文章
"minds,machines,and g?del"<small>157</small>
假定超級智能有朝一日在技術上是可行的,人們是否會選擇去開發它?這個問題的答案毫無疑問是肯定的。與超級智能緊密聯係的是巨大的經濟回報,隻要是有競爭壓力和利潤產出,計算機產業在新一代的硬件和軟件上的巨額投資將會持續下去。人們需要更好的計算機和更智能的軟件,他們希望機器生產的利益能夠幫助生產;希望機器可以產生更好的醫療藥品;機器可以減輕人類的負擔,可以執行無聊或危險的職業;娛樂——產生永恒的消費利潤。在這個過程中的任何一個位置,恐懼新技術的人都會振振有詞地說:“到此處為止,不要再更進步。”
——尼克·波斯特拉姆,"how long before superintelligence?"1997
超級智能可以解決或者至少可以幫助我們解決任何問題。疾病、貧困、環境破壞,以及各種不必要的痛苦:這些痛苦都是可以通過配備先進納米技術的超級智能消除的。此外,通過納米醫學,我們不僅可以停止和扭轉衰老過程,還能夠選擇上載我們的智能。超級智能還可以為我們創造機會,極大地提高智力和情感的能力,還可以協助我們創造一個充滿吸引力的體驗世界,在這個世界中,我們可以快樂地娛樂,快樂地與他人相處,快樂地體驗、成長,這便是近乎完美的生活。
——尼克·波斯特拉姆,"ethical issues in advanced artificial intelligence,"2003
機器人將繼承地球?是的,但是它們將是我們的孩子。
——馬文·明斯基,1995
在這三個(遺傳學、納米技術和機器人技術)主要的、根本性的奇點革命中,最深刻的是機器人技術,它所涉及的非生物智能的創造超過了非增強性的人類。較高的智能處理定然會超過低智能處理,它將令智能真正成為更加強大的力量。
在gnr中,r代表機器人技術,這裏涉及的真正問題是強人工智能(人工智能超越了人類智能)。在這一構想下,強調機器人技術的原因在於:智能需要一個具體化的物質存在的形式來影響世界。我不讚成強調物質存在,但我相信關注的中心問題是智能。智能必然會以一種方法來影響世界,包括建立承載自己的實體方式和實際操作。此外,我們還可以將身體技能歸為智能的基本組成部分。例如人類大腦的一大部分(小腦包含了超過一半的神經元)就用來協調我們的技能和肌肉運動。
有幾個原因可以解釋為什麽人類級別的人工智能一定會大大地超越人類智能。正如我剛才指出的,機器可以很輕易地分享其知識。作為非增強型的人類,我們沒有分享大量的神經元連接和神經傳遞素濃度的大量模式,後者構成了我們的學習、知識和技能,而非緩慢的、基於語言的交流。當然,這種交流方式是非常有益的,因為它使我們與其他動物相分離,並且是科技創造的促進因素。
人的技能隻能在變革性的激勵下發展。這些技能主要建立在大規模並行的模式識別基礎上,提供熟知諸如區分新麵孔、確定對象和辨識語言發音這些任務的能力。但它們並不適於很多其他的需求,比如確定財務數據的模式。一旦我們充分掌握了模式識別的範式,機器方法就可以將這些技術應用到任何模式類型。<small>158</small>
機器能夠以人類所沒有的方式綜合利用其資源。雖然與個體相比,人類集體可以實現物質的和精神的偉大事業,但是機器可以輕鬆而又迅速地集中其計算、存儲和通信資源。如前所述,互聯網正在演變為一個全球性的計算資源網格,這些資源可以即刻匯集起來,形成大規模的超級計算機。
機器有精確的回憶力。當代計算機可以精確地管理數十億的資源,而且這種能力每年還在翻番。<small>159</small>計算機根本的速度和性價比每年都在提高,而且增速率本身也在加快。
隨著人類知識遷移到網絡,機器將能夠閱讀、理解並合成所有人類的機器信息。而上一次生物人掌握所有的人類科學知識還要追溯到數百年前。
機器智能的另一個優點是,它可以無休止地高速執行任務,並可以整合最尖端的技術。芸芸眾生中的一人可能已經掌握了音樂創作,而另一個可能掌握晶體管的設計,但是以固定的人腦結構來說,我們沒有能力(或時間)來開發和利用這種日益專業化的領域的最高級別水平的技術。在一些特定的技能上,人們彼此也有很大的區別,以致當我們談論作曲人的水平時,我們到底是指貝多芬,還是指一般人?非生物智能將達到並超過每個領域的高精尖人才的技能。
基於這些原因,計算機一旦達到人類智能的範圍和精妙程度,那麽它一定會超越過去並繼續以指數級速度上升。
一個關鍵的奇點問題就在於是先有“雞”(強人工智能)還是先有“蛋”(納米技術)。換言之,是強人工智能將導致完整的納米技術(分子製造裝配,可以轉化為物質產品的信息),還是完整的納米技術會導致強人工智能?正如前麵內容中提到的原因,第一個前提邏輯是強人工智能將意味著超強的人工智能,而超強人工智能將有能力通過實施完整納米技術的方法來解決餘下的設計問題。
第二個前提是基於實現強人工智能的硬件要求應與基於納米技術為基礎的計算相符合。同樣,軟件需求將促使納米機器人對人類大腦機能進行非常詳細地掃描,從而完全實現逆向工程人腦。
這兩個方麵都是合乎邏輯的,很顯然兩種技術是相輔相成的,現實情況是,這兩個領域的進展一定會利用我們最先進的工具,這樣在一個領域的進步便將同時促進另一領域的發展。盡管如此,我確實希望出現優於強人工智能的完整分子納米技術,這個過程隻需要幾年的時間(2025年左右為納米技術,2029年左右為強人工智能)。
隨著納米技術革命的到來,強人工智能將有更深遠的影響。納米技術是強大的,但不一定是智能的。我們至少可以設計出管理納米技術的強大權力的方式,但超級智能卻是天生無法控製。
逃逸的人工智能。一旦強人工智能實現,它可以很輕易地獲得提高,其能力也會增倍,因為這是機器能力的根本特質。隨著強人工智能的到來,很快便會產生許多強人工智能,後者又開始自身的設計、理解和改進自身,從而很快演變成更多的能力,以及更加智能化的人工智能,這個充分過程會無限循環下去。每個周期不僅會創建一個更智能化的人工智能,而且比上一次循環花費更少的周期,這是科技發展(或任何進化過程)的本質。前提是一旦實現強人工智能,它會立即成為迅速增長的超級智能,從而失去控製。<small>160</small>
我個人的看法略有不同,失控的人工智能在邏輯上是有效的,我們需要考慮時機問題。一台機器達到了人類智力的水平並不會馬上產生一個失控的現象。這需要考慮到人類的智力水平是有限的。我們現在就有這樣的例子——約有60億個例子。考慮這樣一個場景,你從一個購物中心帶來由100人組成的一個小組。這個小組由理智的、受過良好教育的人構成。然而,如果這個小組被授予改善人類智慧的任務,進展就不會很大,即使他們也擁有人類智慧的模板。製造一個簡單的計算機對他們來說可能也很辛苦。加速他們的思考能力和擴張這100個人的記憶容量也不會立即解決這個問題。
前麵的內容已經指出,機器將會匹配(並迅速超越)各個領域頂級的人類技能。因此,我們換成100名科學家和工程師。這是一組在技術上具有良好教育背景的人,他們將有能力改善設計。如果一台機器的能力等效於100(最終1000或100萬)個受過技術培訓的人的能力,每項操作的速度遠遠快於自然人,那麽一個迅速加快的智能將最終實現。
然而,當計算機通過了圖靈測試,這種加速並不會立即發生,圖靈測試相當於平均水平的匹配能力,受過教育的人比從商場裏麵找的人更接近於我們的範例。對計算機來說,管理所有這些必要的技能,並把這些技能與必備的知識基礎相匹配是需要時間的。
一旦我們成功地建立了一台機器,並且其能通過圖靈測試(大約在2029年),隨後將是一個統一的時代,在這個時代裏,非生物智能將迅速增長。奇點預期的非凡擴展,人類的智慧數十億計的翻番,這些將會在21世紀40年代中期發生(就像在第3章討論的一樣)。
人工智能的冬季
有愚蠢的謠言說人工智能已經失敗,但人工智能在你周圍是無處無時無刻存在的。人們恰恰沒有發覺,在汽車係統裏調整燃油噴射係統的參數就是人工智能。當你下飛機的時候,人工智能調度係統會為你開門。當你用一個微軟軟件的時候,都有人工智能係統試圖解決你所做的事情,比如寫信,它做得相當好。當你看一個由計算機製作角色的電影時,作為一個群體的行為,它們都沒有人工智能。當你玩視頻遊戲時,你的對手就是人工智能係統。
——羅德尼·布魯克斯,麻省理工學院人工智能實驗室主任<small>161</small>
我仍然能碰到有人聲稱人工智能在20世紀80年代已經枯竭,但這種論點相當於堅持認為互聯網將在21世紀初滅亡<small>162</small>。互聯網技術表現在帶寬和價格方麵:節點(服務器)數量,以及電子商務的交易量在度過了低穀和蕭條時期後,進入了平穩加速的繁榮期。人工智能也曾經是這樣。
範式遷移(從鐵路、人工智能、網絡、電信到現在可能是納米技術)中的技術成熟曲線通常開始於不切實際的期望(由於對促進因素缺乏了解而造成的)的時期。雖然這一新的模式利用率成倍增加,但是早期增長緩慢,直到達到指數增長曲線拐點。革命性變革的普遍預期是準確的,它們卻是不同步的。當前景並非一帆風順時,就進入了幻覺期。不過指數增長繼續有增無減,多年後一個更加成熟、更切合實際的轉變一定會發生。
我們看到19世紀鐵路的迅速發展,隨後便是普遍的破產(在我收集的曆史文件中,發現了有一些早期沒有兌付的鐵路債券)。我們仍然受到幾年前電子商務與電信業蕭條的影響,這也導致了燃油經濟的衰退,從那時起,我們正走向複蘇。
人工智能經曆了一個相似的過早並過於樂觀的時期,緊隨其後的就是1957年由艾倫·紐厄爾,j·c·肖和赫伯特·西蒙創造的通用問題求解程序,這個程序找到了曾經難倒像羅素等數學家的定理的證明,早期的程序都來源於麻省理工學院人工智能實驗室,這些程序可以解決大學生級別的學術能力測試問題(比如相似性和經曆問題)。<small>163</small>人工智能暴露問題出現在20世紀70年代,20世紀80年代是人工智能的蕭條期,那時的人工智能無法轉化為利潤,那個年代也稱為“人工智能的冬季”。許多觀察家仍然認為人工智能冬季是這個故事的結束,並且人工智能領域也無法創造任何東西。
然而,今天成千上萬人工智能的應用都已經深深植根於每一個工業基礎設施中。這些應用大部分是10~15年前的研究項目。那些提問“人工智能到底會帶來什麽?”的人使我想起了在雨林中的旅客的疑問:“應該住在這裏的許多物種去了哪裏?”當數百種動植物在一個區域蓬勃繁衍時,它們已經與當地的生態緊密結合在一起了。
我們都順利地進入了“狹義人工智能”時代,這個概念指的是人工智能正在扮演一個有用而又特定的功能,一旦需要人類智力發揮,人工智能就可以發揮到人的水平或者做得更好。通常狹義的人工智能係統大大超過了人類的智力速度,能夠提供管理和考慮成千上萬個人同時進行工作。我接下來要描述關於狹義人工智能的例子。
這些時間框架相對於快速發展的互聯網和電信的階段周期(以年來衡量,而不是幾十年)來說,人工智能的技術周期(數十年的熱情成長,十年的幻滅,十五年在利用上的紮實推進)看上去有些漫長,但有兩個因素必須考慮:首先,由於互聯網和電信周期相對較近,它們更受範式轉型加速的影響(正如在第1章中討論的一樣),因此,最近通過的周期要大大快於40年前開始的周期;其次,人工智能革命將是人類文明要經曆的最為深刻的變革,所以它要比那些成熟而又不太複雜的技術經曆更長的時間。
理解了現象的技術本質,設計係統集中於該現象,並將它不斷放大。例如,科學家發現了曲麵的一個微妙的性質(稱為波努利原理):氣體(例如空氣)在曲麵上要比在平麵上運行快得多。因此,空氣壓力在曲麵上要比在平麵上的低。通過了解、聚焦、放大這些奇妙發現的啟示,我們在工程中創建了當前所有的飛行技術。一旦我們理解了智能的原理,我們也有相同的機會聚焦、集中並放大其能力。
我們回顧第4章,可以發現理解、建模和模擬人類大腦的每個方麵都在加速:包括大腦掃描的性價比和時間與空間分辨率;大腦機能的可用數據與知識的總量;大腦不同區域的模型與模擬的混合度。
我們已經有了一套從人工智能的研究中獲取的強有力的工具,這個研究也經過了幾十年發展的精煉與完善。大腦逆向工程通過全新包裝、生物啟示和自我組織等技術可以極大地提高這個工具包。我們最終將能夠運用工程能力來集中和放大人工智能,其智能化程度將是以百萬億倍超越現在人類的神經元連接。智能將從屬於加速回歸定律,該定律說明了現在每年信息技術的能力都在加倍。
人工智能(在這個領域我已經親身經曆了40年)的一個根本性問題是:一旦需要ai技術發揮作用,便會涉及各個領域(例如,字符識別、語音識別、機器視覺、機器人技術、數據挖掘、醫療信息和自動化的投資)。
計算機科學家伊萊恩·理查德將人工智能定義為“研究如何使計算機在什麽地方什麽時刻使人生活得更好”。羅德尼·布魯克斯是麻省理工學院人工智能實驗室主任,用另外一種方式定義人工智能:“每當我們領會了一種技術,它就會神奇地終止,我們會說,哦,這隻是個計算。”我還想起了沃森對福爾摩斯的評論:“起初我以為你做了一些聰明的事情,但事實上那根本算不了什麽。”<small>164</small>這是我們作為人工智能科學家一貫的經驗。智能魅力看上去減少到“無”時,我們就可以完全理解它的方法了。剩餘的就是謎,是有待於激起興趣的部分,是還沒到智能方法理解的部分。
人工智能工具包
人工智能就是在多項式時間內,通過探索問題域知識來解決非常困難問題的技術研究。
——伊萊恩·理查德
正如我在第4章所提到的,這僅僅是我們最近能夠獲得的關於人類大腦區域功能如何影響人工智能設計的詳細模型。在此之前,在缺乏足以了解大腦的工具的情況下,人工智能科學家和工程師開發了自己的技術。正如航空科學家沒有模擬鳥兒的飛行能力,早期的人工智能並不熟悉基於反向設計自然智能的方法。
接下來介紹這些方法中的一個小樣例。自采用以來,它們就在爭議中成長,這使得實用產品的創造可以避免早期係統的脆弱性和高錯率。
專家係統。20世紀70年代,人工智能經常等同於一種特定的方式:專家係統。這涉及應用具體邏輯規則的發展來模擬人類專家的決策過程。該過程的一個重要組成部分需要知識工程師與領域專家合作,比如醫生與工程師合作編撰其決策規則。
這個領域在早期取得了一些成績,比如醫療診斷係統,至少對於某些測試來說,可以與內科醫生相媲美的。例如,20世紀70年代開發的一個稱為mycin的係統,就是用來為傳染病診斷和提供治療的。1979年,一個專家評估組比較了由mycin和人類醫師提供的診斷與治療,發現mycin和醫生做的一樣好,甚至比任何醫生做的還要好。<small>165</small>
很顯然,這項人類決策研究往往不是基於明確的邏輯規則,而是基於“更軟”的證據類型。醫學成像檢查出來的黑斑有可能是癌症,但是其他因素諸如它的確切形狀、位置、與周圍的對比差別,這些可能會影響診斷。人類決策的預感通常受很多先前經曆的多種證據綜合的影響,而並不是局限於自身。我們甚至常常不自覺地意識到我們使用的許多規則。
到20世紀80年代後期,專家係統正在結合一些不確定性的概念,並且綜合許多隨機性的根據進行決策。mycin係統開創了這種做法。一個典型的mycin“規則”內容如下:
如果需要治療的疾病是腦膜炎,並且是真菌感染類型,那麽在染色體上無法看到微生物,病人的身體並不脆弱,病人一直呆在一個地方,卻水土不服造成球孢子菌病,病人的種族是黑人、亞裔或印第安人,腦脊液測試中的隱球菌抗原不呈陽性,那麽就有50%的可能性,隱球菌不是其中引起感染的生物體。
盡管像這樣單一的概率性規則不足以得到一個有效的結論,但是通過匯集數以千計的這樣的規則證明可以獲得一個可靠的結論。
cyc可能是持續時間最長的專家係統項目,由道格·萊納特和他的同事在cycorp公司創建。從1984年開始實施,“賽克”係統已經往數據庫裏裝載了許多具有常識性的知識,它能對從未直接學過的東西進行推演。這個項目涉及從困難編碼邏輯規則到概率性規則,現在又包括從書麵材料裏麵提取知識的手段(在人類監督的前提下)。最初的目標是產生一百萬條規則,這反映了隻是人類了解世界的一小部分。萊納特最新的目標是讓cyc掌握“上億的規則,截止到2007年,這是一個人能夠了解世界規則的大約數目”。 <small>166</small>
另一個雄心勃勃的專家係統正在由日本築波大學生物科學副教授達裏爾梅瑟進行著。他計劃開發一個包含所有人類思想的係統。<small>167</small>該應用程序可以用來通知決策者在哪個社區使用哪些思想。
貝葉斯網。在過去的10年裏一種稱作貝葉斯邏輯的技術建立了強大的數學基礎,該技術可以組合上千甚至上百萬的所謂“信息網絡”或貝葉斯網絡的概率規則。該技術最初是由英國數學家托馬斯·貝葉斯所設計並在其1763年去世後發表,該方法旨在確定未來事件可能是基於過去發生的同類事件<small>168</small>。許多專家係統就是基於貝葉斯技術不斷地從經驗中匯集數據,從而持續學習並改進他們的決策。
最有前景的一類垃圾郵件過濾技術就是基於該方法的。我個人使用一個名為spam-bayes的垃圾郵件過濾器,它可以幫你把電子郵件分辨出“垃圾”還是“正常”<small>169</small>。你給每個過濾器提供一個文件夾。它就根據這兩個文件類型,自動訓練自己的貝葉斯信息網絡來分析各自的模式,從而使它能夠自動將隨後的電子郵件放到正確目錄裏。它還會根據接下來的郵件繼續訓練自己,尤其是用戶對其做了更正。該過濾器對我來說已經使得垃圾郵件得到控製,因為它每天可以剔除兩三百條垃圾消息,並保留上百條“正常”的信息。它認為是“正常”信息而事實是垃圾郵件的可能性隻占百分之一,但卻幾乎沒有把標記為“好”的消息認為是垃圾郵件。該係統幾乎與我辨別垃圾郵件能力一樣,甚至還更有效。
馬爾科夫模型。另一種模型基於馬爾科夫過程,這種模型的特點是將概率隨機網絡轉換為複雜序列。<small>170</small>馬爾科夫(安德列·維奇·馬爾科夫,1856—1922),因為建立了“馬爾科夫鏈”而成為享譽世界的數學家。“馬爾科夫鏈”在1923年被諾伯特·維納(1894—1964)重新定義和完善。這個理論提出了一種估計一個可能發生事件序列概率的方法。這個理論經久不衰,例如,在語音識別領域,這個可能發生的事件序列就是音符。在語音識別領域,馬爾科夫模型將會估計各種不同的音符模式,這些音符相互之間如何影響,還有可能出現的音符序列。這個係統在更高層的語言中引入隨機網絡,例如可以估計詞語的出現概率。模型使用的實際概率是在實際的語言數據訓練中得到的,因此其是自組織的。
馬爾科夫建模是我和我的同事們都曾經在自己的語音識別領域研究用到的一種方法。<small>171</small>不同於音節方法,關於音符順序的規律是人類語言學家已經規定好的,我們既沒有告訴係統在英語中大約有44個英語音素,也沒有告訴它什麽樣的序列出現的概率比其他的概率大。我們讓係統從數千小時的錄音數據中發現這些規律。這種方式的優勢就在於能發現人類專家不能發現的微妙規律。
神經網絡模型。神經網絡是另一種流行的自我組織的方法,也被用在語音識別和其他多種模式識別的任務中。這項技術涉及模擬簡化模型和神經元網絡連接。一個基本的神經網絡描述如下:每一個給定輸入點(對於語音,每個點代表兩個維度,頻率和時間;對於圖片,每個點表示二維圖像中的一個像素)被隨機連接到第一層的模擬神經元中。每個連接都有一個關聯的突觸的強度,代表其重要性,這是一個隨機值。每個神經元將發給它的信號合並起來。如果合並後的信號超過某一閾值,神經元被激發並且向其連接地輸出一個信號;如果合並後的輸入信號不超過閾值,不會激發神經元,它的輸出是零。每個神經元的輸出都被隨機連接到神經元的下一層。一般會有多層(一般3個或以上),並且這些層要被豐富地配置。例如,一個層可以反饋到前一層。在頂層,一個或更多的神經元為隨機的選擇提供答案。(有關的神經網絡算法的說明,請參見本章後注釋<small>172</small>)。
由於神經網絡的布線和突觸權重的初始化都是隨機的,所以一個未經訓練的神經網絡的答案也是隨機的。一個神經網絡的關鍵是學習它的主題。如同人類對哺乳動物大腦很淺顯地認知上,神經網絡開始了我們對於無知的探索。神經網絡的老師可能是人,也可能是一個計算機程序,甚至是另一種更成熟的經過訓練的神經網絡,當它生成正確的輸出時會獎勵它,當然也會懲罰它。這反過來又會反饋給這個學習中的神經網絡,以調整每個神經元間的強度。與正確結果一致的連接會被加強,產生錯誤結果的連接將會被削弱。隨著時間推移,該神經網絡會在沒有老師的幫助下產生正確的答案。實驗表明,神經網絡甚至能夠從不可靠的老師那裏學到知識。即使老師隻有在60%的時間內是正確的,但是它仍然會汲取營養。
一個強大的、經過良好學習的神經網絡可以仿真許多人類識別方麵的才能。多種多樣的采用多層神經網絡的係統在模式識別中表現出令人印象深刻的能力,包括手寫識別、人臉識別,在商業交易中的欺詐行為,如信用卡交易欺詐,等等。我在使用神經網絡進行上述研究的經驗就是最具挑戰性的工作不是如何編碼實現它,而是為它們提供自動學習的能力。
由於在大腦逆向工程中我們開發了詳細的神經功能模型,神經網絡目前的趨勢是采取實際的生物神經網絡工作的機理,實現更現實和更複雜的模型。<small>173</small>由於在自我組織的模式方麵有了幾十年的經驗,因此在大腦研究方麵的新進展可以迅速地用到神經網絡的實驗中去。
神經網絡也是並行處理的過程,因為大腦就是這樣工作的。人類的大腦沒有一個中央處理機來模擬每個神經元。相反,我們可以考慮每一個神經元和每個神經元之間的連接是一個獨立的、運行速度較慢的處理器。目前廣泛開展的工作是開發專門的芯片,實現並行神經網絡體係結構,從本質上提供更大的產出和效率。<small>174</small>
遺傳算法(gic algorithms,ga)。另一個源於自然的自我組織的靈感是遺傳算法,或稱為進化算法。算法的思路是模擬進化,包括有性繁殖和突變。下麵是一個對它們如何工作的簡單描述。首先,對一個問題確定一種解決方法。如果這個問題是設計一個噴氣發動機的最優化的參數,那麽這個問題就是確定一係列的參數(包括這些參數的類型和所占空間的大小)。這些參數在遺傳算法裏稱為遺傳密碼。然後,隨機產生數以千計的遺傳密碼。每個這種遺傳密碼(代表了一種方案的參數)被看做是模擬解決方案的有機體。
接下來在模擬環境中使用確定的方法來評估每組參數,從而評估每個仿真的生物體。這一評價是遺傳算法成功的關鍵。在例子中,我們將每個解決方案應用到噴氣發動機的模擬上,通過采用已確定的評判標準,比如,油耗或者速度等,來確定這種解決方案的優劣。最好的解決辦法是優勝劣汰。
每個幸存者將繁殖,直至達到自己的解決方案所要求的數量。以上過程是通過模擬有性繁殖完成的。換句話說,每一個新的解決方案來自其中一個父代的基因組合的一部分,另外的部分來自於另一個父代。通常不加以區分男女,這樣足以使得任意兩個個體產生後代。當它們繁殖時,允許發生一些基因突變。
我們現在定義了模擬繁殖後代的方式,然後重複這種方式,進行多代的繁殖進化。在每一代都要確定這種方式的改進程度。當兩代之間的差異小於一定的閾值,或者說兩代之間的差異性可以忽略不計,那麽我們將停止這種方案的模擬進化。並且應用評判標準最好的那一代作為最終的選擇。(對於遺傳算法的算法描述,參看本章注釋<small>175</small>。)
遺傳算法的關鍵是算法的設計者沒有直接使用程序來解決問題,相反,而是讓各種情況一一出現,通過模擬競爭和改善反複完善這種算法。正如前麵討論的,生物進化適者生存,但是進展緩慢。因此,為了加強進化的智能,我們保留其優勝劣汰的鑒別力,但是同時也大大加快這種笨重的步伐。計算機運行速度足夠快,使得可以在數小時、數天或數星期內模擬出許多代的進化。雖然我們還是在一次模擬中完成這個反複的過程,然而,既然讓這種進化按照常規發展,那麽我們將高度精練的方式加以應用,以加快問題的解決速度。
就像神經網絡一樣,遺傳算法也是一種從雜亂無章的數據中挖掘出隱藏其中的精妙關係的方法。這種方法成功的關鍵就是對每一種可能的解決方案能夠進行有效的評估。這種評估的速度要求必須快,因為每次模擬進化都可能產生成千上萬的解決方法。
遺傳算法善於處理擁有大量參數的問題,這些問題的參數數量龐大到無法精確地分析或者尋找最優解。例如,設計噴氣式飛機的引擎,需要涉及上百個參數和數十種限製。通用電氣公司的研究員們使用遺傳算法設計的引擎比使用傳統方法具有更精確的結果。
當你使用遺傳算法時,一定要注意你要求的結果。蘇塞克斯大學的研究人員喬恩·巴德曾經用遺傳算法優化振蕩電路的設計。通過反複嚐試使用少量的晶體管的傳統設計,最優的設計是一個簡單的無線電電路,而不是振蕩器。很顯然的是,遺傳算法發現了從臨近計算機發射出的無線電波。<small>176</small>基於遺傳算法的解決方案隻有在確切的位置才能確定最佳的解決方案。
遺傳算法作為混沌和複雜性理論的一部分,越來越多地應用在解決複雜的商業業務問題上,比如優化供應鏈。這種方法正在開始成為整個行業的分析方法。這種模式也正在應用到模式識別,並且經常和神經網絡等自組織的方法結合起來。同時這也是一個比較合理地編寫計算機軟件,特別是那些需要協調資源競爭的微妙平衡的軟件。
克裏·多克托羅是一位著名的科幻小說家,他在小說《usr/bin/god》中使用了一個有趣的通過遺傳算法產生的ai。通過遺傳算法(ga)將許多複雜的技術相結合,能夠產生許多智能係統,每一次結合都是以遺傳密碼為特征。然後這些係統通過遺傳算法來進化。
評價功能的方法如下:每個係統登錄到不同的聊天室,並且假冒成一個人進行聊天,實際上這是一個秘密的圖靈測試。如果這個聊天室的一個人發現了這個聊天機器人,那麽評估就結束了,這個係統就停止進一步的優化,並且將它的成績報告給ga。這個成績是由它與人類對話時間的長短來決定的。ga通過逐漸的進化來提高它的智能性。
盡管它僅僅是在係統具有一定的智能性時才會使用可預期的時間進行評估,實現上述理念的主要困難是評價進化的功能需要大量的時間。同樣,進行評估時可以很大程度上地使用並行。隻要我們認識到問題的核心,向ga中注入成熟的算法,那麽進化到圖靈的智能是可以現實的。這是一個很有趣和有用的可以通過圖靈測試的方法。
遞歸搜索。有時為了得到一個問題的解決方法,我們需要在大量的可能解中進行搜索。一個經典的例子就是玩遊戲,比如下棋。一個玩家為了走一步棋,他需要想到所有可能的走法,以及每種走法可能會引起的結果,等等。然而,對於人類來說,把所有走法的序列記起來是不可能的,他們必須依靠經驗分析每種情況來確定下一步的走法,而計算機則依靠邏輯運算來分析數以百萬計的走法。
這種邏輯樹是大部分遊戲的核心。現在我們考慮一下如何才能做到這一點。我們建立一個稱為選擇最佳下一步的程序。這個程序可以羅列出所有可能的走法(如果不是一個遊戲而是解決一個數學理論問題,這個程序需要在一個證明中羅列出所有的下一步的可能算法),對於每步走法,程序會建立一個由這種走法而引起的所有可能性的表。對於每個表,我們需要考慮如果這麽走,我們能遇到的所有情況。現在遞歸出現了,因為這個程序被自己調用(pick best next step,從名字就可以看出)來確定最佳的下一步走法。在調用自己後,程序會列出所有可能的走法。
這個程序不斷調用自己,在給定的時間內盡可能多地考慮未來的走法,這樣就會產生以指數型增長的邏輯處理樹。這是另外一個以指數增長的例子,因為預先處理以後的走法或者說是對策需要大約5倍於現在的計算量。遞推公式成功的關鍵是邏輯樹的裁剪,並且最終能夠停止增長。在遊戲中,如果在一點上的每種走法都行不通,那麽程序會在這一點(稱為這個樹的葉節點)結束邏輯樹的增長,並且考慮最優的能夠導致成功或者失敗的走法。當所有的遞歸的程序調用結束時,程序就能在一定的遞歸深度下,在一定的時間限製內得到最優的走法。(了解更多的遞歸算法,參見本章注釋177)。
遞推公式在數學方麵往往是相當高效的。不僅僅是遊戲中的移動,這種遞推已經在數學領域解決並證明了定理。在每個點的擴展都是能夠用公理(或以前的定理證明)證明的(這是紐厄爾、肖和西蒙斯的通用問題求解程序使用的方法。)
從這些例子可以看出,遞歸僅僅適用於那些可以清晰定義規律並且目標也很明確的問題。但它在計算機藝術創作領域卻給了我們很多驚喜。例如,我曾經設計過一個使用了遞歸方法的叫做ray kurzweils cybeic poet的程序。<small>178</small>這個程序對於每個詞都建立了一套目標:達到一定音律、詩的結構、詩的畫龍點睛的地方。如果它無法找到一個符合上述目標的詞,它就備份並刪除前一個詞,按照原來的標準重新開始尋找所期望的詞。如此循環往複的尋找。如果所有路徑都導致死角。如果最終所有的尋找都是徒勞的,那麽它會放寬一些限製,重新尋找。
圖 5-3
深弗裏茨的平局:是人類在變得聰明,還是機器在變得愚蠢?
在計算機國際象棋比賽世界裏,我們找到一個在軟件上有好轉的例子,即按照通常的看法,這些是靠計算機硬件的蠻力來統治的。在2002年10月的國際象棋錦標賽上,一流的選手弗拉基米爾·克拉姆尼克與深弗裏茨軟件打成平局。我想指出的是,深弗裏茨很有效,隻用到先前的冠軍——深藍1.3%計算能力。盡管這樣,但是它下棋的水平幾乎沒有下降,這是因為其基於模式識別的優秀的剪枝算法(後麵將會解釋)。在6年之內,一個像深弗裏茨的程序將擁有深藍的能力,每秒分析2億個棋盤位置。運行在個人計算機上的類似深弗裏茨的下棋程序,將在這10年之內,再一次擊敗所有人類。
在我1986年到1989年間曾寫的書《the age of intelligent machines》中,我已經預言,在20世紀90年代末,計算機將擊敗人類國際象棋冠軍。我也曾提到,計算機在國際象棋等級上,每年增長約45個百分點,反觀人類最好的選手,本質上已經定型,所以1998年迎來了交點。的確,在1997年鋪天蓋地宣傳的世界錦標賽上,深藍確實擊敗了蓋裏·卡斯帕羅夫。
但是,在深弗裏茨與克拉姆尼克的比賽上,目前本屆的計算機程序隻能夠打成平局。距深藍的勝利已經過去了5年,那麽我們怎麽解釋這種情況呢?我們應該可以總結出:
1)是人類越來越聰明,還是機器越來越愚蠢?
2)計算機在下棋上變得糟糕?如果這樣,我們可以總結出,在過去的5年裏,眾多宣傳計算機速度方麵的提高並不像人們說的那麽好?還是計算機軟件變得糟糕,至少在下棋上是這樣?
專用硬件的優勢
上麵的兩個結論沒有一個是確定的。目前的結論是軟件正在變好,因為深弗裏茨本質上已經敵得過深藍,而且利用更少的計算資源。為了獲得更多關於這個問題的深刻理解,我們需要測試一些必要條件。當我在20世紀80年代末寫下計算機下棋的預測時,卡內基·梅隆大學開始著手編寫一種程序,用來開發專門的芯片來指揮“極大極小”算法(遊戲博弈標準的理論,依賴於建立博弈序列的樹,然後評估樹的每個分支的終點葉子位置),特別是用來計算棋路。
基於此專用硬件,1988年卡內基·梅隆大學的下棋機器hitech它已能夠每秒分析175000個棋盤位置。它下棋的等級已經達到2359,隻比人類的世界冠軍約低440個點。
一年以後的1989年,卡內基·梅隆大學的深思機器將性能提高到每秒分析1000 000個棋盤位置,等級達到2 <small>400</small>。ibm最後接管該項目,重新改名為深藍,但是仍采用卡內基·梅隆大學的基礎體係結構。1997年,擊敗卡斯帕羅夫的深藍擁有256個並行工作的專用下棋處理器,每秒可分析2億個棋盤位置。
注意專用硬件的使用是很重要的,用它來加速特殊運算,需要為棋子移動生成極大極小算法。眾所周知,專用硬件計算機係統設計器一般執行一個特殊算法可以比通用計算機至少快100倍。專用的asics(專用集成電路)需要很大的開發工作和消耗,如果不是重複基準所需的臨界運算(例如,編碼mp3文件或者為電子遊戲渲染圖形基元),這項花費還是非常值得的。
深藍對抗深弗裏茨
由於總是有大量的焦點聚焦在裏程碑式的事件上,計算機有能力打敗人類對手,所以寄希望於專用象棋電路的支持是有用的。雖然關於深藍對卡斯帕羅夫比賽的參數保持了一定熱度的爭論,但是人們對計算機下棋的興趣自1997年後非常明顯地衰落。畢竟,目標已經達到了,再去白費力氣,意義不大。因此,ibm取消了該項計劃,從此以後再沒有關於專用下棋芯片的工作。人工智能的諸多領域的研究關注點已經不再是重大的結論,而是像導航飛機、導彈、工廠機器人、理解自然語言、診斷心電圖和血液細胞圖像、偵測信用卡欺騙,以及大量其他人工智能狹義上的應用。
盡管如此,計算機硬件仍呈指數增長,自從1997年以來,個人計算機計算速度每年翻一番。因此,深弗裏茨的專用奔騰處理器大約比1997年的處理器快32倍。深弗裏茨僅用8台個人計算機組成的網絡,所以硬件上相當於256台1997水準的個人計算機,每一台都比1997年的個人計算機約快100倍(當然,這是計算下棋的極大極小算法)。所以,深藍比1997年的pc機快上25600倍,比深弗裏茨快100倍。這項分析可以由兩個已經報道的係統速度來確認:深藍可以每秒分析2億個棋盤位置,而深弗裏茨僅約為2500 000個。
重大的軟件收益
由此,我們能對深弗裏茨的軟件說什麽呢?盡管下棋機器通常被看做暴力計算的例子,但是這些係統有一個重要的方麵,就是需要定性的判斷。一係列的移動-反對移動可能帶來的組合爆炸更為可怕。
在《the age of intelligent machines》我曾預計,如果我們沒有成功地對移動-反對移動樹剪枝,或者試圖在一場典型的比賽中走一步完美的妙棋,那樣大約需要400億年來移動一步棋子(假設一場典型比賽約有三十步,每一步有8種可能的選擇,那麽得到830可能的移動序列)。因此,一個實用係統需要不斷地修剪掉沒有希望的作用線。這需要洞察力而且本質上是模式識別判斷。
人類,即使是世界級國際象棋大師,完成極大極小算法也非常緩慢,通常比每秒一個移動-反對移動的分析要慢。所以一個國際象棋大師究竟能否與計算機係統對抗?回答是,我們控製了強大的模式識別,可以使我們利用極好的洞察力來進行剪枝。
準確地說,在這個領域,對深弗裏茨的改進已經超越了深藍,深弗裏茨隻比卡內基·梅隆大學的深思具有一些微小的有效計算能力,但是被認為高出幾乎400點。
人類國際象棋玩家注定失敗?
我在《the age of intelligent machines》裏做的另一個預言是,一旦計算機在國際象棋比賽方麵做的跟人類一樣好甚至更好,那麽我們不是更多地思考計算機智能就是較少地關注人類智能,或者較少提及國際象棋,如果曆史是向導,結局很可能是這樣。的確,它恰恰發生了。在深藍勝利後不久,我們開始聽到很多關於國際象棋隻是簡單的組合計算遊戲的說法,計算機的勝利隻證明它是個好的計算器。
事實上稍微複雜些。人類在國際象棋的良好表現顯然不能歸於我們的計算技術,事實上我們的計算技術還是很糟糕的。我們使用典型人類的判斷形勢來彌補缺點。對於這種定性判斷的形式,深弗裏茨比早先的係統表現出真正的進步。(附帶提及,人類在過去5年並沒有進步,人類最高積分保持在2800以下。從2004年起,卡斯帕羅夫的等級是2795,克拉姆尼克是2 <small>794</small>。)
我們該去向哪裏?既然計算機下棋依賴於普通個人計算機上運行的軟件,下棋程序將繼續從持續增長的計算能力中獲益。到2009年,一個類似深弗裏茨的程序將再次達到深藍的能力,每秒分析2億個棋盤位置。隨著互聯網計算成果帶來的機會,我們將能夠早於2009幾年達到這個可能。(計算機的互聯網成果將需要更多無所不在的交流寬頻帶,但是這已經到來。)
隨著這些必然的增長速度,以及模式識別持續不斷地提高,計算機下棋等級將繼續升高。在這個10年裏,普通個人計算機上運行的類似深弗裏茨的程序不久將再次打敗所有人類。那時,我們將徹底失去對國際象棋的興趣。
組合方法。組合方法是最強大的構建ai係統的方法,它仿真人類大腦的工作方法。正如前麵討論的,人的大腦不是一個巨大的神經網絡,而是包含了數百個區域,每個區域都以不同的方式優化處理所負責的問題。
沒有一個區域能夠單單依靠自身的操作而達到人類的水平,但是所有的區域在整個大腦係統中被精妙地設計,可以準確地完成人類的各項工作。
我曾經在做ai相關的工作時使用過這種方法,尤其是在模式識別方麵。舉例來說,在語音識別中,根據經驗與範例我們可以實現一些不同的識別係統。有的係統是專門按照專家的語言和語音知識建立的;有的是根據規則來分析句子(這就涉及表現句子的單詞使用情況的圖,類似於小學時學的相關表格);有的是基於自組織技術,如馬爾可夫模型,通過在圖書館中存儲的錄音和人們的演講中廣泛地進行訓練。然後,我們做一個“專家管理”軟件,以了解不同的“專家”的強度和弱點,然後通過組合這些結果來進行優化。在這種方式中,一個特殊的技術本身可能會產生不可靠的結果,卻依然能有助於提高係統的整體準確度。
在ai工具箱中,有很多結合不同方法的複雜辦法。例如,可以使用遺傳算法為神經網絡或者馬爾科夫模型優化最優拓撲(節點和連接的組織)。使用遺傳算法的神經網絡的最終輸出可以作為遞歸算法的控製參數。對於模式識別係統,我們還可以借助於強大的信號處理和圖像處理技術。每個不同的應用需要不同的架構。計算機科學教授和人工智能的企業家本·哥特茲在人工智能領域整合不同技術的策略和架構方麵已經發表了很多文章和專著。他提出的novamente架構旨在提供一個通用人工智能框架。<small>179</small>
以上隻是簡單介紹了當前日益成熟的ai係統。對於ai技術的詳盡講解和闡述已經超出了本書的範疇,甚至現在一個計算機科學的博士課程也不能包含現有的技術。
接下來介紹的精密ai係統使用各種方法來對每個特殊的任務進行整合與優化。精密ai係統由於順應了現在的發展趨勢而得到不斷加強:計算可用資源呈指數級增長,現實世界中已經存在成千上萬的智能應用,對於人類大腦機理的深刻認識正在不斷深化。
一個狹義ai的例子
在20世紀80年代末,我寫了我的第一部關於ai的書《the age of intelligent machines》。我花費了很大的力氣做了一些調查,以查找一些在實踐中成功的ai例子。那個時代互聯網還沒有普及,我不得不去圖書館和ai研究中心,足跡遍及美國、歐洲和亞洲。我將所有我認為可以作為合理的例子都收錄在我的書中。我沉浸在數以千計的令人欣喜的例子中。在kurzwei網站上,我們幾乎每天都會報告至少一個夢幻般的係統。<small>180</small>
商務通信公司(businessmunicationspany)2003年預測在2007年<small>181</small>,ai的市場規模達到了210億美元,2002~2007年的平均增長率為12.2%。領先的ai應用的行業包括商業智能、客戶關係、金融、國防和國內安全和教育。下麵介紹一個小型的正在使用的精密ai係統。
軍用智能。美國軍方一直是ai係統的狂熱愛好者。模式識別軟件係統可以引導如巡航導彈飛行數千公裏攻擊特定的建築物。<small>182</small>盡管已經獲得導彈飛躍地形的詳細資料,但是由於存在天氣、地麵覆蓋物和其他因素,因此需要一個靈活的實時圖像處理程序來實施具體的處理。
軍隊已經開發出自組織通信網絡(稱為“網狀網絡”)的原型。當一組節點進入新的位置時,它們能自動配置數以千計的網絡節點。<small>183</small>
專家係統結合貝葉斯網絡和遺傳算法,用以優化複雜的供應鏈,可以協調補給鏈,包括數以百萬計的備用物資、供應品和武器,這些物資的供應都將基於快速變化的戰場需求。
ai係統還可以模擬武器的性能,包括核爆炸以及導彈發射。
美國國家安全局(nsa)基於ai的echelon(埃施朗)係統,在2001年9月11號前,通過分析公共交通監控信號,發出過存在明顯恐怖襲擊的警告。<small>184</small>遺憾的是,echelon的警告沒有得到重視,所以釀成了慘劇。
2002年在阿富汗的軍事行動中見證了“捕食者”的首次亮相(美國無人戰鬥機)。無人機盡管已經發展了許多年,但直到在其上裝載了導彈才證明它是非常成功的。在2003年伊拉克戰爭中,武裝了的“捕食者”(由中央情報局操縱)和其他無人機摧毀了數以千計的敵人坦克和導彈發射點。
所有的軍事服務都正在采用機器人技術。軍隊利用該技術搜索洞穴(在阿富汗)和建築物。海軍使用小型機器人船隻保護航空母艦。正如我將要在第6章討論的,使士兵遠離戰場是一個越來越明顯的趨勢。
太空探索。美國航天局現在正試圖將自我控製加入到無人航天器的軟件中去。因為火星距離地球大約是3光分鍾,木星大約為40光分鍾(取決於行星的確切位置),航天器與地球的控製器之間的通信存在明顯的延時。由於這個原因軟件需要擁有重要的決策能力。為了做到這一點,美國宇航局正在設計軟件,包括該軟件的自身能力模型和一艘飛船,以及完成每個任務可能遇到的挑戰。這種人工智能的係統都能夠通過新的形勢來做決定而不僅僅是在已經設定的規則下進行推理。這種方法使得航天器可以深入太空。1999年一個飛船使用自有的知識設計了一係列的解決方法,避免了導致本次探索失敗的危險<small>185</small>。ai係統的第一個計劃失敗了,但它的第二個計劃完成了使命。“這些係統有一個關於內部元件物理性質的常識性模型”,布萊恩·威廉姆這樣解釋。布萊恩是深入太空智能軟件的首創者,現為美國麻省理工學院太空係統和人工智能實驗室的科學家。他還提到,“飛船可以從這一模型中進行推理,以確定哪些是錯誤的,並且如何采取行動”。
美國航天局使用計算機網絡通過遺傳算法發展三維空間技術的天線設計,使用5顆衛星來研究地球的電磁場。數以百萬計的設計在這次模擬進化中競爭。美國航天局的科學家和項目領導傑森·羅翰提到,“我們使用遺傳算法來設計微觀機器,包括陀螺儀,並用於航天導航。軟件還有可能發現人們永遠不可能想到的解決方案”。<small>186</small>
另一個ai係統可以將行星從分辨率很低的宇宙圖像中辨別出來,其精度超過了這個領域的人類專家。
新的陸地機器人望遠鏡能夠決定在哪裏觀察,並且懂得如何提高找到期望情況的可能性。稱為“自主、半智能觀測站”的係統能夠適應天氣,注意感興趣的項目,並且自主決定如何跟蹤它們。它們能夠檢測到非常微弱的太空現象,比如一個行星僅僅一納秒的閃爍,這可能說明我們的太陽係接收到了來自外宇宙的一個光線。<small>187</small>一個稱為運動目標和瞬態事件查詢係統(motess)的類似係統曾經在其投入使用的前兩年,發現了180顆新的小行星和彗星。“我們有一個智能觀測係統”,英國埃克塞特大學的天文學家阿拉斯代爾艾倫解釋說,“它能夠思考並且能自主做出決定,決定對某些觀測是繼續還是放棄。如果需要更多的觀測,它就將繼續並且得到想要的結果。”
類似的係統還被軍方用來自動分析來自間諜衛星的數據。目前的衛星技術能夠觀測到地麵上約1英寸大小的麵積,而不受惡劣天氣、雲或黑暗的影響。<small>188</small>在海量數據不斷產生的情況下,如果沒有自動圖像識別的方案,就不能從相關的聯係中得到規律。
醫學。如果你拿到一張心電圖(ecg),醫生就有可能通過適用於心電圖記錄的識別模式得到自動診斷。為了進行長期不引人注目地監測(嵌入衣服中的viasensors和無限通信使用手機)心髒病的早期症狀,kurzweil technologies公司正在和united therapeutics合作開發新一代的對心電圖的自動分析。<small>189</small>其他的識別模式係統被用於診斷大量的圖像資料。
每個主要的藥物開發者都在使用人工智能程序進行模式識別,以及挖掘新藥物療法發展領域中的有用數據。例如sri國際公司正在建立一個靈活的知識庫,該知識庫將我們所知道的有關典型疾病的所有事情進行了編碼,包括肺結核和幽門螺旋菌(引起潰瘍的細菌)<small>190</small>。這樣做的目的是應用智能的數據挖掘工具(能夠尋找出數據間新聯係的軟件)找出破壞或中斷這些病原體代謝的新方法。
相似的係統被用於演示其他疾病的新型醫療方法,並自動發現和理解基因的功能,以及它們在疾病中的角色。<small>191</small>例如,阿爾伯特實驗室宣稱,一個新的實驗室裏配有ai機器人、數據分析係統和6個研究者,能完成以前擁有200名科學家的藥物發展實驗室的工作。<small>192</small>
前列腺特殊抗原(psa)水平偏高的男性通常要經曆外科手術,但是這些男性中的75%沒有患前列腺癌。一個以血液中的蛋白質的模式識別為基礎的新測試將會使這個錯誤的陽性比率下降到大約29%。<small>193</small>這個測試是建立在由馬裏蘭州貝塞斯達的correlogic係統設計的ai程序的基礎上,準確性將會得到進一步的改進。
應用於蛋白質的模式識別同時也可以用於檢測卵巢癌。當代最好的卵巢癌檢測是和超音波檢測一起使用的ca-125,它能發現幾乎所有的處於早期階段的腫瘤。“通過長期的診斷發現卵巢癌十分致命,”fda和美國癌症研究所經營的臨床蛋白質組織程序的伊曼紐爾·帕特克因三世說。帕特克因是以ai為基礎的新型測試的領先研究者,該測試可以尋找能在目前的癌症中發現的獨特蛋白質模式。在一項包含數以百計的血樣評估中,根據帕特克因的說法,測試結果表明,“可以100%地發現癌症,即使癌症還在早期階段”。<small>194</small>
在美國幾乎10%的柏氏抹片是由名為focalpoint的自動化ai程序分析進行的,其發明者是tripath imaging公司。研究者們開始用他們的標準去麵試病理學家的職位。ai係統通過觀看病理專家繼續學習。隻有最好的人類診斷家才允許被該程序觀察。“這是專家係統的優點”,tri-path的技術產品經理鮑勃·施密特解釋說,“它隻允許你複製該領域最優秀的人。”
俄亥俄州立大學健康組織已經建立了以囊括多個專業、大量知識並以專家體係為基礎的cpoeputerized physician order-entry)係統。<small>195</small>這個係統能夠自動檢測很多內容,如病人中可能的過敏者、藥物的相互作用、年紀大者、藥物限製、劑量指南和適當性等病人的相關信息,這些信息來自醫院的實驗室和放射科。
自然科學和數學。威爾士大學基於綜合的ai係統發明了“機器人科學家”,該係統能明確地敘述基本理論。這個機器人科學家是一個能自動進行實驗的機器人係統,同時也是一個評價結果的推理機。研究者根據在酵母中的基因表達模式創造了該係統。這個係統“可以自動地產生假說來解釋所觀察的現象,設計實驗來驗證這些假設,用實驗室的機器人來真正地進行實驗,解釋偽造與數據不符的假設所造成的後果,然後重複整個過程”<small>196</small>。該係統能夠通過其自身的經驗來改善其性能。人類科學家設計的實驗比機器人科學家設計的實驗貴3倍。機器的測驗與一群人類科學家的測驗對比表明機器所發現的東西比得上人類所發現的東西。
威爾士大學的生物係主任邁克·楊是從事機器研究的人類科學家之一。他解釋說:“機器人打敗了我,但那僅僅是因為在那一刻我按錯了鍵。”
一個長期存在的關於代數學的猜測最終被阿爾貢美國實驗室的人工智能係統證明。人類數學家稱這個證明是具有創造性的。
商業、經濟和製造業。每個產業的公司都在用人工智能係統控製和完善物流,發現欺詐和洗錢,以及將智能數據挖掘技術應用於他們每天收集到的大量信息。例如,沃爾瑪從顧客的交易中獲得大量的信息。人工智能工具用神經網絡和專家係統對這些數據進行分析,從而為經理提供市場調查報告。這種智能信息挖掘技術能夠使他們為每天每個商場對每種產品的需求清單進行非常準確的預測。<small>197</small>
人工智能程序通常也用於發現金融交易中的欺詐行為。例如,一個叫future rout的英國公司用以牛津大學研究的人工智能為基礎的ihex係統去發現信用卡交易和貸款申請中的欺詐。<small>198</small>這個係統能夠根據經驗不斷地產生和更新自己的標準。在美國北卡羅來納州夏洛特的“第一庭權益聯合銀行”用loan arranger係統(類似於人工智能係統)決定是否批準抵押申請。<small>199</small>
全國證券交易商自動報價係統協會(nasdaq)也在使用一種名為securities observation,news analysis,regtion(sonar)的係統去監督欺詐交易和可能存在的內部交易。<small>200</small>到2003年年末,sonar發現了180多起事件,這其中涉及美國證、證券交易委員會和司法部。這其中的一些案件在事後被作為重要新聞報道。
1972~1997年,麻省理工學院ai實驗室的領導者帕特裏克·溫斯頓建立的ascent technology公司已經設計了一個名為smart-airport operations center(saoc)的係統,該係統也是基於基因算法的。它能夠處理飛機場的複雜後勤,如平衡眾多員工的工作分配,協調部門和設備的工作分配,並管理其他無數的細節。<small>201</small>溫斯頓指出:“找出方法去處理複雜的情況正是基因算法所做的事。”應用saoc的機場的生產率提高了大約30%。
ascent公司的第一份合同就是將它的人工智能技術用來管理1991年在伊拉克的“沙塵暴行動”的後勤。防禦遠景研究規劃局(darpa)聲稱基於ascent係統的人工智能邏輯計劃係統創造的價值將大於政府在過去十幾年中對人工智能的研究的投入。
軟件領域的一個新的發展趨勢是用人工智能係統處理複雜的軟件程序演示,發現故障,並在沒有人類指示的情況下選擇最好的方法自動恢複<small>202</small>。實現該功能的一個主要思想是:隨著軟件係統越來越複雜(像人一樣),它們不可能完美,除去所有的漏洞是不可能的。ai係統和人類采用相同的策略:“我們不期望完美,但我們經常試著從不可避免的錯誤中恢複過來。”“我想讓這個係統用自己的頭腦進行管理”,斯坦福大學的軟件基礎設施集團的領導者阿曼多·福克斯說他正在進行自動計算的研究。福克斯補充道:“這個係統必須自己建立自己,完善自己,修理自己,當出現錯誤的時候它必須知道如何應對這種客觀的威脅。”ibm、微軟和其他的軟件廠商正在開發融合了自治能力的係統。
製造業和機器人技術。計算機集成製造puter-integrated manufacturing,cim)越來越多地使用人工智能技術完善資源的利用,使後勤合理化,並及時通過購買部件和物資減少清單。cim的一個新趨勢是用“基於事件的推理”,而不用硬編碼的基於規則的專家係統。這些推理代碼的知識源於“事例”,而這些事例是解決問題的方法。最初的事例是由工程師設計的,一個成功的事例論證係統的關鍵是它能從實際經驗中不斷獲取新事例的能力。這個係統能夠應用推理在其存儲的眾多事例中找到適用於新情況的解決辦法。
機器人已廣泛地用於製造業。最新一代的機器人使用了靈活的人工智能影像係統(該係統由一些公司建造,如馬薩諸塞州的cognex corporation公司),它能應對各種情況。這降低了機器人正確執行操作時的精確度需求。加州一家自動化公司adept technologies的ceo布萊恩·卡萊爾指出:“即使勞動力的成本很低,智能機器人和其他智能設備之間的交互也是一個重大方麵。除了質量和容量外,硬件工具在使用戶接受產品轉變和演變方麵也是不可比擬的。”
人工智能專家漢斯·莫拉維茨成立了一家名為seegrid的公司,該公司主要提供由其開發的視覺機器以便於完成製造、材料處理和某些軍事任務。<small>203</small>莫拉維茨的軟件可以使一個設備(機器人或者僅僅是一個材料處理車)在非結構化的環境中以步行或滾動方式運行,並且可以通過這種方式建立一個可靠的三維地圖。該機器人可以利用此地圖和它的計算能力來確定執行任務的最佳路徑。
這項技術使得不需要前期繁瑣的預編程,便能使智能機器在生產過程中傳輸生產材料。在軍事方麵,這種智能機器可以完成精確的任務,同時適應快速變化的地理環境和戰場環境。
視覺機器也能夠提高機器與人交流的能力。使用小型、廉價的相機就可以使得機器人識別人的頭部和眼睛,以此實現自然界中的一種重要的交流方式——眼神交流。卡內基·梅隆大學和麻省理工學院的頭部和臉部跟蹤係統已經發展得比較完善,並且一些像seeing machines of australia這樣的小公司也已經開始提供這方麵的服務。
視覺係統強大的另一個有力證明是:一輛由人工智能係統駕駛的無人車輛在沒有人幹預的情況下幾乎從華盛頓特區開到了聖地亞哥。<small>204</small>美國pittsburgh大學計算機科學教授、美國人工智能協會會長布魯斯·布壩南說在10年前這是無法想象的事情。
帕洛阿爾托研究中心(palo alto research center,parc)正在開發一個機器人,該機器人可以在諸如沙漠等複雜環境中進行導航,並且發現一些可能重要的目標,例如找到一個受傷的人。2004年9月在對聖何塞舉辦的一個人工智能會議上,他們在模擬環境中展示了一些自我組織用於現實受災地區的機器人。<small>205</small>這些機器人可以在崎嶇的地形上移動,可以相互交流,組織處理圖像,並且通過體溫來尋找人類。
演講和語言。自然語言處理是人工智能方麵最具挑戰性的一項任務。不需要技巧,不需要完全掌握人類的智慧,電腦係統就可以實現基於文字的令人信服地與人交流。圖靈所設計的圖靈測試也完全是基於書麵語言的。
雖然達不到人類的水平,但是自然語言處理係統也在穩步前進。搜索引擎已經變得如此流行,以至於"google"已經從一個專有名詞轉變成了一個公用的動詞,它的技術已經革命性地改變了研究和獲取知識的方式。google和其他搜索引擎都使用基於人工智能的統計學方法和邏輯判斷來決定鏈接的排名。這些搜索引擎的缺點在於它們無法理解被搜索詞語的意思。雖然有經驗的用戶會設計一個關鍵詞的序列尋找最相關的站點(例如:搜索“電腦芯片”可能會比搜索“芯片”更有效率),但是我們最希望的是用自然語言進行搜索。微軟已經開發出了一套自然語言搜索引擎ask msr(ask micro-soft research),這個搜索引擎可以回答自然語言的問題,如:“米奇·曼陀什麽時候出生?”<small>206</small>在係統將這句話按照詞類(動詞、名詞等)進行解析之後,一個特殊的搜索引擎將會基於這些詞找到匹配項。係統將會找到匹配的文檔以回答這個問題並進行排序。正確的答案被排在前三位的概率至少有75%,而且通常不正確的答案將會非常明顯(例如:米奇·曼陀出生在3)。研究人員希望可以包含一些知識,這樣就可以降低錯誤答案出現的概率。
曾領導ask msr項目的微軟研究員埃裏克·布裏爾,嚐試完成一個更艱難的工作:建立一個可以用大約50個詞的句子回答一些更複雜問題,例如:“如何才能獲得諾貝爾獎?”這個係統所用的其中一個策略就是在網絡上找一個適當的faq段來回答這些問題。
自然語言係統包括大量的詞匯,電話中非特定語者語音識別已經進入市場並可以用於處理日常的事務。你可以詢問大英航空公司虛擬旅行代理人任何已經錄入的大英航空公司的航班。<small>207</small>假如你需要verizon公司的客服或者需要查爾斯·施瓦布和美琳·林奇幫你做財務匯報,你也可以通過與一個虛擬人類對話來獲得。盡管這些係統會令有些人厭煩,但是這些係統對於人們的日常口語確實可以做出比較快和比較適當的反應。微軟和其他一些公司正在提供一些係統,這些係統可以通過交互、合理而自然的對話來預定諸如旅店、旅行並處理常規的交易。
雖然並不是所有的人都對這些虛擬代理人的工作能力感到滿意,但是大多數係統都提供獲得真人在線幫助的功能。使用這些係統的公司報告說他們已經將需要使用人力的服務減少為原來的80%。除了可以省錢以外,接線員的減少也帶來了一些管理上的利益。因為很多人對工作不滿意,所以接線員的需求量非常大。
據說大多數男人都不願問路,但是汽車廠商證明不管是男人還是女人都願意向自己的汽車問路。2005年,acura rl和honda odyssey將會通過ibm提供的一套係統允許駕駛員和他們的汽車進行對話。<small>208</small>汽車導航將會包含街道的名字(例如,在main street左拐,然後在second avenue右拐)。駕駛員可以提出諸如“最近的意大利餐館在哪”的問題,或者可以進入特定的位置清楚地問路,然後給出汽車指令(例如,“打開空調”)。acura rl還將在它的屏幕上實時顯示交通擁擠程度。
語言識別係統號稱是獨立於說話者的,不受引擎聲音、風聲和其他噪音影響。據報道,這個係統能夠識別170萬個街道和城市的名稱,並且可以執行大約1000條指令。
計算機語言翻譯正在穩步發展。因為這是一個圖靈級的問題,即需要完全達到人理解語言的級別才能像人一樣熟練地完成任務。這將是最新的能夠與人類行為相媲美的應用領域。美國加利福尼亞南部的一個計算機專家弗朗茨·約瑟夫·奧克已經開發了一種用大約幾小時或幾天時間就能在任何語言之間進行翻譯的係統。<small>209</small>他所需要的僅僅是"rosetta stone"——一種語言的文本,以及該文本對應的另一種語言的翻譯文本——盡管他需要這種翻譯文本數百萬的文字。通過自組織技術,這個係統可以為兩種語言間的互譯建立統計模型。
而其他的翻譯係統需要語言學家費盡心機地建立語法規則,對於每個規則還需要處理大量的異常情況。最近在美國商務部國家標準與技術研究所舉辦的翻譯係統競賽中,och的係統獲得了很高的評分。
娛樂和體育。遺傳算法有一個很有趣又吸引人的應用,牛津大學的一個科學家托馬斯·瑞爾利用仿真的關節、肌肉和一個大腦神經網絡創造了一個活生生的生物。然後他給這些生物下達指令:行走。他用了一個具有700個參數的遺傳算法來實現這種能力。瑞爾說:“假如你用人眼觀察這個係統,你永遠也不能完成它,因為這個係統太複雜了,這就是進化所能達到的效果。”<small>210</small>
在這些“生物”平穩、令人信服地行走的同時,這項研究展示了遺傳算法的一個著名屬性:你將得到你所想要的。一些“生物”想出新穎的方法來代替行走。瑞爾提出:“我們有一些‘生物’根本不能行走,但是可以采用一些奇特的方法來向前行進:爬行或者翻跟鬥。”
軟件已經發展到可以從一些體育視頻中自動提取更重要的視頻。<small>211</small>都柏林的三一學院的一個團隊正在開發一種類似於台球的桌麵撞球遊戲,在這種遊戲中軟件可以追蹤每個球的位置並且可以識別一些重要的射門。佛羅倫薩大學的一個團隊以足球作為研究對象,這個軟件追蹤每個隊員,並且可以判斷一種球的運動類型(例如任意球、射門等)、進球的時間、被處罰的時間和其他一些關鍵因素。
倫敦的大學學院的數字生物興趣研究團隊正在利用一些遺傳算法設計一級方程式賽車。<small>212</small>
人工智能的冬季早已過去。我們已經進入了狹義人工智能的春天。前麵介紹的這些例子都是10~50年前的研究項目。假如所有的人工智能係統突然都停止工作,那麽我們的經濟基礎設施將會陷於停頓,銀行將會停止交易,大多數的交通會受到重創,通信將終止,而在10年前則不會有如此大的影響。當然,就目前來說,我們的人工智能係統還不具備籌劃類似陰謀的能力。
強人工智能
假如你隻用一種方式去理解某件事,那麽你並不能真正地理解這件事。這是因為假如有一個步驟發生錯誤,你將會被自己的思維所束縛。一件事對於我們的意義取決於如何把這件事同其他的事關聯起來。這就是為什麽我們說死記硬背不能理解其真正含義。然而,如果你有幾種不同的思路,那麽當其中一種失敗時,你就可以用另一種思維去嚐試。當然,如果將過多的不相關的事務連接起來,將會使自己陷入困惑。但是良好的連接可以使你多方位的轉變思路,直到找到一個合適你自己的。這就是我們所說的思考!
——馬文·明斯基<small>213</small>
提高計算機的性能就像水流蔓延的情景。大概半個世紀前,它開始灌溉低地,推進了人工計算器的發展,並改進了一些記錄員的工作,但沒有惠及大多數領域。現在,洪水已達到山麓,就連我們的哨所都在考慮撤退。在山峰上我們才能感到安全,但以目前的速度,高峰也將在另半個世紀被淹沒。由於那一天的臨近,我建議建一個方舟,並開始適應航海生活!但是現在,我們必須依靠我們在低地的代理人來告訴我們洪水的真正情況。
我們在山麓的代理人和理論向我們報告了智能的跡象。在數十年前我們為什麽沒有從低地獲得如下的報告:電腦在計算和記憶力方麵都強於人類?事實上在那個時代我們已經獲得了同樣的報告。當時計算機的計算效率能像成千上萬的數學家加在一起一樣,人們稱其為“巨人的大腦”。這鼓舞了第一代人工智能的研究。畢竟機器在從事某些事情的時候超越了任何動物,因為機器包含了人類的智慧、專注和數年的訓練。但是現在我們很難再體會到那種魔力。
其中的一個原因是計算機在其他領域愚蠢的表現造成了我們判斷上的偏見。另一個原因就是我們自己的問題。我們確實費勁心力地計算和記錄數據,使得一個複雜計算的每一個很小的機械步驟都很明顯,然而這樣龐大的描述往往超出了我們的能力範圍。像製造的深藍,從內部我們可以看到非常多的處理,而從外圍我們可以欣賞它設計的精妙。但通過天氣模擬的繁瑣計算來預測出風暴和龍卷風,或者通過電影動畫中的計算來表現栩栩如生的皮膚。這些不是顯而易見的。我們很少稱這些是智能。但相比人工智能,“人工現實”可能是更加深刻的概念。
潛藏在優秀人類棋手中的精神步驟和理論證明是複雜而又不可見的。無法進行機械式地解釋。那些可以自然地理解這些過程的人使用策略、理解力和創造力來描述它,而不是使用精神語言。當機器能夠以同樣豐富的方式兼備意義和驚喜,那麽我們就智能地用精神語言進行解釋。當然,在這個場景的背後,程序員能夠從原理上給出機械解釋。但即便對於程序員來說,當運行程序向內存中填入需要理解的大量細節時,這種機械解釋將是無效的。
就像上漲的洪水達到更多的居民居住地的高度,機器在眾多領域的能力也會提高很多。機器的思考中存在的本能意識將逐漸普及。當最高的山峰被淹沒,在各個領域,機器將具有與人類一樣的智能。機器中思想的出現將是不容懷疑了。
——漢斯·莫拉維茨<small>214</small>
因為信息技術的指數級發展,其性能將由乏善可陳發展到令人驚歎。如前麵幾章所述,在很多不同的領域,狹義人工智能的表現已經讓人印象深刻。機器使用人工智能可以完成的智能任務的範圍正在不斷地擴大。在我為《the age of spiritual machines》一書設計的一張圖片中(見圖5-4),一個充滿戒備的人類正在寫出隻有人類能做的事件標誌(機器不能做到)。<small>215</small>地板上的是人類已經拋棄的標誌,因為機器已經能夠實現這些功能:心電圖診斷、創作巴赫風格的曲子、識別人臉、引導火箭、打乒乓球、和國際象棋大師下棋、挑選股票、即興爵士樂創作、證明重要定理和理解連續演講。早在1999年,這些就不是隻有人類智能領域能夠完成的任務了,機器也可以完成所有的這些。
圖5-4中那個人後麵的牆象征著隻有人類才能完成的任務,如具有常識、複述電影、舉行記者招待會、翻譯演講、打掃房間和駕駛車輛。如果經過一些年後,我們重新設計這張圖片,這些標誌中的一些可能將落在地板上,當cyc達到上千萬的常識知識時,人類可能在常識推理領域上的優勢就不那麽明顯了。
圖 5-4
家用機器人的時代已經開始了,雖然現在尚處於原始階段,從現在開始的後10年,我們可能會考慮使用具有清理房間能力的計算機。對於駕駛車輛,沒有人工幹預的機器人已經在不同的交通道路上駕駛車輛,而且幾乎可以穿越美國。我們不會讓機器人掌控開車,但創建汽車能自己開的電子化高速公路是一個重要提議。
複述一部電影、舉行記者招待會和翻譯演講,這3個任務是非常難的,隻有達到人類對自然語言的理解才能辦到。一旦我們取下那些標誌,那麽我們將會擁有新一代機器,那時強人工智能紀元將會到來。
這個紀元將會悄悄來到我們身邊。隻要在人類和機器行為之間存在差異,比如在一些領域隻有人類才能做到而機器不能,那麽強人工智能的懷疑者就會抓住這些差異不放。但我們的每一個技能和知識領域的經驗都可能緊隨卡斯帕羅夫。我們對機器行為的認識將會很快從毫無希望變成令人畏懼,如同指數函數的底數超出人類預計的範圍一樣。
強人工智能是如何到來的?本書中的大部分材料都已經設計出對硬件和軟件的基本需求,並且解釋了為什麽我們確信在非生物係統中這些需求將會達到。計算性能的持續性指數級增長會使得硬件具有模擬人工智能的能力。這個觀點在1999年依然存在爭議。在過去5年中三維計算的發展取得了很大的進展。現在很少有資深評論員質疑它的發生。即便隻使用半導體工業發布的itrs路線圖的預測,在2018年,隻需要合理的花費就可以製造達到人類水平的硬件。<small>216</small>
為什麽我們能這麽自信地認為到20世紀20年代的後期能夠實現人類大腦各部分的詳細模型和模擬。在第4章就開始說明這種情況。直到最近,分析大腦內容的工具還不具有空間和時間解決方案,或者構造足夠的數據去創造充分詳細模型的實現成本太高。這些問題正在逐漸改善。在實時運行環境下,新出現的一代掃描和感知工具能夠精準地分析和檢測神經元和神經部件。
將來的工具應該具有更強的解決問題的能力。到了21世紀20年代,我們能夠將掃描和感知納米機器人送入人腦的毛細血管中,讓它們從裏麵檢查。我們已經具有了將不同來源(大腦掃描與感知)的數據轉化為模型和計算機模擬的能力,而且可以與生物人在這些區域的性能相媲美。我們已經具有強大的模型,並且可以模擬大腦的一些重要區域的功能。就如在第4章討論的,21世紀20年代後期人們將對所有大腦區域建立詳細和現實的模型。
對強人工智能的推測是這樣的:我們將在對所有大腦區域的逆向工程中學習到人類智能的實現原理。並且我們將應用這些理論到具有大腦智力能力的計算平台。這個將會在21世紀20年代實現。我們已經具有有效的工具來實現狹義人工智能。由於各種方法的持續改進,新算法的發現和各種方法向這個錯綜複雜體係融合的趨勢,狹義人工智能將逐漸變得不是那麽狹隘。這就是說人工智能的應用將有更廣闊的領域。並且它們的表現會更加靈活。人工智能的發展將為解決不同的問題提供不同的方法。就像人一樣。更重要的是,人腦逆向工程的加速發展將創造新的洞察力和範式,這將極大地豐富不斷發展基礎的工具集。這個過程正在很好地進行中。
經常會聽到由於人腦與計算機的工作機理有很大的不同,所以不能夠將關於腦功能的分析應用於可行的非生物係統。這個觀點完全忽略了自組織係統領域。我們有一組逐漸改善的精密數學工具應用於該領域。正如我在之前的內容中所討論的,人腦與當代普通的計算機相比,在很多重要方麵都是不一樣的。如果打開你的掌上電腦,切斷裏麵的一根線,就會很輕鬆地破壞一台機器。我們經常失去很多神經元和神經元間的連接,但卻沒有產生負麵影響。這是因為人腦具有自組織能力,並且依賴於分布式模式,所以很多特別的細節並不是很重要。
當我們到達21世紀20年代中晚期的時候,我們將能夠製造出非常詳細的人腦區域模型。最終這個工具將會逐漸豐富那些新的模型和模擬器並且能夠包含人腦如何工作的完整知識。我們可以應用這個工具到智能任務中,並且將在整個範疇利用這個工具,一些工具來源於人腦的逆向工程,一些工具源於我們對人腦理解的靈感,還有一些工具不是基於人腦而是基於人工智能。
人腦策略的一部分是學習信息,而不是源於硬編碼的知識(我們用“本能”這個詞來特指內在的知識)。學習依然是人工智能的一個重要部分。在我的經驗裏,在發展模式識別係統如字符識別、語音識別和經濟分析、培養ai的學習能力是最具挑戰性的,同時也是工程的重要組成部分。在線的人類文明的知識積累將會越來越多,將來的人工智能將有機會通過學習大量的信息實體來獲得教育。
對人工智能體的教育將比沒有經過強化訓練的人類快得多。一個生物人類需要25年的時間來完成基礎教育,而人工智能體則可以壓縮到數周或者更短的時間。並且,因為非生物智能具有分享學習和知識的模式,所以隻需有一個人工智能體掌握特殊技能。就如我所指出的,我們可以訓練實驗室的一組計算機來理解對話,隻要通過加載已經訓練完成的模式到他們的電腦,那麽成百上千的用戶都可以獲得我們的語音識別軟件。
非生物智能的一項技能是通過對人腦的逆向工程實現掌握人類的語言和分享人類的知識,從而通過圖靈測試。這個圖靈測試是非常重要的,不僅是因為它重要的實際意義,更是因為它是一個決定性的閾值。正如我們之前指出的,通過圖靈測試具有非常重要的意義,這不同於模擬人類智能的適應性、巧妙性和柔軟性。在我們的技術中已經具備了這種能力,該能力通過功能的集中、聚焦而放大。
——盧卡斯,牛津大學哲學家,寫於1961年的文章
"minds,machines,and g?del"<small>157</small>
假定超級智能有朝一日在技術上是可行的,人們是否會選擇去開發它?這個問題的答案毫無疑問是肯定的。與超級智能緊密聯係的是巨大的經濟回報,隻要是有競爭壓力和利潤產出,計算機產業在新一代的硬件和軟件上的巨額投資將會持續下去。人們需要更好的計算機和更智能的軟件,他們希望機器生產的利益能夠幫助生產;希望機器可以產生更好的醫療藥品;機器可以減輕人類的負擔,可以執行無聊或危險的職業;娛樂——產生永恒的消費利潤。在這個過程中的任何一個位置,恐懼新技術的人都會振振有詞地說:“到此處為止,不要再更進步。”
——尼克·波斯特拉姆,"how long before superintelligence?"1997
超級智能可以解決或者至少可以幫助我們解決任何問題。疾病、貧困、環境破壞,以及各種不必要的痛苦:這些痛苦都是可以通過配備先進納米技術的超級智能消除的。此外,通過納米醫學,我們不僅可以停止和扭轉衰老過程,還能夠選擇上載我們的智能。超級智能還可以為我們創造機會,極大地提高智力和情感的能力,還可以協助我們創造一個充滿吸引力的體驗世界,在這個世界中,我們可以快樂地娛樂,快樂地與他人相處,快樂地體驗、成長,這便是近乎完美的生活。
——尼克·波斯特拉姆,"ethical issues in advanced artificial intelligence,"2003
機器人將繼承地球?是的,但是它們將是我們的孩子。
——馬文·明斯基,1995
在這三個(遺傳學、納米技術和機器人技術)主要的、根本性的奇點革命中,最深刻的是機器人技術,它所涉及的非生物智能的創造超過了非增強性的人類。較高的智能處理定然會超過低智能處理,它將令智能真正成為更加強大的力量。
在gnr中,r代表機器人技術,這裏涉及的真正問題是強人工智能(人工智能超越了人類智能)。在這一構想下,強調機器人技術的原因在於:智能需要一個具體化的物質存在的形式來影響世界。我不讚成強調物質存在,但我相信關注的中心問題是智能。智能必然會以一種方法來影響世界,包括建立承載自己的實體方式和實際操作。此外,我們還可以將身體技能歸為智能的基本組成部分。例如人類大腦的一大部分(小腦包含了超過一半的神經元)就用來協調我們的技能和肌肉運動。
有幾個原因可以解釋為什麽人類級別的人工智能一定會大大地超越人類智能。正如我剛才指出的,機器可以很輕易地分享其知識。作為非增強型的人類,我們沒有分享大量的神經元連接和神經傳遞素濃度的大量模式,後者構成了我們的學習、知識和技能,而非緩慢的、基於語言的交流。當然,這種交流方式是非常有益的,因為它使我們與其他動物相分離,並且是科技創造的促進因素。
人的技能隻能在變革性的激勵下發展。這些技能主要建立在大規模並行的模式識別基礎上,提供熟知諸如區分新麵孔、確定對象和辨識語言發音這些任務的能力。但它們並不適於很多其他的需求,比如確定財務數據的模式。一旦我們充分掌握了模式識別的範式,機器方法就可以將這些技術應用到任何模式類型。<small>158</small>
機器能夠以人類所沒有的方式綜合利用其資源。雖然與個體相比,人類集體可以實現物質的和精神的偉大事業,但是機器可以輕鬆而又迅速地集中其計算、存儲和通信資源。如前所述,互聯網正在演變為一個全球性的計算資源網格,這些資源可以即刻匯集起來,形成大規模的超級計算機。
機器有精確的回憶力。當代計算機可以精確地管理數十億的資源,而且這種能力每年還在翻番。<small>159</small>計算機根本的速度和性價比每年都在提高,而且增速率本身也在加快。
隨著人類知識遷移到網絡,機器將能夠閱讀、理解並合成所有人類的機器信息。而上一次生物人掌握所有的人類科學知識還要追溯到數百年前。
機器智能的另一個優點是,它可以無休止地高速執行任務,並可以整合最尖端的技術。芸芸眾生中的一人可能已經掌握了音樂創作,而另一個可能掌握晶體管的設計,但是以固定的人腦結構來說,我們沒有能力(或時間)來開發和利用這種日益專業化的領域的最高級別水平的技術。在一些特定的技能上,人們彼此也有很大的區別,以致當我們談論作曲人的水平時,我們到底是指貝多芬,還是指一般人?非生物智能將達到並超過每個領域的高精尖人才的技能。
基於這些原因,計算機一旦達到人類智能的範圍和精妙程度,那麽它一定會超越過去並繼續以指數級速度上升。
一個關鍵的奇點問題就在於是先有“雞”(強人工智能)還是先有“蛋”(納米技術)。換言之,是強人工智能將導致完整的納米技術(分子製造裝配,可以轉化為物質產品的信息),還是完整的納米技術會導致強人工智能?正如前麵內容中提到的原因,第一個前提邏輯是強人工智能將意味著超強的人工智能,而超強人工智能將有能力通過實施完整納米技術的方法來解決餘下的設計問題。
第二個前提是基於實現強人工智能的硬件要求應與基於納米技術為基礎的計算相符合。同樣,軟件需求將促使納米機器人對人類大腦機能進行非常詳細地掃描,從而完全實現逆向工程人腦。
這兩個方麵都是合乎邏輯的,很顯然兩種技術是相輔相成的,現實情況是,這兩個領域的進展一定會利用我們最先進的工具,這樣在一個領域的進步便將同時促進另一領域的發展。盡管如此,我確實希望出現優於強人工智能的完整分子納米技術,這個過程隻需要幾年的時間(2025年左右為納米技術,2029年左右為強人工智能)。
隨著納米技術革命的到來,強人工智能將有更深遠的影響。納米技術是強大的,但不一定是智能的。我們至少可以設計出管理納米技術的強大權力的方式,但超級智能卻是天生無法控製。
逃逸的人工智能。一旦強人工智能實現,它可以很輕易地獲得提高,其能力也會增倍,因為這是機器能力的根本特質。隨著強人工智能的到來,很快便會產生許多強人工智能,後者又開始自身的設計、理解和改進自身,從而很快演變成更多的能力,以及更加智能化的人工智能,這個充分過程會無限循環下去。每個周期不僅會創建一個更智能化的人工智能,而且比上一次循環花費更少的周期,這是科技發展(或任何進化過程)的本質。前提是一旦實現強人工智能,它會立即成為迅速增長的超級智能,從而失去控製。<small>160</small>
我個人的看法略有不同,失控的人工智能在邏輯上是有效的,我們需要考慮時機問題。一台機器達到了人類智力的水平並不會馬上產生一個失控的現象。這需要考慮到人類的智力水平是有限的。我們現在就有這樣的例子——約有60億個例子。考慮這樣一個場景,你從一個購物中心帶來由100人組成的一個小組。這個小組由理智的、受過良好教育的人構成。然而,如果這個小組被授予改善人類智慧的任務,進展就不會很大,即使他們也擁有人類智慧的模板。製造一個簡單的計算機對他們來說可能也很辛苦。加速他們的思考能力和擴張這100個人的記憶容量也不會立即解決這個問題。
前麵的內容已經指出,機器將會匹配(並迅速超越)各個領域頂級的人類技能。因此,我們換成100名科學家和工程師。這是一組在技術上具有良好教育背景的人,他們將有能力改善設計。如果一台機器的能力等效於100(最終1000或100萬)個受過技術培訓的人的能力,每項操作的速度遠遠快於自然人,那麽一個迅速加快的智能將最終實現。
然而,當計算機通過了圖靈測試,這種加速並不會立即發生,圖靈測試相當於平均水平的匹配能力,受過教育的人比從商場裏麵找的人更接近於我們的範例。對計算機來說,管理所有這些必要的技能,並把這些技能與必備的知識基礎相匹配是需要時間的。
一旦我們成功地建立了一台機器,並且其能通過圖靈測試(大約在2029年),隨後將是一個統一的時代,在這個時代裏,非生物智能將迅速增長。奇點預期的非凡擴展,人類的智慧數十億計的翻番,這些將會在21世紀40年代中期發生(就像在第3章討論的一樣)。
人工智能的冬季
有愚蠢的謠言說人工智能已經失敗,但人工智能在你周圍是無處無時無刻存在的。人們恰恰沒有發覺,在汽車係統裏調整燃油噴射係統的參數就是人工智能。當你下飛機的時候,人工智能調度係統會為你開門。當你用一個微軟軟件的時候,都有人工智能係統試圖解決你所做的事情,比如寫信,它做得相當好。當你看一個由計算機製作角色的電影時,作為一個群體的行為,它們都沒有人工智能。當你玩視頻遊戲時,你的對手就是人工智能係統。
——羅德尼·布魯克斯,麻省理工學院人工智能實驗室主任<small>161</small>
我仍然能碰到有人聲稱人工智能在20世紀80年代已經枯竭,但這種論點相當於堅持認為互聯網將在21世紀初滅亡<small>162</small>。互聯網技術表現在帶寬和價格方麵:節點(服務器)數量,以及電子商務的交易量在度過了低穀和蕭條時期後,進入了平穩加速的繁榮期。人工智能也曾經是這樣。
範式遷移(從鐵路、人工智能、網絡、電信到現在可能是納米技術)中的技術成熟曲線通常開始於不切實際的期望(由於對促進因素缺乏了解而造成的)的時期。雖然這一新的模式利用率成倍增加,但是早期增長緩慢,直到達到指數增長曲線拐點。革命性變革的普遍預期是準確的,它們卻是不同步的。當前景並非一帆風順時,就進入了幻覺期。不過指數增長繼續有增無減,多年後一個更加成熟、更切合實際的轉變一定會發生。
我們看到19世紀鐵路的迅速發展,隨後便是普遍的破產(在我收集的曆史文件中,發現了有一些早期沒有兌付的鐵路債券)。我們仍然受到幾年前電子商務與電信業蕭條的影響,這也導致了燃油經濟的衰退,從那時起,我們正走向複蘇。
人工智能經曆了一個相似的過早並過於樂觀的時期,緊隨其後的就是1957年由艾倫·紐厄爾,j·c·肖和赫伯特·西蒙創造的通用問題求解程序,這個程序找到了曾經難倒像羅素等數學家的定理的證明,早期的程序都來源於麻省理工學院人工智能實驗室,這些程序可以解決大學生級別的學術能力測試問題(比如相似性和經曆問題)。<small>163</small>人工智能暴露問題出現在20世紀70年代,20世紀80年代是人工智能的蕭條期,那時的人工智能無法轉化為利潤,那個年代也稱為“人工智能的冬季”。許多觀察家仍然認為人工智能冬季是這個故事的結束,並且人工智能領域也無法創造任何東西。
然而,今天成千上萬人工智能的應用都已經深深植根於每一個工業基礎設施中。這些應用大部分是10~15年前的研究項目。那些提問“人工智能到底會帶來什麽?”的人使我想起了在雨林中的旅客的疑問:“應該住在這裏的許多物種去了哪裏?”當數百種動植物在一個區域蓬勃繁衍時,它們已經與當地的生態緊密結合在一起了。
我們都順利地進入了“狹義人工智能”時代,這個概念指的是人工智能正在扮演一個有用而又特定的功能,一旦需要人類智力發揮,人工智能就可以發揮到人的水平或者做得更好。通常狹義的人工智能係統大大超過了人類的智力速度,能夠提供管理和考慮成千上萬個人同時進行工作。我接下來要描述關於狹義人工智能的例子。
這些時間框架相對於快速發展的互聯網和電信的階段周期(以年來衡量,而不是幾十年)來說,人工智能的技術周期(數十年的熱情成長,十年的幻滅,十五年在利用上的紮實推進)看上去有些漫長,但有兩個因素必須考慮:首先,由於互聯網和電信周期相對較近,它們更受範式轉型加速的影響(正如在第1章中討論的一樣),因此,最近通過的周期要大大快於40年前開始的周期;其次,人工智能革命將是人類文明要經曆的最為深刻的變革,所以它要比那些成熟而又不太複雜的技術經曆更長的時間。
理解了現象的技術本質,設計係統集中於該現象,並將它不斷放大。例如,科學家發現了曲麵的一個微妙的性質(稱為波努利原理):氣體(例如空氣)在曲麵上要比在平麵上運行快得多。因此,空氣壓力在曲麵上要比在平麵上的低。通過了解、聚焦、放大這些奇妙發現的啟示,我們在工程中創建了當前所有的飛行技術。一旦我們理解了智能的原理,我們也有相同的機會聚焦、集中並放大其能力。
我們回顧第4章,可以發現理解、建模和模擬人類大腦的每個方麵都在加速:包括大腦掃描的性價比和時間與空間分辨率;大腦機能的可用數據與知識的總量;大腦不同區域的模型與模擬的混合度。
我們已經有了一套從人工智能的研究中獲取的強有力的工具,這個研究也經過了幾十年發展的精煉與完善。大腦逆向工程通過全新包裝、生物啟示和自我組織等技術可以極大地提高這個工具包。我們最終將能夠運用工程能力來集中和放大人工智能,其智能化程度將是以百萬億倍超越現在人類的神經元連接。智能將從屬於加速回歸定律,該定律說明了現在每年信息技術的能力都在加倍。
人工智能(在這個領域我已經親身經曆了40年)的一個根本性問題是:一旦需要ai技術發揮作用,便會涉及各個領域(例如,字符識別、語音識別、機器視覺、機器人技術、數據挖掘、醫療信息和自動化的投資)。
計算機科學家伊萊恩·理查德將人工智能定義為“研究如何使計算機在什麽地方什麽時刻使人生活得更好”。羅德尼·布魯克斯是麻省理工學院人工智能實驗室主任,用另外一種方式定義人工智能:“每當我們領會了一種技術,它就會神奇地終止,我們會說,哦,這隻是個計算。”我還想起了沃森對福爾摩斯的評論:“起初我以為你做了一些聰明的事情,但事實上那根本算不了什麽。”<small>164</small>這是我們作為人工智能科學家一貫的經驗。智能魅力看上去減少到“無”時,我們就可以完全理解它的方法了。剩餘的就是謎,是有待於激起興趣的部分,是還沒到智能方法理解的部分。
人工智能工具包
人工智能就是在多項式時間內,通過探索問題域知識來解決非常困難問題的技術研究。
——伊萊恩·理查德
正如我在第4章所提到的,這僅僅是我們最近能夠獲得的關於人類大腦區域功能如何影響人工智能設計的詳細模型。在此之前,在缺乏足以了解大腦的工具的情況下,人工智能科學家和工程師開發了自己的技術。正如航空科學家沒有模擬鳥兒的飛行能力,早期的人工智能並不熟悉基於反向設計自然智能的方法。
接下來介紹這些方法中的一個小樣例。自采用以來,它們就在爭議中成長,這使得實用產品的創造可以避免早期係統的脆弱性和高錯率。
專家係統。20世紀70年代,人工智能經常等同於一種特定的方式:專家係統。這涉及應用具體邏輯規則的發展來模擬人類專家的決策過程。該過程的一個重要組成部分需要知識工程師與領域專家合作,比如醫生與工程師合作編撰其決策規則。
這個領域在早期取得了一些成績,比如醫療診斷係統,至少對於某些測試來說,可以與內科醫生相媲美的。例如,20世紀70年代開發的一個稱為mycin的係統,就是用來為傳染病診斷和提供治療的。1979年,一個專家評估組比較了由mycin和人類醫師提供的診斷與治療,發現mycin和醫生做的一樣好,甚至比任何醫生做的還要好。<small>165</small>
很顯然,這項人類決策研究往往不是基於明確的邏輯規則,而是基於“更軟”的證據類型。醫學成像檢查出來的黑斑有可能是癌症,但是其他因素諸如它的確切形狀、位置、與周圍的對比差別,這些可能會影響診斷。人類決策的預感通常受很多先前經曆的多種證據綜合的影響,而並不是局限於自身。我們甚至常常不自覺地意識到我們使用的許多規則。
到20世紀80年代後期,專家係統正在結合一些不確定性的概念,並且綜合許多隨機性的根據進行決策。mycin係統開創了這種做法。一個典型的mycin“規則”內容如下:
如果需要治療的疾病是腦膜炎,並且是真菌感染類型,那麽在染色體上無法看到微生物,病人的身體並不脆弱,病人一直呆在一個地方,卻水土不服造成球孢子菌病,病人的種族是黑人、亞裔或印第安人,腦脊液測試中的隱球菌抗原不呈陽性,那麽就有50%的可能性,隱球菌不是其中引起感染的生物體。
盡管像這樣單一的概率性規則不足以得到一個有效的結論,但是通過匯集數以千計的這樣的規則證明可以獲得一個可靠的結論。
cyc可能是持續時間最長的專家係統項目,由道格·萊納特和他的同事在cycorp公司創建。從1984年開始實施,“賽克”係統已經往數據庫裏裝載了許多具有常識性的知識,它能對從未直接學過的東西進行推演。這個項目涉及從困難編碼邏輯規則到概率性規則,現在又包括從書麵材料裏麵提取知識的手段(在人類監督的前提下)。最初的目標是產生一百萬條規則,這反映了隻是人類了解世界的一小部分。萊納特最新的目標是讓cyc掌握“上億的規則,截止到2007年,這是一個人能夠了解世界規則的大約數目”。 <small>166</small>
另一個雄心勃勃的專家係統正在由日本築波大學生物科學副教授達裏爾梅瑟進行著。他計劃開發一個包含所有人類思想的係統。<small>167</small>該應用程序可以用來通知決策者在哪個社區使用哪些思想。
貝葉斯網。在過去的10年裏一種稱作貝葉斯邏輯的技術建立了強大的數學基礎,該技術可以組合上千甚至上百萬的所謂“信息網絡”或貝葉斯網絡的概率規則。該技術最初是由英國數學家托馬斯·貝葉斯所設計並在其1763年去世後發表,該方法旨在確定未來事件可能是基於過去發生的同類事件<small>168</small>。許多專家係統就是基於貝葉斯技術不斷地從經驗中匯集數據,從而持續學習並改進他們的決策。
最有前景的一類垃圾郵件過濾技術就是基於該方法的。我個人使用一個名為spam-bayes的垃圾郵件過濾器,它可以幫你把電子郵件分辨出“垃圾”還是“正常”<small>169</small>。你給每個過濾器提供一個文件夾。它就根據這兩個文件類型,自動訓練自己的貝葉斯信息網絡來分析各自的模式,從而使它能夠自動將隨後的電子郵件放到正確目錄裏。它還會根據接下來的郵件繼續訓練自己,尤其是用戶對其做了更正。該過濾器對我來說已經使得垃圾郵件得到控製,因為它每天可以剔除兩三百條垃圾消息,並保留上百條“正常”的信息。它認為是“正常”信息而事實是垃圾郵件的可能性隻占百分之一,但卻幾乎沒有把標記為“好”的消息認為是垃圾郵件。該係統幾乎與我辨別垃圾郵件能力一樣,甚至還更有效。
馬爾科夫模型。另一種模型基於馬爾科夫過程,這種模型的特點是將概率隨機網絡轉換為複雜序列。<small>170</small>馬爾科夫(安德列·維奇·馬爾科夫,1856—1922),因為建立了“馬爾科夫鏈”而成為享譽世界的數學家。“馬爾科夫鏈”在1923年被諾伯特·維納(1894—1964)重新定義和完善。這個理論提出了一種估計一個可能發生事件序列概率的方法。這個理論經久不衰,例如,在語音識別領域,這個可能發生的事件序列就是音符。在語音識別領域,馬爾科夫模型將會估計各種不同的音符模式,這些音符相互之間如何影響,還有可能出現的音符序列。這個係統在更高層的語言中引入隨機網絡,例如可以估計詞語的出現概率。模型使用的實際概率是在實際的語言數據訓練中得到的,因此其是自組織的。
馬爾科夫建模是我和我的同事們都曾經在自己的語音識別領域研究用到的一種方法。<small>171</small>不同於音節方法,關於音符順序的規律是人類語言學家已經規定好的,我們既沒有告訴係統在英語中大約有44個英語音素,也沒有告訴它什麽樣的序列出現的概率比其他的概率大。我們讓係統從數千小時的錄音數據中發現這些規律。這種方式的優勢就在於能發現人類專家不能發現的微妙規律。
神經網絡模型。神經網絡是另一種流行的自我組織的方法,也被用在語音識別和其他多種模式識別的任務中。這項技術涉及模擬簡化模型和神經元網絡連接。一個基本的神經網絡描述如下:每一個給定輸入點(對於語音,每個點代表兩個維度,頻率和時間;對於圖片,每個點表示二維圖像中的一個像素)被隨機連接到第一層的模擬神經元中。每個連接都有一個關聯的突觸的強度,代表其重要性,這是一個隨機值。每個神經元將發給它的信號合並起來。如果合並後的信號超過某一閾值,神經元被激發並且向其連接地輸出一個信號;如果合並後的輸入信號不超過閾值,不會激發神經元,它的輸出是零。每個神經元的輸出都被隨機連接到神經元的下一層。一般會有多層(一般3個或以上),並且這些層要被豐富地配置。例如,一個層可以反饋到前一層。在頂層,一個或更多的神經元為隨機的選擇提供答案。(有關的神經網絡算法的說明,請參見本章後注釋<small>172</small>)。
由於神經網絡的布線和突觸權重的初始化都是隨機的,所以一個未經訓練的神經網絡的答案也是隨機的。一個神經網絡的關鍵是學習它的主題。如同人類對哺乳動物大腦很淺顯地認知上,神經網絡開始了我們對於無知的探索。神經網絡的老師可能是人,也可能是一個計算機程序,甚至是另一種更成熟的經過訓練的神經網絡,當它生成正確的輸出時會獎勵它,當然也會懲罰它。這反過來又會反饋給這個學習中的神經網絡,以調整每個神經元間的強度。與正確結果一致的連接會被加強,產生錯誤結果的連接將會被削弱。隨著時間推移,該神經網絡會在沒有老師的幫助下產生正確的答案。實驗表明,神經網絡甚至能夠從不可靠的老師那裏學到知識。即使老師隻有在60%的時間內是正確的,但是它仍然會汲取營養。
一個強大的、經過良好學習的神經網絡可以仿真許多人類識別方麵的才能。多種多樣的采用多層神經網絡的係統在模式識別中表現出令人印象深刻的能力,包括手寫識別、人臉識別,在商業交易中的欺詐行為,如信用卡交易欺詐,等等。我在使用神經網絡進行上述研究的經驗就是最具挑戰性的工作不是如何編碼實現它,而是為它們提供自動學習的能力。
由於在大腦逆向工程中我們開發了詳細的神經功能模型,神經網絡目前的趨勢是采取實際的生物神經網絡工作的機理,實現更現實和更複雜的模型。<small>173</small>由於在自我組織的模式方麵有了幾十年的經驗,因此在大腦研究方麵的新進展可以迅速地用到神經網絡的實驗中去。
神經網絡也是並行處理的過程,因為大腦就是這樣工作的。人類的大腦沒有一個中央處理機來模擬每個神經元。相反,我們可以考慮每一個神經元和每個神經元之間的連接是一個獨立的、運行速度較慢的處理器。目前廣泛開展的工作是開發專門的芯片,實現並行神經網絡體係結構,從本質上提供更大的產出和效率。<small>174</small>
遺傳算法(gic algorithms,ga)。另一個源於自然的自我組織的靈感是遺傳算法,或稱為進化算法。算法的思路是模擬進化,包括有性繁殖和突變。下麵是一個對它們如何工作的簡單描述。首先,對一個問題確定一種解決方法。如果這個問題是設計一個噴氣發動機的最優化的參數,那麽這個問題就是確定一係列的參數(包括這些參數的類型和所占空間的大小)。這些參數在遺傳算法裏稱為遺傳密碼。然後,隨機產生數以千計的遺傳密碼。每個這種遺傳密碼(代表了一種方案的參數)被看做是模擬解決方案的有機體。
接下來在模擬環境中使用確定的方法來評估每組參數,從而評估每個仿真的生物體。這一評價是遺傳算法成功的關鍵。在例子中,我們將每個解決方案應用到噴氣發動機的模擬上,通過采用已確定的評判標準,比如,油耗或者速度等,來確定這種解決方案的優劣。最好的解決辦法是優勝劣汰。
每個幸存者將繁殖,直至達到自己的解決方案所要求的數量。以上過程是通過模擬有性繁殖完成的。換句話說,每一個新的解決方案來自其中一個父代的基因組合的一部分,另外的部分來自於另一個父代。通常不加以區分男女,這樣足以使得任意兩個個體產生後代。當它們繁殖時,允許發生一些基因突變。
我們現在定義了模擬繁殖後代的方式,然後重複這種方式,進行多代的繁殖進化。在每一代都要確定這種方式的改進程度。當兩代之間的差異小於一定的閾值,或者說兩代之間的差異性可以忽略不計,那麽我們將停止這種方案的模擬進化。並且應用評判標準最好的那一代作為最終的選擇。(對於遺傳算法的算法描述,參看本章注釋<small>175</small>。)
遺傳算法的關鍵是算法的設計者沒有直接使用程序來解決問題,相反,而是讓各種情況一一出現,通過模擬競爭和改善反複完善這種算法。正如前麵討論的,生物進化適者生存,但是進展緩慢。因此,為了加強進化的智能,我們保留其優勝劣汰的鑒別力,但是同時也大大加快這種笨重的步伐。計算機運行速度足夠快,使得可以在數小時、數天或數星期內模擬出許多代的進化。雖然我們還是在一次模擬中完成這個反複的過程,然而,既然讓這種進化按照常規發展,那麽我們將高度精練的方式加以應用,以加快問題的解決速度。
就像神經網絡一樣,遺傳算法也是一種從雜亂無章的數據中挖掘出隱藏其中的精妙關係的方法。這種方法成功的關鍵就是對每一種可能的解決方案能夠進行有效的評估。這種評估的速度要求必須快,因為每次模擬進化都可能產生成千上萬的解決方法。
遺傳算法善於處理擁有大量參數的問題,這些問題的參數數量龐大到無法精確地分析或者尋找最優解。例如,設計噴氣式飛機的引擎,需要涉及上百個參數和數十種限製。通用電氣公司的研究員們使用遺傳算法設計的引擎比使用傳統方法具有更精確的結果。
當你使用遺傳算法時,一定要注意你要求的結果。蘇塞克斯大學的研究人員喬恩·巴德曾經用遺傳算法優化振蕩電路的設計。通過反複嚐試使用少量的晶體管的傳統設計,最優的設計是一個簡單的無線電電路,而不是振蕩器。很顯然的是,遺傳算法發現了從臨近計算機發射出的無線電波。<small>176</small>基於遺傳算法的解決方案隻有在確切的位置才能確定最佳的解決方案。
遺傳算法作為混沌和複雜性理論的一部分,越來越多地應用在解決複雜的商業業務問題上,比如優化供應鏈。這種方法正在開始成為整個行業的分析方法。這種模式也正在應用到模式識別,並且經常和神經網絡等自組織的方法結合起來。同時這也是一個比較合理地編寫計算機軟件,特別是那些需要協調資源競爭的微妙平衡的軟件。
克裏·多克托羅是一位著名的科幻小說家,他在小說《usr/bin/god》中使用了一個有趣的通過遺傳算法產生的ai。通過遺傳算法(ga)將許多複雜的技術相結合,能夠產生許多智能係統,每一次結合都是以遺傳密碼為特征。然後這些係統通過遺傳算法來進化。
評價功能的方法如下:每個係統登錄到不同的聊天室,並且假冒成一個人進行聊天,實際上這是一個秘密的圖靈測試。如果這個聊天室的一個人發現了這個聊天機器人,那麽評估就結束了,這個係統就停止進一步的優化,並且將它的成績報告給ga。這個成績是由它與人類對話時間的長短來決定的。ga通過逐漸的進化來提高它的智能性。
盡管它僅僅是在係統具有一定的智能性時才會使用可預期的時間進行評估,實現上述理念的主要困難是評價進化的功能需要大量的時間。同樣,進行評估時可以很大程度上地使用並行。隻要我們認識到問題的核心,向ga中注入成熟的算法,那麽進化到圖靈的智能是可以現實的。這是一個很有趣和有用的可以通過圖靈測試的方法。
遞歸搜索。有時為了得到一個問題的解決方法,我們需要在大量的可能解中進行搜索。一個經典的例子就是玩遊戲,比如下棋。一個玩家為了走一步棋,他需要想到所有可能的走法,以及每種走法可能會引起的結果,等等。然而,對於人類來說,把所有走法的序列記起來是不可能的,他們必須依靠經驗分析每種情況來確定下一步的走法,而計算機則依靠邏輯運算來分析數以百萬計的走法。
這種邏輯樹是大部分遊戲的核心。現在我們考慮一下如何才能做到這一點。我們建立一個稱為選擇最佳下一步的程序。這個程序可以羅列出所有可能的走法(如果不是一個遊戲而是解決一個數學理論問題,這個程序需要在一個證明中羅列出所有的下一步的可能算法),對於每步走法,程序會建立一個由這種走法而引起的所有可能性的表。對於每個表,我們需要考慮如果這麽走,我們能遇到的所有情況。現在遞歸出現了,因為這個程序被自己調用(pick best next step,從名字就可以看出)來確定最佳的下一步走法。在調用自己後,程序會列出所有可能的走法。
這個程序不斷調用自己,在給定的時間內盡可能多地考慮未來的走法,這樣就會產生以指數型增長的邏輯處理樹。這是另外一個以指數增長的例子,因為預先處理以後的走法或者說是對策需要大約5倍於現在的計算量。遞推公式成功的關鍵是邏輯樹的裁剪,並且最終能夠停止增長。在遊戲中,如果在一點上的每種走法都行不通,那麽程序會在這一點(稱為這個樹的葉節點)結束邏輯樹的增長,並且考慮最優的能夠導致成功或者失敗的走法。當所有的遞歸的程序調用結束時,程序就能在一定的遞歸深度下,在一定的時間限製內得到最優的走法。(了解更多的遞歸算法,參見本章注釋177)。
遞推公式在數學方麵往往是相當高效的。不僅僅是遊戲中的移動,這種遞推已經在數學領域解決並證明了定理。在每個點的擴展都是能夠用公理(或以前的定理證明)證明的(這是紐厄爾、肖和西蒙斯的通用問題求解程序使用的方法。)
從這些例子可以看出,遞歸僅僅適用於那些可以清晰定義規律並且目標也很明確的問題。但它在計算機藝術創作領域卻給了我們很多驚喜。例如,我曾經設計過一個使用了遞歸方法的叫做ray kurzweils cybeic poet的程序。<small>178</small>這個程序對於每個詞都建立了一套目標:達到一定音律、詩的結構、詩的畫龍點睛的地方。如果它無法找到一個符合上述目標的詞,它就備份並刪除前一個詞,按照原來的標準重新開始尋找所期望的詞。如此循環往複的尋找。如果所有路徑都導致死角。如果最終所有的尋找都是徒勞的,那麽它會放寬一些限製,重新尋找。
圖 5-3
深弗裏茨的平局:是人類在變得聰明,還是機器在變得愚蠢?
在計算機國際象棋比賽世界裏,我們找到一個在軟件上有好轉的例子,即按照通常的看法,這些是靠計算機硬件的蠻力來統治的。在2002年10月的國際象棋錦標賽上,一流的選手弗拉基米爾·克拉姆尼克與深弗裏茨軟件打成平局。我想指出的是,深弗裏茨很有效,隻用到先前的冠軍——深藍1.3%計算能力。盡管這樣,但是它下棋的水平幾乎沒有下降,這是因為其基於模式識別的優秀的剪枝算法(後麵將會解釋)。在6年之內,一個像深弗裏茨的程序將擁有深藍的能力,每秒分析2億個棋盤位置。運行在個人計算機上的類似深弗裏茨的下棋程序,將在這10年之內,再一次擊敗所有人類。
在我1986年到1989年間曾寫的書《the age of intelligent machines》中,我已經預言,在20世紀90年代末,計算機將擊敗人類國際象棋冠軍。我也曾提到,計算機在國際象棋等級上,每年增長約45個百分點,反觀人類最好的選手,本質上已經定型,所以1998年迎來了交點。的確,在1997年鋪天蓋地宣傳的世界錦標賽上,深藍確實擊敗了蓋裏·卡斯帕羅夫。
但是,在深弗裏茨與克拉姆尼克的比賽上,目前本屆的計算機程序隻能夠打成平局。距深藍的勝利已經過去了5年,那麽我們怎麽解釋這種情況呢?我們應該可以總結出:
1)是人類越來越聰明,還是機器越來越愚蠢?
2)計算機在下棋上變得糟糕?如果這樣,我們可以總結出,在過去的5年裏,眾多宣傳計算機速度方麵的提高並不像人們說的那麽好?還是計算機軟件變得糟糕,至少在下棋上是這樣?
專用硬件的優勢
上麵的兩個結論沒有一個是確定的。目前的結論是軟件正在變好,因為深弗裏茨本質上已經敵得過深藍,而且利用更少的計算資源。為了獲得更多關於這個問題的深刻理解,我們需要測試一些必要條件。當我在20世紀80年代末寫下計算機下棋的預測時,卡內基·梅隆大學開始著手編寫一種程序,用來開發專門的芯片來指揮“極大極小”算法(遊戲博弈標準的理論,依賴於建立博弈序列的樹,然後評估樹的每個分支的終點葉子位置),特別是用來計算棋路。
基於此專用硬件,1988年卡內基·梅隆大學的下棋機器hitech它已能夠每秒分析175000個棋盤位置。它下棋的等級已經達到2359,隻比人類的世界冠軍約低440個點。
一年以後的1989年,卡內基·梅隆大學的深思機器將性能提高到每秒分析1000 000個棋盤位置,等級達到2 <small>400</small>。ibm最後接管該項目,重新改名為深藍,但是仍采用卡內基·梅隆大學的基礎體係結構。1997年,擊敗卡斯帕羅夫的深藍擁有256個並行工作的專用下棋處理器,每秒可分析2億個棋盤位置。
注意專用硬件的使用是很重要的,用它來加速特殊運算,需要為棋子移動生成極大極小算法。眾所周知,專用硬件計算機係統設計器一般執行一個特殊算法可以比通用計算機至少快100倍。專用的asics(專用集成電路)需要很大的開發工作和消耗,如果不是重複基準所需的臨界運算(例如,編碼mp3文件或者為電子遊戲渲染圖形基元),這項花費還是非常值得的。
深藍對抗深弗裏茨
由於總是有大量的焦點聚焦在裏程碑式的事件上,計算機有能力打敗人類對手,所以寄希望於專用象棋電路的支持是有用的。雖然關於深藍對卡斯帕羅夫比賽的參數保持了一定熱度的爭論,但是人們對計算機下棋的興趣自1997年後非常明顯地衰落。畢竟,目標已經達到了,再去白費力氣,意義不大。因此,ibm取消了該項計劃,從此以後再沒有關於專用下棋芯片的工作。人工智能的諸多領域的研究關注點已經不再是重大的結論,而是像導航飛機、導彈、工廠機器人、理解自然語言、診斷心電圖和血液細胞圖像、偵測信用卡欺騙,以及大量其他人工智能狹義上的應用。
盡管如此,計算機硬件仍呈指數增長,自從1997年以來,個人計算機計算速度每年翻一番。因此,深弗裏茨的專用奔騰處理器大約比1997年的處理器快32倍。深弗裏茨僅用8台個人計算機組成的網絡,所以硬件上相當於256台1997水準的個人計算機,每一台都比1997年的個人計算機約快100倍(當然,這是計算下棋的極大極小算法)。所以,深藍比1997年的pc機快上25600倍,比深弗裏茨快100倍。這項分析可以由兩個已經報道的係統速度來確認:深藍可以每秒分析2億個棋盤位置,而深弗裏茨僅約為2500 000個。
重大的軟件收益
由此,我們能對深弗裏茨的軟件說什麽呢?盡管下棋機器通常被看做暴力計算的例子,但是這些係統有一個重要的方麵,就是需要定性的判斷。一係列的移動-反對移動可能帶來的組合爆炸更為可怕。
在《the age of intelligent machines》我曾預計,如果我們沒有成功地對移動-反對移動樹剪枝,或者試圖在一場典型的比賽中走一步完美的妙棋,那樣大約需要400億年來移動一步棋子(假設一場典型比賽約有三十步,每一步有8種可能的選擇,那麽得到830可能的移動序列)。因此,一個實用係統需要不斷地修剪掉沒有希望的作用線。這需要洞察力而且本質上是模式識別判斷。
人類,即使是世界級國際象棋大師,完成極大極小算法也非常緩慢,通常比每秒一個移動-反對移動的分析要慢。所以一個國際象棋大師究竟能否與計算機係統對抗?回答是,我們控製了強大的模式識別,可以使我們利用極好的洞察力來進行剪枝。
準確地說,在這個領域,對深弗裏茨的改進已經超越了深藍,深弗裏茨隻比卡內基·梅隆大學的深思具有一些微小的有效計算能力,但是被認為高出幾乎400點。
人類國際象棋玩家注定失敗?
我在《the age of intelligent machines》裏做的另一個預言是,一旦計算機在國際象棋比賽方麵做的跟人類一樣好甚至更好,那麽我們不是更多地思考計算機智能就是較少地關注人類智能,或者較少提及國際象棋,如果曆史是向導,結局很可能是這樣。的確,它恰恰發生了。在深藍勝利後不久,我們開始聽到很多關於國際象棋隻是簡單的組合計算遊戲的說法,計算機的勝利隻證明它是個好的計算器。
事實上稍微複雜些。人類在國際象棋的良好表現顯然不能歸於我們的計算技術,事實上我們的計算技術還是很糟糕的。我們使用典型人類的判斷形勢來彌補缺點。對於這種定性判斷的形式,深弗裏茨比早先的係統表現出真正的進步。(附帶提及,人類在過去5年並沒有進步,人類最高積分保持在2800以下。從2004年起,卡斯帕羅夫的等級是2795,克拉姆尼克是2 <small>794</small>。)
我們該去向哪裏?既然計算機下棋依賴於普通個人計算機上運行的軟件,下棋程序將繼續從持續增長的計算能力中獲益。到2009年,一個類似深弗裏茨的程序將再次達到深藍的能力,每秒分析2億個棋盤位置。隨著互聯網計算成果帶來的機會,我們將能夠早於2009幾年達到這個可能。(計算機的互聯網成果將需要更多無所不在的交流寬頻帶,但是這已經到來。)
隨著這些必然的增長速度,以及模式識別持續不斷地提高,計算機下棋等級將繼續升高。在這個10年裏,普通個人計算機上運行的類似深弗裏茨的程序不久將再次打敗所有人類。那時,我們將徹底失去對國際象棋的興趣。
組合方法。組合方法是最強大的構建ai係統的方法,它仿真人類大腦的工作方法。正如前麵討論的,人的大腦不是一個巨大的神經網絡,而是包含了數百個區域,每個區域都以不同的方式優化處理所負責的問題。
沒有一個區域能夠單單依靠自身的操作而達到人類的水平,但是所有的區域在整個大腦係統中被精妙地設計,可以準確地完成人類的各項工作。
我曾經在做ai相關的工作時使用過這種方法,尤其是在模式識別方麵。舉例來說,在語音識別中,根據經驗與範例我們可以實現一些不同的識別係統。有的係統是專門按照專家的語言和語音知識建立的;有的是根據規則來分析句子(這就涉及表現句子的單詞使用情況的圖,類似於小學時學的相關表格);有的是基於自組織技術,如馬爾可夫模型,通過在圖書館中存儲的錄音和人們的演講中廣泛地進行訓練。然後,我們做一個“專家管理”軟件,以了解不同的“專家”的強度和弱點,然後通過組合這些結果來進行優化。在這種方式中,一個特殊的技術本身可能會產生不可靠的結果,卻依然能有助於提高係統的整體準確度。
在ai工具箱中,有很多結合不同方法的複雜辦法。例如,可以使用遺傳算法為神經網絡或者馬爾科夫模型優化最優拓撲(節點和連接的組織)。使用遺傳算法的神經網絡的最終輸出可以作為遞歸算法的控製參數。對於模式識別係統,我們還可以借助於強大的信號處理和圖像處理技術。每個不同的應用需要不同的架構。計算機科學教授和人工智能的企業家本·哥特茲在人工智能領域整合不同技術的策略和架構方麵已經發表了很多文章和專著。他提出的novamente架構旨在提供一個通用人工智能框架。<small>179</small>
以上隻是簡單介紹了當前日益成熟的ai係統。對於ai技術的詳盡講解和闡述已經超出了本書的範疇,甚至現在一個計算機科學的博士課程也不能包含現有的技術。
接下來介紹的精密ai係統使用各種方法來對每個特殊的任務進行整合與優化。精密ai係統由於順應了現在的發展趨勢而得到不斷加強:計算可用資源呈指數級增長,現實世界中已經存在成千上萬的智能應用,對於人類大腦機理的深刻認識正在不斷深化。
一個狹義ai的例子
在20世紀80年代末,我寫了我的第一部關於ai的書《the age of intelligent machines》。我花費了很大的力氣做了一些調查,以查找一些在實踐中成功的ai例子。那個時代互聯網還沒有普及,我不得不去圖書館和ai研究中心,足跡遍及美國、歐洲和亞洲。我將所有我認為可以作為合理的例子都收錄在我的書中。我沉浸在數以千計的令人欣喜的例子中。在kurzwei網站上,我們幾乎每天都會報告至少一個夢幻般的係統。<small>180</small>
商務通信公司(businessmunicationspany)2003年預測在2007年<small>181</small>,ai的市場規模達到了210億美元,2002~2007年的平均增長率為12.2%。領先的ai應用的行業包括商業智能、客戶關係、金融、國防和國內安全和教育。下麵介紹一個小型的正在使用的精密ai係統。
軍用智能。美國軍方一直是ai係統的狂熱愛好者。模式識別軟件係統可以引導如巡航導彈飛行數千公裏攻擊特定的建築物。<small>182</small>盡管已經獲得導彈飛躍地形的詳細資料,但是由於存在天氣、地麵覆蓋物和其他因素,因此需要一個靈活的實時圖像處理程序來實施具體的處理。
軍隊已經開發出自組織通信網絡(稱為“網狀網絡”)的原型。當一組節點進入新的位置時,它們能自動配置數以千計的網絡節點。<small>183</small>
專家係統結合貝葉斯網絡和遺傳算法,用以優化複雜的供應鏈,可以協調補給鏈,包括數以百萬計的備用物資、供應品和武器,這些物資的供應都將基於快速變化的戰場需求。
ai係統還可以模擬武器的性能,包括核爆炸以及導彈發射。
美國國家安全局(nsa)基於ai的echelon(埃施朗)係統,在2001年9月11號前,通過分析公共交通監控信號,發出過存在明顯恐怖襲擊的警告。<small>184</small>遺憾的是,echelon的警告沒有得到重視,所以釀成了慘劇。
2002年在阿富汗的軍事行動中見證了“捕食者”的首次亮相(美國無人戰鬥機)。無人機盡管已經發展了許多年,但直到在其上裝載了導彈才證明它是非常成功的。在2003年伊拉克戰爭中,武裝了的“捕食者”(由中央情報局操縱)和其他無人機摧毀了數以千計的敵人坦克和導彈發射點。
所有的軍事服務都正在采用機器人技術。軍隊利用該技術搜索洞穴(在阿富汗)和建築物。海軍使用小型機器人船隻保護航空母艦。正如我將要在第6章討論的,使士兵遠離戰場是一個越來越明顯的趨勢。
太空探索。美國航天局現在正試圖將自我控製加入到無人航天器的軟件中去。因為火星距離地球大約是3光分鍾,木星大約為40光分鍾(取決於行星的確切位置),航天器與地球的控製器之間的通信存在明顯的延時。由於這個原因軟件需要擁有重要的決策能力。為了做到這一點,美國宇航局正在設計軟件,包括該軟件的自身能力模型和一艘飛船,以及完成每個任務可能遇到的挑戰。這種人工智能的係統都能夠通過新的形勢來做決定而不僅僅是在已經設定的規則下進行推理。這種方法使得航天器可以深入太空。1999年一個飛船使用自有的知識設計了一係列的解決方法,避免了導致本次探索失敗的危險<small>185</small>。ai係統的第一個計劃失敗了,但它的第二個計劃完成了使命。“這些係統有一個關於內部元件物理性質的常識性模型”,布萊恩·威廉姆這樣解釋。布萊恩是深入太空智能軟件的首創者,現為美國麻省理工學院太空係統和人工智能實驗室的科學家。他還提到,“飛船可以從這一模型中進行推理,以確定哪些是錯誤的,並且如何采取行動”。
美國航天局使用計算機網絡通過遺傳算法發展三維空間技術的天線設計,使用5顆衛星來研究地球的電磁場。數以百萬計的設計在這次模擬進化中競爭。美國航天局的科學家和項目領導傑森·羅翰提到,“我們使用遺傳算法來設計微觀機器,包括陀螺儀,並用於航天導航。軟件還有可能發現人們永遠不可能想到的解決方案”。<small>186</small>
另一個ai係統可以將行星從分辨率很低的宇宙圖像中辨別出來,其精度超過了這個領域的人類專家。
新的陸地機器人望遠鏡能夠決定在哪裏觀察,並且懂得如何提高找到期望情況的可能性。稱為“自主、半智能觀測站”的係統能夠適應天氣,注意感興趣的項目,並且自主決定如何跟蹤它們。它們能夠檢測到非常微弱的太空現象,比如一個行星僅僅一納秒的閃爍,這可能說明我們的太陽係接收到了來自外宇宙的一個光線。<small>187</small>一個稱為運動目標和瞬態事件查詢係統(motess)的類似係統曾經在其投入使用的前兩年,發現了180顆新的小行星和彗星。“我們有一個智能觀測係統”,英國埃克塞特大學的天文學家阿拉斯代爾艾倫解釋說,“它能夠思考並且能自主做出決定,決定對某些觀測是繼續還是放棄。如果需要更多的觀測,它就將繼續並且得到想要的結果。”
類似的係統還被軍方用來自動分析來自間諜衛星的數據。目前的衛星技術能夠觀測到地麵上約1英寸大小的麵積,而不受惡劣天氣、雲或黑暗的影響。<small>188</small>在海量數據不斷產生的情況下,如果沒有自動圖像識別的方案,就不能從相關的聯係中得到規律。
醫學。如果你拿到一張心電圖(ecg),醫生就有可能通過適用於心電圖記錄的識別模式得到自動診斷。為了進行長期不引人注目地監測(嵌入衣服中的viasensors和無限通信使用手機)心髒病的早期症狀,kurzweil technologies公司正在和united therapeutics合作開發新一代的對心電圖的自動分析。<small>189</small>其他的識別模式係統被用於診斷大量的圖像資料。
每個主要的藥物開發者都在使用人工智能程序進行模式識別,以及挖掘新藥物療法發展領域中的有用數據。例如sri國際公司正在建立一個靈活的知識庫,該知識庫將我們所知道的有關典型疾病的所有事情進行了編碼,包括肺結核和幽門螺旋菌(引起潰瘍的細菌)<small>190</small>。這樣做的目的是應用智能的數據挖掘工具(能夠尋找出數據間新聯係的軟件)找出破壞或中斷這些病原體代謝的新方法。
相似的係統被用於演示其他疾病的新型醫療方法,並自動發現和理解基因的功能,以及它們在疾病中的角色。<small>191</small>例如,阿爾伯特實驗室宣稱,一個新的實驗室裏配有ai機器人、數據分析係統和6個研究者,能完成以前擁有200名科學家的藥物發展實驗室的工作。<small>192</small>
前列腺特殊抗原(psa)水平偏高的男性通常要經曆外科手術,但是這些男性中的75%沒有患前列腺癌。一個以血液中的蛋白質的模式識別為基礎的新測試將會使這個錯誤的陽性比率下降到大約29%。<small>193</small>這個測試是建立在由馬裏蘭州貝塞斯達的correlogic係統設計的ai程序的基礎上,準確性將會得到進一步的改進。
應用於蛋白質的模式識別同時也可以用於檢測卵巢癌。當代最好的卵巢癌檢測是和超音波檢測一起使用的ca-125,它能發現幾乎所有的處於早期階段的腫瘤。“通過長期的診斷發現卵巢癌十分致命,”fda和美國癌症研究所經營的臨床蛋白質組織程序的伊曼紐爾·帕特克因三世說。帕特克因是以ai為基礎的新型測試的領先研究者,該測試可以尋找能在目前的癌症中發現的獨特蛋白質模式。在一項包含數以百計的血樣評估中,根據帕特克因的說法,測試結果表明,“可以100%地發現癌症,即使癌症還在早期階段”。<small>194</small>
在美國幾乎10%的柏氏抹片是由名為focalpoint的自動化ai程序分析進行的,其發明者是tripath imaging公司。研究者們開始用他們的標準去麵試病理學家的職位。ai係統通過觀看病理專家繼續學習。隻有最好的人類診斷家才允許被該程序觀察。“這是專家係統的優點”,tri-path的技術產品經理鮑勃·施密特解釋說,“它隻允許你複製該領域最優秀的人。”
俄亥俄州立大學健康組織已經建立了以囊括多個專業、大量知識並以專家體係為基礎的cpoeputerized physician order-entry)係統。<small>195</small>這個係統能夠自動檢測很多內容,如病人中可能的過敏者、藥物的相互作用、年紀大者、藥物限製、劑量指南和適當性等病人的相關信息,這些信息來自醫院的實驗室和放射科。
自然科學和數學。威爾士大學基於綜合的ai係統發明了“機器人科學家”,該係統能明確地敘述基本理論。這個機器人科學家是一個能自動進行實驗的機器人係統,同時也是一個評價結果的推理機。研究者根據在酵母中的基因表達模式創造了該係統。這個係統“可以自動地產生假說來解釋所觀察的現象,設計實驗來驗證這些假設,用實驗室的機器人來真正地進行實驗,解釋偽造與數據不符的假設所造成的後果,然後重複整個過程”<small>196</small>。該係統能夠通過其自身的經驗來改善其性能。人類科學家設計的實驗比機器人科學家設計的實驗貴3倍。機器的測驗與一群人類科學家的測驗對比表明機器所發現的東西比得上人類所發現的東西。
威爾士大學的生物係主任邁克·楊是從事機器研究的人類科學家之一。他解釋說:“機器人打敗了我,但那僅僅是因為在那一刻我按錯了鍵。”
一個長期存在的關於代數學的猜測最終被阿爾貢美國實驗室的人工智能係統證明。人類數學家稱這個證明是具有創造性的。
商業、經濟和製造業。每個產業的公司都在用人工智能係統控製和完善物流,發現欺詐和洗錢,以及將智能數據挖掘技術應用於他們每天收集到的大量信息。例如,沃爾瑪從顧客的交易中獲得大量的信息。人工智能工具用神經網絡和專家係統對這些數據進行分析,從而為經理提供市場調查報告。這種智能信息挖掘技術能夠使他們為每天每個商場對每種產品的需求清單進行非常準確的預測。<small>197</small>
人工智能程序通常也用於發現金融交易中的欺詐行為。例如,一個叫future rout的英國公司用以牛津大學研究的人工智能為基礎的ihex係統去發現信用卡交易和貸款申請中的欺詐。<small>198</small>這個係統能夠根據經驗不斷地產生和更新自己的標準。在美國北卡羅來納州夏洛特的“第一庭權益聯合銀行”用loan arranger係統(類似於人工智能係統)決定是否批準抵押申請。<small>199</small>
全國證券交易商自動報價係統協會(nasdaq)也在使用一種名為securities observation,news analysis,regtion(sonar)的係統去監督欺詐交易和可能存在的內部交易。<small>200</small>到2003年年末,sonar發現了180多起事件,這其中涉及美國證、證券交易委員會和司法部。這其中的一些案件在事後被作為重要新聞報道。
1972~1997年,麻省理工學院ai實驗室的領導者帕特裏克·溫斯頓建立的ascent technology公司已經設計了一個名為smart-airport operations center(saoc)的係統,該係統也是基於基因算法的。它能夠處理飛機場的複雜後勤,如平衡眾多員工的工作分配,協調部門和設備的工作分配,並管理其他無數的細節。<small>201</small>溫斯頓指出:“找出方法去處理複雜的情況正是基因算法所做的事。”應用saoc的機場的生產率提高了大約30%。
ascent公司的第一份合同就是將它的人工智能技術用來管理1991年在伊拉克的“沙塵暴行動”的後勤。防禦遠景研究規劃局(darpa)聲稱基於ascent係統的人工智能邏輯計劃係統創造的價值將大於政府在過去十幾年中對人工智能的研究的投入。
軟件領域的一個新的發展趨勢是用人工智能係統處理複雜的軟件程序演示,發現故障,並在沒有人類指示的情況下選擇最好的方法自動恢複<small>202</small>。實現該功能的一個主要思想是:隨著軟件係統越來越複雜(像人一樣),它們不可能完美,除去所有的漏洞是不可能的。ai係統和人類采用相同的策略:“我們不期望完美,但我們經常試著從不可避免的錯誤中恢複過來。”“我想讓這個係統用自己的頭腦進行管理”,斯坦福大學的軟件基礎設施集團的領導者阿曼多·福克斯說他正在進行自動計算的研究。福克斯補充道:“這個係統必須自己建立自己,完善自己,修理自己,當出現錯誤的時候它必須知道如何應對這種客觀的威脅。”ibm、微軟和其他的軟件廠商正在開發融合了自治能力的係統。
製造業和機器人技術。計算機集成製造puter-integrated manufacturing,cim)越來越多地使用人工智能技術完善資源的利用,使後勤合理化,並及時通過購買部件和物資減少清單。cim的一個新趨勢是用“基於事件的推理”,而不用硬編碼的基於規則的專家係統。這些推理代碼的知識源於“事例”,而這些事例是解決問題的方法。最初的事例是由工程師設計的,一個成功的事例論證係統的關鍵是它能從實際經驗中不斷獲取新事例的能力。這個係統能夠應用推理在其存儲的眾多事例中找到適用於新情況的解決辦法。
機器人已廣泛地用於製造業。最新一代的機器人使用了靈活的人工智能影像係統(該係統由一些公司建造,如馬薩諸塞州的cognex corporation公司),它能應對各種情況。這降低了機器人正確執行操作時的精確度需求。加州一家自動化公司adept technologies的ceo布萊恩·卡萊爾指出:“即使勞動力的成本很低,智能機器人和其他智能設備之間的交互也是一個重大方麵。除了質量和容量外,硬件工具在使用戶接受產品轉變和演變方麵也是不可比擬的。”
人工智能專家漢斯·莫拉維茨成立了一家名為seegrid的公司,該公司主要提供由其開發的視覺機器以便於完成製造、材料處理和某些軍事任務。<small>203</small>莫拉維茨的軟件可以使一個設備(機器人或者僅僅是一個材料處理車)在非結構化的環境中以步行或滾動方式運行,並且可以通過這種方式建立一個可靠的三維地圖。該機器人可以利用此地圖和它的計算能力來確定執行任務的最佳路徑。
這項技術使得不需要前期繁瑣的預編程,便能使智能機器在生產過程中傳輸生產材料。在軍事方麵,這種智能機器可以完成精確的任務,同時適應快速變化的地理環境和戰場環境。
視覺機器也能夠提高機器與人交流的能力。使用小型、廉價的相機就可以使得機器人識別人的頭部和眼睛,以此實現自然界中的一種重要的交流方式——眼神交流。卡內基·梅隆大學和麻省理工學院的頭部和臉部跟蹤係統已經發展得比較完善,並且一些像seeing machines of australia這樣的小公司也已經開始提供這方麵的服務。
視覺係統強大的另一個有力證明是:一輛由人工智能係統駕駛的無人車輛在沒有人幹預的情況下幾乎從華盛頓特區開到了聖地亞哥。<small>204</small>美國pittsburgh大學計算機科學教授、美國人工智能協會會長布魯斯·布壩南說在10年前這是無法想象的事情。
帕洛阿爾托研究中心(palo alto research center,parc)正在開發一個機器人,該機器人可以在諸如沙漠等複雜環境中進行導航,並且發現一些可能重要的目標,例如找到一個受傷的人。2004年9月在對聖何塞舉辦的一個人工智能會議上,他們在模擬環境中展示了一些自我組織用於現實受災地區的機器人。<small>205</small>這些機器人可以在崎嶇的地形上移動,可以相互交流,組織處理圖像,並且通過體溫來尋找人類。
演講和語言。自然語言處理是人工智能方麵最具挑戰性的一項任務。不需要技巧,不需要完全掌握人類的智慧,電腦係統就可以實現基於文字的令人信服地與人交流。圖靈所設計的圖靈測試也完全是基於書麵語言的。
雖然達不到人類的水平,但是自然語言處理係統也在穩步前進。搜索引擎已經變得如此流行,以至於"google"已經從一個專有名詞轉變成了一個公用的動詞,它的技術已經革命性地改變了研究和獲取知識的方式。google和其他搜索引擎都使用基於人工智能的統計學方法和邏輯判斷來決定鏈接的排名。這些搜索引擎的缺點在於它們無法理解被搜索詞語的意思。雖然有經驗的用戶會設計一個關鍵詞的序列尋找最相關的站點(例如:搜索“電腦芯片”可能會比搜索“芯片”更有效率),但是我們最希望的是用自然語言進行搜索。微軟已經開發出了一套自然語言搜索引擎ask msr(ask micro-soft research),這個搜索引擎可以回答自然語言的問題,如:“米奇·曼陀什麽時候出生?”<small>206</small>在係統將這句話按照詞類(動詞、名詞等)進行解析之後,一個特殊的搜索引擎將會基於這些詞找到匹配項。係統將會找到匹配的文檔以回答這個問題並進行排序。正確的答案被排在前三位的概率至少有75%,而且通常不正確的答案將會非常明顯(例如:米奇·曼陀出生在3)。研究人員希望可以包含一些知識,這樣就可以降低錯誤答案出現的概率。
曾領導ask msr項目的微軟研究員埃裏克·布裏爾,嚐試完成一個更艱難的工作:建立一個可以用大約50個詞的句子回答一些更複雜問題,例如:“如何才能獲得諾貝爾獎?”這個係統所用的其中一個策略就是在網絡上找一個適當的faq段來回答這些問題。
自然語言係統包括大量的詞匯,電話中非特定語者語音識別已經進入市場並可以用於處理日常的事務。你可以詢問大英航空公司虛擬旅行代理人任何已經錄入的大英航空公司的航班。<small>207</small>假如你需要verizon公司的客服或者需要查爾斯·施瓦布和美琳·林奇幫你做財務匯報,你也可以通過與一個虛擬人類對話來獲得。盡管這些係統會令有些人厭煩,但是這些係統對於人們的日常口語確實可以做出比較快和比較適當的反應。微軟和其他一些公司正在提供一些係統,這些係統可以通過交互、合理而自然的對話來預定諸如旅店、旅行並處理常規的交易。
雖然並不是所有的人都對這些虛擬代理人的工作能力感到滿意,但是大多數係統都提供獲得真人在線幫助的功能。使用這些係統的公司報告說他們已經將需要使用人力的服務減少為原來的80%。除了可以省錢以外,接線員的減少也帶來了一些管理上的利益。因為很多人對工作不滿意,所以接線員的需求量非常大。
據說大多數男人都不願問路,但是汽車廠商證明不管是男人還是女人都願意向自己的汽車問路。2005年,acura rl和honda odyssey將會通過ibm提供的一套係統允許駕駛員和他們的汽車進行對話。<small>208</small>汽車導航將會包含街道的名字(例如,在main street左拐,然後在second avenue右拐)。駕駛員可以提出諸如“最近的意大利餐館在哪”的問題,或者可以進入特定的位置清楚地問路,然後給出汽車指令(例如,“打開空調”)。acura rl還將在它的屏幕上實時顯示交通擁擠程度。
語言識別係統號稱是獨立於說話者的,不受引擎聲音、風聲和其他噪音影響。據報道,這個係統能夠識別170萬個街道和城市的名稱,並且可以執行大約1000條指令。
計算機語言翻譯正在穩步發展。因為這是一個圖靈級的問題,即需要完全達到人理解語言的級別才能像人一樣熟練地完成任務。這將是最新的能夠與人類行為相媲美的應用領域。美國加利福尼亞南部的一個計算機專家弗朗茨·約瑟夫·奧克已經開發了一種用大約幾小時或幾天時間就能在任何語言之間進行翻譯的係統。<small>209</small>他所需要的僅僅是"rosetta stone"——一種語言的文本,以及該文本對應的另一種語言的翻譯文本——盡管他需要這種翻譯文本數百萬的文字。通過自組織技術,這個係統可以為兩種語言間的互譯建立統計模型。
而其他的翻譯係統需要語言學家費盡心機地建立語法規則,對於每個規則還需要處理大量的異常情況。最近在美國商務部國家標準與技術研究所舉辦的翻譯係統競賽中,och的係統獲得了很高的評分。
娛樂和體育。遺傳算法有一個很有趣又吸引人的應用,牛津大學的一個科學家托馬斯·瑞爾利用仿真的關節、肌肉和一個大腦神經網絡創造了一個活生生的生物。然後他給這些生物下達指令:行走。他用了一個具有700個參數的遺傳算法來實現這種能力。瑞爾說:“假如你用人眼觀察這個係統,你永遠也不能完成它,因為這個係統太複雜了,這就是進化所能達到的效果。”<small>210</small>
在這些“生物”平穩、令人信服地行走的同時,這項研究展示了遺傳算法的一個著名屬性:你將得到你所想要的。一些“生物”想出新穎的方法來代替行走。瑞爾提出:“我們有一些‘生物’根本不能行走,但是可以采用一些奇特的方法來向前行進:爬行或者翻跟鬥。”
軟件已經發展到可以從一些體育視頻中自動提取更重要的視頻。<small>211</small>都柏林的三一學院的一個團隊正在開發一種類似於台球的桌麵撞球遊戲,在這種遊戲中軟件可以追蹤每個球的位置並且可以識別一些重要的射門。佛羅倫薩大學的一個團隊以足球作為研究對象,這個軟件追蹤每個隊員,並且可以判斷一種球的運動類型(例如任意球、射門等)、進球的時間、被處罰的時間和其他一些關鍵因素。
倫敦的大學學院的數字生物興趣研究團隊正在利用一些遺傳算法設計一級方程式賽車。<small>212</small>
人工智能的冬季早已過去。我們已經進入了狹義人工智能的春天。前麵介紹的這些例子都是10~50年前的研究項目。假如所有的人工智能係統突然都停止工作,那麽我們的經濟基礎設施將會陷於停頓,銀行將會停止交易,大多數的交通會受到重創,通信將終止,而在10年前則不會有如此大的影響。當然,就目前來說,我們的人工智能係統還不具備籌劃類似陰謀的能力。
強人工智能
假如你隻用一種方式去理解某件事,那麽你並不能真正地理解這件事。這是因為假如有一個步驟發生錯誤,你將會被自己的思維所束縛。一件事對於我們的意義取決於如何把這件事同其他的事關聯起來。這就是為什麽我們說死記硬背不能理解其真正含義。然而,如果你有幾種不同的思路,那麽當其中一種失敗時,你就可以用另一種思維去嚐試。當然,如果將過多的不相關的事務連接起來,將會使自己陷入困惑。但是良好的連接可以使你多方位的轉變思路,直到找到一個合適你自己的。這就是我們所說的思考!
——馬文·明斯基<small>213</small>
提高計算機的性能就像水流蔓延的情景。大概半個世紀前,它開始灌溉低地,推進了人工計算器的發展,並改進了一些記錄員的工作,但沒有惠及大多數領域。現在,洪水已達到山麓,就連我們的哨所都在考慮撤退。在山峰上我們才能感到安全,但以目前的速度,高峰也將在另半個世紀被淹沒。由於那一天的臨近,我建議建一個方舟,並開始適應航海生活!但是現在,我們必須依靠我們在低地的代理人來告訴我們洪水的真正情況。
我們在山麓的代理人和理論向我們報告了智能的跡象。在數十年前我們為什麽沒有從低地獲得如下的報告:電腦在計算和記憶力方麵都強於人類?事實上在那個時代我們已經獲得了同樣的報告。當時計算機的計算效率能像成千上萬的數學家加在一起一樣,人們稱其為“巨人的大腦”。這鼓舞了第一代人工智能的研究。畢竟機器在從事某些事情的時候超越了任何動物,因為機器包含了人類的智慧、專注和數年的訓練。但是現在我們很難再體會到那種魔力。
其中的一個原因是計算機在其他領域愚蠢的表現造成了我們判斷上的偏見。另一個原因就是我們自己的問題。我們確實費勁心力地計算和記錄數據,使得一個複雜計算的每一個很小的機械步驟都很明顯,然而這樣龐大的描述往往超出了我們的能力範圍。像製造的深藍,從內部我們可以看到非常多的處理,而從外圍我們可以欣賞它設計的精妙。但通過天氣模擬的繁瑣計算來預測出風暴和龍卷風,或者通過電影動畫中的計算來表現栩栩如生的皮膚。這些不是顯而易見的。我們很少稱這些是智能。但相比人工智能,“人工現實”可能是更加深刻的概念。
潛藏在優秀人類棋手中的精神步驟和理論證明是複雜而又不可見的。無法進行機械式地解釋。那些可以自然地理解這些過程的人使用策略、理解力和創造力來描述它,而不是使用精神語言。當機器能夠以同樣豐富的方式兼備意義和驚喜,那麽我們就智能地用精神語言進行解釋。當然,在這個場景的背後,程序員能夠從原理上給出機械解釋。但即便對於程序員來說,當運行程序向內存中填入需要理解的大量細節時,這種機械解釋將是無效的。
就像上漲的洪水達到更多的居民居住地的高度,機器在眾多領域的能力也會提高很多。機器的思考中存在的本能意識將逐漸普及。當最高的山峰被淹沒,在各個領域,機器將具有與人類一樣的智能。機器中思想的出現將是不容懷疑了。
——漢斯·莫拉維茨<small>214</small>
因為信息技術的指數級發展,其性能將由乏善可陳發展到令人驚歎。如前麵幾章所述,在很多不同的領域,狹義人工智能的表現已經讓人印象深刻。機器使用人工智能可以完成的智能任務的範圍正在不斷地擴大。在我為《the age of spiritual machines》一書設計的一張圖片中(見圖5-4),一個充滿戒備的人類正在寫出隻有人類能做的事件標誌(機器不能做到)。<small>215</small>地板上的是人類已經拋棄的標誌,因為機器已經能夠實現這些功能:心電圖診斷、創作巴赫風格的曲子、識別人臉、引導火箭、打乒乓球、和國際象棋大師下棋、挑選股票、即興爵士樂創作、證明重要定理和理解連續演講。早在1999年,這些就不是隻有人類智能領域能夠完成的任務了,機器也可以完成所有的這些。
圖5-4中那個人後麵的牆象征著隻有人類才能完成的任務,如具有常識、複述電影、舉行記者招待會、翻譯演講、打掃房間和駕駛車輛。如果經過一些年後,我們重新設計這張圖片,這些標誌中的一些可能將落在地板上,當cyc達到上千萬的常識知識時,人類可能在常識推理領域上的優勢就不那麽明顯了。
圖 5-4
家用機器人的時代已經開始了,雖然現在尚處於原始階段,從現在開始的後10年,我們可能會考慮使用具有清理房間能力的計算機。對於駕駛車輛,沒有人工幹預的機器人已經在不同的交通道路上駕駛車輛,而且幾乎可以穿越美國。我們不會讓機器人掌控開車,但創建汽車能自己開的電子化高速公路是一個重要提議。
複述一部電影、舉行記者招待會和翻譯演講,這3個任務是非常難的,隻有達到人類對自然語言的理解才能辦到。一旦我們取下那些標誌,那麽我們將會擁有新一代機器,那時強人工智能紀元將會到來。
這個紀元將會悄悄來到我們身邊。隻要在人類和機器行為之間存在差異,比如在一些領域隻有人類才能做到而機器不能,那麽強人工智能的懷疑者就會抓住這些差異不放。但我們的每一個技能和知識領域的經驗都可能緊隨卡斯帕羅夫。我們對機器行為的認識將會很快從毫無希望變成令人畏懼,如同指數函數的底數超出人類預計的範圍一樣。
強人工智能是如何到來的?本書中的大部分材料都已經設計出對硬件和軟件的基本需求,並且解釋了為什麽我們確信在非生物係統中這些需求將會達到。計算性能的持續性指數級增長會使得硬件具有模擬人工智能的能力。這個觀點在1999年依然存在爭議。在過去5年中三維計算的發展取得了很大的進展。現在很少有資深評論員質疑它的發生。即便隻使用半導體工業發布的itrs路線圖的預測,在2018年,隻需要合理的花費就可以製造達到人類水平的硬件。<small>216</small>
為什麽我們能這麽自信地認為到20世紀20年代的後期能夠實現人類大腦各部分的詳細模型和模擬。在第4章就開始說明這種情況。直到最近,分析大腦內容的工具還不具有空間和時間解決方案,或者構造足夠的數據去創造充分詳細模型的實現成本太高。這些問題正在逐漸改善。在實時運行環境下,新出現的一代掃描和感知工具能夠精準地分析和檢測神經元和神經部件。
將來的工具應該具有更強的解決問題的能力。到了21世紀20年代,我們能夠將掃描和感知納米機器人送入人腦的毛細血管中,讓它們從裏麵檢查。我們已經具有了將不同來源(大腦掃描與感知)的數據轉化為模型和計算機模擬的能力,而且可以與生物人在這些區域的性能相媲美。我們已經具有強大的模型,並且可以模擬大腦的一些重要區域的功能。就如在第4章討論的,21世紀20年代後期人們將對所有大腦區域建立詳細和現實的模型。
對強人工智能的推測是這樣的:我們將在對所有大腦區域的逆向工程中學習到人類智能的實現原理。並且我們將應用這些理論到具有大腦智力能力的計算平台。這個將會在21世紀20年代實現。我們已經具有有效的工具來實現狹義人工智能。由於各種方法的持續改進,新算法的發現和各種方法向這個錯綜複雜體係融合的趨勢,狹義人工智能將逐漸變得不是那麽狹隘。這就是說人工智能的應用將有更廣闊的領域。並且它們的表現會更加靈活。人工智能的發展將為解決不同的問題提供不同的方法。就像人一樣。更重要的是,人腦逆向工程的加速發展將創造新的洞察力和範式,這將極大地豐富不斷發展基礎的工具集。這個過程正在很好地進行中。
經常會聽到由於人腦與計算機的工作機理有很大的不同,所以不能夠將關於腦功能的分析應用於可行的非生物係統。這個觀點完全忽略了自組織係統領域。我們有一組逐漸改善的精密數學工具應用於該領域。正如我在之前的內容中所討論的,人腦與當代普通的計算機相比,在很多重要方麵都是不一樣的。如果打開你的掌上電腦,切斷裏麵的一根線,就會很輕鬆地破壞一台機器。我們經常失去很多神經元和神經元間的連接,但卻沒有產生負麵影響。這是因為人腦具有自組織能力,並且依賴於分布式模式,所以很多特別的細節並不是很重要。
當我們到達21世紀20年代中晚期的時候,我們將能夠製造出非常詳細的人腦區域模型。最終這個工具將會逐漸豐富那些新的模型和模擬器並且能夠包含人腦如何工作的完整知識。我們可以應用這個工具到智能任務中,並且將在整個範疇利用這個工具,一些工具來源於人腦的逆向工程,一些工具源於我們對人腦理解的靈感,還有一些工具不是基於人腦而是基於人工智能。
人腦策略的一部分是學習信息,而不是源於硬編碼的知識(我們用“本能”這個詞來特指內在的知識)。學習依然是人工智能的一個重要部分。在我的經驗裏,在發展模式識別係統如字符識別、語音識別和經濟分析、培養ai的學習能力是最具挑戰性的,同時也是工程的重要組成部分。在線的人類文明的知識積累將會越來越多,將來的人工智能將有機會通過學習大量的信息實體來獲得教育。
對人工智能體的教育將比沒有經過強化訓練的人類快得多。一個生物人類需要25年的時間來完成基礎教育,而人工智能體則可以壓縮到數周或者更短的時間。並且,因為非生物智能具有分享學習和知識的模式,所以隻需有一個人工智能體掌握特殊技能。就如我所指出的,我們可以訓練實驗室的一組計算機來理解對話,隻要通過加載已經訓練完成的模式到他們的電腦,那麽成百上千的用戶都可以獲得我們的語音識別軟件。
非生物智能的一項技能是通過對人腦的逆向工程實現掌握人類的語言和分享人類的知識,從而通過圖靈測試。這個圖靈測試是非常重要的,不僅是因為它重要的實際意義,更是因為它是一個決定性的閾值。正如我們之前指出的,通過圖靈測試具有非常重要的意義,這不同於模擬人類智能的適應性、巧妙性和柔軟性。在我們的技術中已經具備了這種能力,該能力通過功能的集中、聚焦而放大。