第499章 ai進度

遊戲公司？這分明是科技巨頭作者：饑餓的考拉投票推薦加入書簽留言反饋

    陳騰將ai部門負責aigc部門的負責人給喊了過來。

    所謂aigc，是artificial intelligence generated content的首字母拚音。

    翻譯過來，就是“人工智能生成內容”。

    顧名思義，aigc這類ai的作用，就是生成一些內容。

    2022年以後大火的gpt，就是最廣為人知的aigc。

    除此之外，還有ai作畫、ai生成視頻，都在aigc的範疇之中。

    在aigc大火的時候，許多人認為一個全新的時代將要到來。

    畫畫、寫作、作曲……這類創作性的工作，由ai就能夠完成。

    然而理想很豐滿，現實很骨感。

    陳騰在這些ai工具大火的時候，也玩過幾次。

    隻不過再嚐試幾次之後，就會發現這些ai工具存在著重大的缺陷。

    文字類ai生成的內容牛頭不對馬嘴。

    上一秒說過的話，下一秒就會忘記，記憶短得像是七秒鍾記憶的魚一樣。

    在算力達到一定程度之前，ai對於上下文內容的記憶能力永遠都小得可憐。

    不過用來寫些沒什麽意義的檢討、總結、日報周報，還是相當不錯的。

    以及在寫代碼的時候，生成一些簡單的代碼。

    圖片類ai生成的內容同樣存在一些問題。

    比如說早期一直被詬病的手部細節，比如說隻能生成動漫類型的圖片。

    一旦生成寫實類的圖片，就會顯得非常失真。

    用來做輔助工作還行。

    要是想要靠ai獨立地完成一些任務，還有很長的路要走。

    2022年的ai水平尚且如此，2015年的ai水平就更加不用說了。

    不過現在能邁出第一步，陳騰還是非常感興趣的。

    “老板，您找我？”

    眼前的男人四十歲不到，叫做魏龍，是國內人工智能領域的一位專家。

    他從騰達做手機語音助手的時候，就來到了騰達。

    在語音助手這一塊，做了相當多的工作。

    技術水平是有口皆碑的好。

    “對，我聽朱岩哲說你們推出了一個aigc的測試版本？”

    “是的，目前我們的對話大模型暫命名為dh，版本號為0.1。”

    “dh？”

    “對話的首拚。”

    “原來如此。”陳騰笑了笑，“那這個dh0.1現在大概處於什麽樣的水準？”

    “對話的智力水平……大概隻有幼兒園小朋友的水平吧。”

    陳騰微微點頭。

    這個水平，的確不高。

    也難怪版本號是0.1，而不是1.0。

    “你覺得如果我們這個dh0.1如果需要提升，目前最欠缺的是什麽？”

    “數據。”魏龍毫不猶豫地回答道，“絕對是優質的數據，我們這個模型的水準還是不錯的，就是數據實在是太少了。”

    “數據嗎……”

    陳騰倒是沒懷疑魏龍說的模型水準。

    因為這個dh模型的基礎，其實是【lsm人工智能語言學習大模型】。

    就是陳騰上次五連抽，在係統上抽到的那個。

    係統出品，怎麽都不會太差勁的。

    在抽到這個大模型之後，魏龍手下的技術團隊又基於這個模型做了一定程度上的改進。

    所以模型水準陳騰是非常信任的。

    不過模型的學習能力強是一回事，數據又是一回事。

    如果將模型比作一個人，優秀的模型就是天賦很高的天才。

    可就算是頂級的天才，沒有高質量的學習資料，能學到的東西也有限。

    現在騰達的這個dh模型，缺乏的就是學習資料。

    “我們現在的數據源有哪些？”

    “就是各大平台上網友們交流的一些數據，比如短視頻平台的評論區，直播平台的彈幕。不過這些數據的質量，實在是太低了。”

    陳騰微微點頭。

    魏龍說的很有道理。

    短視頻平台的評論區，有相當多的一部分評論都是沒什麽意義的回複。

    這個沒意義，指的是對ai訓練沒意義。

    比如顏值博主的評論區什麽“好美”“好漂亮”的誇讚。

    對於ai訓練來說，意義不大。

    經過篩選處理過後，能用的數據少得可憐。

    陳騰又想到了gpt。

    實際上第一代的gpt是在2018年推出的。

    但是第一代的gpt在市場上，並沒有攪動什麽風雲。

    因為智能水平太低了，根本沒有人樂意與這樣的ai對話。

    直到四年之後，足足喂了四年的數據，這才有了許多人願意對話聊天的gpt。

    可見ai的學習與發展，是一條十分漫長的路。

    “如果按照現在的學習速度，你覺得我們的ai需要多長的時間，才能通過圖靈測試？”

    所謂圖靈測試，就是讓一個人去問ai問題。

    看看這個人，能否發現正在與自己聊天對話的是ai。

    能發現是ai，則未通過圖靈測試。

    未能發現是ai，則通過圖靈測試。

    這個測試方法在學術界具備一定的爭議。

    有人覺得這是一個很好的測試手段，有人則覺得這種測試手段沒什麽必要。

    但是不管怎麽說，圖靈測試都可以作為一個ai智能程度的一個指標。

    能通過圖靈測試的人工智能不一定特別有用，但至少具備一定的智能程度。

    “如果按照現在的學習速度，通過圖靈測試的話大概需要兩年吧。如果數據的量充足且優質，也許兩三個月甚至更短的時間就能通過圖靈測試了。”

    魏龍有些無奈地說道。

    優化模型、輸入數據。

    他們搞人工智能的，無非就是在做這兩件事情。

    “我倒是有一個想法，可以試一試，我們可以在互聯網上，將dh0.1偽裝成普通的用戶，讓真人用戶和dh0.1對話試試。”

    “可是dh0.1現在的水準，恐怕和正常人聊上幾句，就會讓人覺得聊天內容牛頭不對馬嘴了。”

    “那有什麽關係？”陳騰反問，“你現在上網去和人討論問題，牛頭不對馬嘴的情況難道遇到的少嗎？”

    魏龍：“……”

    還真別說，他確實在互聯網上見證過生物多樣性。

    “那我們就偽裝成真人，去和用戶聊天？”

    “嗯，你去找蔣華，讓他配合你們弄些人機賬號出來吧。”

    “好的。”

    “什麽時候你們覺得這個對話模型有資格被稱之為dh1.0了，我們就向用戶正式開放我們這個對話模型。”

    “如果能和大量真人進行對話，我覺得一年以內，甚至半年的時間我們就能達到1.0版本。智力水平，應該有七八歲小孩子這麽高。”

    “那還不錯。”

    陳騰對七八歲小孩子的智力水平還是認可的。

    至少能對話了。

    如果在這個基礎上再進步，那就真的可以商業化了。

溫馨提示：按回車[Enter]鍵返回書目，按 ←鍵返回上一頁，按 →鍵進入下一頁，加入書簽方便您下次繼續閱讀。