世界即時:深度學習三巨頭之一 Yann LeCun:大語言模型帶不來 AGI
當今世界,Yann LeCun 、Geoffrey Hinton 以及 Yoshua Bengio 三位科學家并稱為深度學習三巨頭。值得注意的是,三巨頭之中,LeCun 對于 AI 發展所持的態度是最為樂觀的。此前在馬斯克提出「人工智能給人類文明帶來了潛在風險」時,LeCun 曾公開反駁,認為人工智能遠未發展到給人類構成威脅的程度。關于 AI 接下來該如何發展,在今天上午于北京舉行的 2023 智源人工智能大會上,他發表了名為《走向能夠學習、推理和規劃的大模型》的演講,表達了系統的思考。
法國當地時間凌晨四點,LeCun 從法國的家中連線智源大會的北京現場。盡管 OpenAI 的 GPT 路線風頭正盛,許多人認為大語言模型將通往 AGI,LeCun 卻直言不諱:需要放棄生成模型、強化學習方法這樣的主流路線。他認為,基于自監督的語言模型無法獲得關于真實世界的知識。盡管語言生成的內容質量一直提升,但是這些模型在本質上是不可控的。對于語言模型的局限性理解,也基于他此前的一個基本觀點:人類有許多知識是目前無法被語言系統所觸達的。
因此,想讓 AI 獲得如人一般對真實世界學習、應對和規劃的能力,他展示了自己在一年前所發表的論文中提出的架構「自主智能」 ( autonomous intelligence)。這是由一個配置模塊控制整個系統,基于輸入信息,進行預測、推理、決策的架構。其中的「世界模塊」具有估計缺失信息、預測未來外界狀態的能力。
(資料圖片)
LeCun 核心觀點精彩摘要:
AI 的能力距離人類與動物的能力,還有差距——差距主要體現在邏輯推理和規劃,大模型目前只能「本能反應」。
什么是自監督學習?自監督學習是捕捉輸入中的依賴關系。訓練系統會捕捉我們看到的部分和我們尚未看到的部分之間的依賴關系。
目前的大模型如果訓練在一萬億個 token 或兩萬億個 token 的數據上,它們的性能是驚人的。我們很容易被它的流暢性所迷惑。但最終,它們會犯很愚蠢的錯誤。它們會犯事實錯誤、邏輯錯誤、不一致性,它們的推理能力有限,會產生有害內容。由此大模型需要被重新訓練。
如何讓 AI 能夠像人類一樣能真正規劃?可以參考人類和動物是如何快速學習的——通過觀察和體驗世界。
Lecun 認為,未來 AI 的發展面臨三大挑戰,并由此提出「世界模型(World Model)」。
、
以下為演講全文的部分摘要,經極客公園編輯后發布:很抱歉我不能親自到場,已經很久沒有去中國了。
今天我將談一下我眼中的人工智能的未來。我會分享一下 AI 在未來十年左右的方向,以及目前的一些初步結果,但還沒有完整的系統。
本質上來說,人類和動物的能力和今天我們看到的 AI 的能力之間,是有差距的。簡單來說,機器學習和人類動物相比并不特別好。AI 缺失的不僅僅是學習的能力,還有推理和規劃的能力。
過去幾十年來,我們一直在使用監督學習,這需要太多的標注。強化學習效果不錯,但需要大量的實驗。最近幾年,我們更多使用機器自我監督,但結果是,這些系統在某種程度上是專業化和脆弱的。它們會犯愚蠢的錯誤,它們不會推理和規劃,它們只是快速地反應。
那么,我們如何讓機器像動物和人類一樣理解世界的運作方式,并預測其行動的后果?是否可以通過無限步驟的推理執行鏈,或者將復雜任務分解為子任務序列來規劃復雜任務?
這是我今天想講的話題。
但在此之前,我想先談一下什么是自我監督學習?自我監督學習是捕捉輸入中的依賴關系。在最常見的范例中,我們遮蓋輸入的一部分后將其反饋送到機器學習系統中,然后揭曉其余的輸入——訓練系統會捕捉看到的部分和尚未看到的部分之間的依賴關系。有時是通過預測缺失的部分來完成的,有時不完全預測。
這種方法在自然語言處理的領域取得了驚人的成功(如翻譯、文本分類)。最近大模型的所有成功都是這個想法的一個版本。
同樣成功的是生成式人工智能系統,用于生成圖像、視頻或文本。在文本領域這些系統是自回歸的。自監督學習的訓練方式下,系統預測的不是隨機缺失的單詞,而是僅預測最后一個單詞。系統不斷地預測下一個標記,然后將標記移入輸入中,再預測下一個標記,再將其移入輸入中,不斷重復該過程。這就是自回歸 LLM。
這就是我們在過去幾年中看到的流行模型所做的事情:其中一些來自 Meta 的同事,包括開源的 BlenderBot、Galactica、LLaMA、Stanford 的 Alpaca(Lama 基于 LLaMA 的微調版)、Google 的 LaMDA 、Bard、DeepMind 的 Chinchilla,當然還有 OpenAI 的 ChatGPT 和 GPT-4。如果你將這些模型訓練在一萬億個 Token 或兩萬億個 Token 的數據上,它們的性能是驚人的。但最終,它們會犯很愚蠢的錯誤。它們會犯事實錯誤、邏輯錯誤、不一致性,它們的推理能力有限,會產生有害內容。
因為它們沒有關于基礎現實的知識,它們純粹是在文本上進行訓練的。這些系統在作為寫作輔助工具、幫助程序員編寫代碼方面非常出色。但是它們可能會產出虛構的故事或者制造幻覺。
我同事給我開了一個玩笑。他們說,你知道 Yann Lecun(楊立昆)去年發行了一張說唱專輯嗎?我們聽了一下(AI 根據這個想法生成的假專輯),當然這是不真實的,但如果您要求它這樣做,它會這樣做。目前的研究重點是,如何讓這些模型系統能夠調用搜索引擎、計算器、數據庫查詢等這類工具。這被稱為擴展語言模型。
我和我的同事合作撰寫過一篇關于擴展語言模型的論文。我們很容易被它們的流暢性所迷惑,認為它們很聰明,但它們實際上并不那么聰明。它們非常擅長檢索記憶,但它們沒有任何關于世界運作方式的理解。這種自回歸的生成,存在一種主要缺陷。
如果我們想象所有可能答案的集合,即標記序列的樹(tree),在這個巨大的樹中,有一個小的子樹對應于給定提示的正確答案。因此,如果我們想象任何產生標記的平均概率 e 都會將我們帶出正確答案集合的集合,而且產生的錯誤是獨立的,那么它們可能會看到 n 的答案的相似度是(1-e)的 n 次方。這意味著會存在一個指數級的發散過程將我們帶出正確答案的樹。這就是自回歸的預測過程造成的。除了使 e 盡可能小之外,沒有其他修復方法。
因此,我們必須重新設計系統,使其不會這樣做。這些模型必須重新訓練。
那么如何讓 AI 能夠像人類一樣能真正規劃?我們先來看人類和動物是如何能夠快速學習的。
我們看到嬰兒在生命的前幾個月內掌握了大量關于世界運作方式的基礎概念:如物體永恒性、世界是三維的、有機和無機物體之間的區別、穩定性的概念、自然類別的學習以及重力等非常基本的概念。嬰兒在 9 個月左右就能會這些。
根據我同事制作的圖表,如果您向 5 個月大的嬰兒展示下面左下角的場景,其中一個小汽車在平臺上,你將小汽車從平臺上推下來,它似乎漂浮在空中,5 個月大嬰兒不會感到驚訝。但是 10 個月大的嬰兒會非常驚訝,因為在此期間,嬰兒已經知道了物體不應該停留在空中,它們應該在重力下下落。這些基本概念是通過觀察世界和體驗世界來習得的。我認為我們應該用機器復制這種通過觀察世界或體驗世界學習世界運作方式的能力。
我們有流利的系統,可以通過法律考試或醫學考試,但我們沒有可以清理餐桌并填滿洗碗機的家庭機器人,對吧?這是任何孩子都可以在幾分鐘內學會的事情。但我們仍然沒有機器可以接近這樣做。我們顯然在當前擁有的 AI 系統中缺少了非常重要的東西。我們遠遠沒有達到人類水平的智能,那么我們該如何做到這一點?實際上,我已經確定了未來幾年 AI 面臨的三個主要挑戰。
首先是學習世界的表征和預測模型,當然可以采用自我監督的方式進行學習。
其次是學習推理。這對應著心理學家丹尼爾 · 卡尼曼的系統 1 和系統 2 的概念。系統 1 是與潛意識計算相對應的人類行為或行動,是那些無需思考即可完成的事情;而系統 2 則是你有意識地、有目的地運用你的全部思維力去完成的任務。目前,人工智能基本上只能實現系統 1 中的功能,而且并不完全;
最后一個挑戰則是如何通過將復雜任務分解成簡單任務,以分層的方式運行來規劃復雜的行動序列。
所以大約一年前,我發布了一篇論文,是關于我認為未來 10 年人工智能研究應該走向的愿景,你可以去看一下,內容基本上是你們在這個演講中聽到的提議。在我提出的這個系統中,核心是世界模型(World Model)。世界模型可以為系統所用,它可以想象一個場景,基于這樣的場景作為依據,預測行動的結果。因此,整個系統的目的是找出一系列根據其自己的世界模型預測的行動,能夠最小化一系列成本的行動序列。
(編者注:有關 Lecun 關于世界模型的論述,感興趣的讀者可以自行搜索 Lecun 的這篇論文《A Path Towards Autonomous Machine Intelligence》。)
問答環節 Q & A:
提問人:朱軍|清華大學教授,智源首席科學家
Q:生成式模型通常將輸出定義為多個選擇的概率。當我們應用這些生成模型時,我們通常也希望它們擁有創造力,產生多樣化的結果。這是否意味著這些模型實際上無法避免事實錯誤或邏輯的不一致性呢?即使您擁有平衡的數據,因為在許多情況下,數據會產生沖突的影響,對嗎?您之前提到了輸出的不確定性,您對此有何看法?
A:我認為,通過保留自回歸生成來解決自回歸預測模型生成模型的問題是不可行的。這些系統本質上是不可控的。所以,它們將必須被我提出的那種架構所取代,在推理過程中,你需要讓系統優化某種成本和某些準則。這是使它們可控、可操縱和可規劃的唯一方法。這樣的系統將能夠計劃其回答。
就像我們像現在這樣講話,我們都會計劃講話的過程,怎樣從一個觀點到另一個觀點,怎么解釋事物,這些都在你的腦海里。當我們設計演講時,不是一字一句地即興發揮。也許在低層次上,我們在即興發揮,但在高層次上,我們一定是在規劃。所以規劃的必要性是非常明顯的。人類和許多動物都具備規劃能力,我認為這是智能的一項重要特征。所以我的預測是,在相對短的幾年內,理智的人肯定不會再使用自回歸元素。這些系統將很快被放棄,因為它們是無法修復的。
Q:您之后將參與一個辯論,探討人工智能會不會成為人類生存的威脅。
參會者還有 Yoshua Bengio,Max Tegmark 和 Melanie Mitchell。您能講講您屆時將闡述什么觀點嗎?
A:在這場辯論中,Max Tegmark 和 Yoshua Bengio 將站在「是」的一邊,認為強大的 AI 系統可能對人類構成存在風險。而我和 Melanie Mitchell 將站在「否」的一邊。我們的論點不是說沒有風險,而是這些風險雖然存在,但通過謹慎的工程設計可以輕易地加以減輕或抑制。我對此的論點是,今天問人們是否能夠使超智能系統對人類安全,這個問題無法回答,因為我們還沒有超智能系統。所以,直到你能基本設計出超智能系統,你才能討論如何讓它變得安全。這就好比你在 1930 年問一位航空工程師,你能使渦噴發動機安全可靠嗎?工程師會說,什么是渦噴發動機?因為渦噴發動機在 1930 年還沒有被發明出來,對吧?所以,我們處于一種有點尷尬的境地。現在,宣稱我們無法使這些系統安全還為時過早,因為我們還沒有發明出它們。一旦我們發明了它們,或許就是按照我所提出的設計藍圖,再討論如何使它們安全也許是值得的。
責任編輯:hnmd003
相關閱讀
-
世界即時:深度學習三巨頭之一 Yann LeCun:大語言模型帶不來 AGI
當今世界,YannLeCun、GeoffreyHinton以及YoshuaBengio三位科學家并稱
2023-06-09 -
索尼宣布《漫威蜘蛛俠 2》將于今年 10 月 20 日發售,6 月 16 日開始接受預訂
索尼宣布,《漫威蜘蛛俠2(Marvel & 039;sSpiderMan2)》將會在2023年10月20
2023-06-09
相關閱讀
-
世界即時:深度學習三巨頭之一 Yann LeCun:大語言模型帶不來 AGI
當今世界,YannLeCun、GeoffreyHinton以及YoshuaBengio三位科學家并稱
-
世界快看:血透患者內瘺堵塞怎么辦?記住這“八個好”!
“患者內瘺堵塞超過72小時,已經形成血栓,需要緊急處理!”6月5日上午
-
2.5%定價分紅年金險好不好?分紅年金險有哪些特點? 今日熱文
比較好。2 5%定價分紅年金險作為一種分紅型養老保障工具,具有以下幾個
-
關注:美國年金險的預定利率是多少?利率怎么算?
預定利率為3 5%。美國年金險的預定利率通常由保險公司根據國家規定發布
-
當前快訊:各保險公司年金險對比哪個好?怎么選擇?
這個問題本身并沒有一個統一的答案,因為不同人對于年金險產品的需求和
-
焦點日報:年金險對比推薦哪個好?怎么選擇?
經過對比,發現目前市面上比較好的年金險產品是信泰人壽最新推出的信泰
-
環球時訊:寧德時代曾毓群:新能源規模化變革提速,2030年動力電池市場需求將達4.8TWh
6月9日,2023世界動力電池大會在宜賓開幕,寧德時代董事長曾毓群出席并
-
傳家璽悅年金保險怎么樣?可以終身領取嗎? 天天聚看點
傳家璽悅年金保險是一款基于長期養老保障需求而設計的保險,具有較高的
-
每日熱點:微信加強微短劇小程序規范運營,共計對79個違規小程序進行處置
今日,據微信珊瑚安全公眾號,為保障平臺微短劇小程序規范運營,實
-
好大夫在線王航內部信:砍掉重業務和團隊,改變互聯網拓展方式_微頭條
據深廠報道,好大夫在線創始人王航昨日在內部發出《公司最新情況說
-
【熱聞】秋季登陸歐洲市場 全新三菱Colt官圖發布
秋季登陸歐洲市場全新三菱Colt官圖發布日前,車質網從相關渠道獲悉,三
-
哈三聯:證監會同意參股公司敷爾佳科技創業板IPO注冊申請 每日速讀
哈三聯公告,參股公司哈爾濱敷爾佳科技股份有限公司(簡稱“敷爾佳科技
-
夜色中,一座港口向世界展現新活力-環球動態
午夜,天津港第四港埠有限公司碼頭仍然一片繁忙……碼頭上,“聯合皇冠
-
索尼宣布《漫威蜘蛛俠 2》將于今年 10 月 20 日發售,6 月 16 日開始接受預訂
索尼宣布,《漫威蜘蛛俠2(Marvel & 039;sSpiderMan2)》將會在2023年10月20
-
一代小屏神機小米 6 涅槃重生!換上驍龍 8 Gen2 處理器 +4700 大電池
在短短十幾年間,小米從一家默默無聞的小廠商一躍成為全球知名,銷量經
-
評測榮耀 80 Pro 手機:1.6 億像素主攝,影像、快充皆升級
前言對于榮耀發布的美學設計手機—榮耀80Pro,在各項性能參數和實測中
-
neat 數據線評測:支持 100W 電力傳輸,充電體驗更疾速
前言隨著越來越多的平板、筆記本電腦甚至是電腦主板等設備搭載全功能US
-
創維數字:公司針對海外市場 2C 客戶的智能機頂盒 ChatOTT 產品接入 ChatGPT 大模型
品玩6月9日訊,創維數字6月9日在互動平臺上稱,公司針對海外市場2C客戶
-
200 億美金 biotech 吹響沖鋒號,RNAi 的后來居上_環球微速訊
圖片來源@視覺中國文|氨基觀察在每一個產業的進化歷程中,技術路線決定
-
這代父母的心聲,被毛不易唱透了
剛剛過去的兒童節,成年人似乎比孩子過得還起勁。以前總有人說,年輕人
-
向網絡暴力亮劍!這 5 種情形,從重處罰!“兩高一部”公開征求意見_環球速訊
據最高人民檢察院官方微信號,6月9日,最高人民法院、最高人民檢察院、
-
1 小時 6.5 元,共享單車我騎不起了 當前快報
共享單車費率,已經遠超公交。作者|土衛六編輯|劉車仔題圖|圖蟲創意最
-
緊隨潮流,2023年奶粉排行榜前十品牌大揭秘
生命早期的1000天被世界衛生組織定義為影響一生健康走向的生長發育機遇窗口期,而科學的喂養和全面均衡...
-
年金和年金險的區別是什么?年金險怎么買?
支付方式不同:年金是指一定時間內的固定收入,通常是按月或按年支付。
-
618預售意面空刻搶占速食榜首,母公司寶立食品潑冷水:增長有限
今年618預售期間,速食品牌銷售排行榜換了“天地”。“頂流”螺螄粉遭
-
全球熱資訊!年金險推薦哪個好?購買要注意什么?
市面上年金險產品眾多,每一款都有屬于自己的特色,下面為大家推薦幾款
-
這些省份,為何在猛建工科?
6月9日,全國多數地區2023年高考結束。對于1291萬名考生來說,一場“大
-
泰康人壽保險年金險解析,保障什么?
泰康鑫福年金保險(分紅型)是一種帶有理財性質的人身保險,旨在為被保
-
年金險優點是什么?缺點是什么?
年金險最大的優點就是提供長期穩定的收入,可以為退休后的生活提供更多
-
嘉峪關年金險怎么樣?保障什么?
還是不錯的。長城嘉峪關養老年金保險的投保對象為30天至60歲的人群,雖
精彩推薦
閱讀排行
精彩推送
- 助力科學教育 學而思網校科學思...
- 通用投資5億美元生產下一代凱迪...
- 天天熱文:比亞迪“F品牌”定名...
- 華為余承東:中國 L3 自動駕駛...
- 聯想全球中小企業產品和解決方案...
- 環球視訊!各大品牌為何扎堆換 ...
- 全球視訊!首批落地 5 城 阿...
- Tt 推出勁透 Ceres 300 TG ...
- 基本醫療保險的繳納比例是多少?...
- 打造高效營商環境,招商蛇口新項...
- 旭輝控股:前5月合同銷售金額約3...
- 代交社保的公司合法嗎?靈活就業...
- 申請專利各種費用的繳納標準是什...
- 營業執照怎么申請?公司法第二十...
- 設立代理記賬公司要具備的條件有...
- 申報技術專利流程是怎么樣的?申...
- 設立公司的申請流程是什么?中華...
- 死刑緩刑是什么意思?死刑緩期執...
- 申領人攜帶本人身份證明材料都有...
- 人壽保險的年金險值得買嗎?怎么...
- 年金險和增額壽有什么區別?可以...
- 泰康年金險有哪些?優點是什么?
- 今日報丨年金險適合哪個年齡買?...
- 年金險的五點功用是什么?有沒有...
- 巨無霸IPO又來!華虹半導體欲募...
- 養老專戶余額是什么意思?養老保...
- 天天觀速訊丨網龍網絡:執行董事...
- 三部門就依法懲治網暴公開征求意...
- 極氪X首批量產車正式下線,用時56天
- 公司稅務的申報期限是多久?中華...