首頁 > 新聞 > 智能 > 正文

        “千模大戰” 100 天,文心一言與 15 萬申測企業如何“軟著陸”?-當前熱門

        2023-06-07 21:05:57來源:ZAKER科技  

        智東西(公眾號:zhidxcom)

        作者 | 三北

        編輯 | 漠影


        (資料圖片)

        過去三個月,隨著 " 千模大戰 " 在全國爆發,頭部玩家百度文心一言 " 大招 " 不斷。

        昨日,百度智能云在成都舉辦的技術交流會上公布了最新成績單:過去近三個月,文心一言實現了推理性能提升 10 倍,高性能版推理性能提升 50 倍。這意味著,同等效果的大模型,企業獲取的成本大大降低。

        同時,百度文心一言大模型在應用上 " 再攻一城 ":繼百度搜索、百度地圖、小度音箱等應用接入文心一言之后,昨日,基于文心大模型的 AI 輔助編程工具 Comate 啟動邀測,助開發者提高研發效率。

        ▲基于 Comate 輔助的 " 貪吃蛇 " 游戲編程

        在市場和生態方面,百度智能云也公布了一組數據:截至當下,已有超 15 萬客戶申請接入文心一言,超 300 家企業成為文心一言生態伙伴,實現超 400 個具體場景落地。結合此前百度公布的 10 億元文心投資基金,這些數據展現出文心一言的強勁表現。

        頭部客戶方面,包括百圖生科、長安汽車、地平線、知乎、軟通動力等在內的多家企業,都基于百度文心千帆大模型平臺取得了大模型落地進展。

        AI 大模型的 " 百度速度 ",從一定程度上代表了國產大模型的發展速度。而在國產大模型加速賽跑的同時,國外的微軟、亞馬遜的 AI 競賽同樣愈演愈烈,為國產大模型施壓。

        加速 AI 發展成為各地政策所向,如何縮短與 GPT-4 的差距,也一直是國內產業持續關注的問題。通過對話百度智能云 AI 平臺副總經理施恩,我們深入了解了百度文心一言過去三個月的迭代思路和心路歷程,同時也探討了 AI 大模型落地產業的真實挑戰和應對之道。

        一、從代碼助手到千行百業,國產 AI 大模型加速 " 軟著陸 "

        首先來看看大模型應用更新。在本次技術交流會上,AI 代碼助手 Comate 是一個文心大模型應用矩陣中的新物種。

        作為一款程序員 " 神器 ",Comate 可幫程序員實現代碼的快速補齊、自然語言推薦代碼、自動查找代碼錯誤,從而提升研發效率。根據百度官方數據,在 Comate 輔助編寫的代碼中,近 50% 的建議代碼被開發者采納。

        實際上,市面上已經有一些同類 AI 代碼助手上線,包括微軟旗下 GitHub 推出的 Copilot X、AWS 推出的 CodeWhisperer 等。那么 Comate 的實際體驗效果如何?

        會上,施恩通過一個 " 貪吃蛇 " 小游戲的開發現場演示了 Comate。當開發者輸入 "canvas",以及 " 彈性布局,水平居中,垂直居中 " 等中文備注,"Comate" 即自動識別語義,生成游戲畫布代碼。當他再輸入 "param color"、"left"、"food=" 等顏色、方向、食物的簡單詞匯,"Comate" 自動聯系上下文理解指令,補全代碼,并在多條推薦代碼之間切換,選擇合適代碼,系統就直接生成了可運行的 " 貪吃蛇 " 小游戲。

        據悉,百度自 2021 年起就基于文心大模型研發代碼輔助工具,自 2022 年 9 月起就在內部全面測試。Comate 目前已經覆蓋了 30 余種編程語言,包括 C/C++、Python、Java、Go、PHP、JavaScript 等。Comate 支市面上主流 IDE,開發者可以通過插件等形式,在不同軟件中使用 Comate。同時,結合飛槳深度學習框架與文心大模型,Comate 可確保推理單次請求 300ms 左右,以極快的響應速度保障用戶使用體驗。

        面對市面上已有大廠的編程輔助工具,百度的 AI 代碼助手有什么差異化價值?

        施恩告訴智東西,市面上代碼助手工具的定位都是用于輔助代碼撰寫,提升效率,Comate 的一大差異化在于考慮了國內開發者的中文注釋習慣,具備中文注釋推薦代碼能力。同時,相比于市面上產品大多基于開源代碼訓練,百度 Comate 是結合其內部眾多業務開發代碼訓練而來,能做到業務實用性更強;此外,相比市面上產品需要基于公有云部署,Comate 則支持私有化部署,從而減少安全隱患。

        根據百度智能云的規劃,在第一階段,Comate 的主要功能是以輔助代碼撰寫為主;在第二階段,Comate 將實現在特定領域、場景的自然語言代碼生成;第三階段,將實現全領域的自然語言開發。

        縱觀過去三個月里文心一言落地的應用,已經形成了一個矩陣。除了 Comate,文心一言已落地百度搜索、新聞推薦、百度地圖、如流辦公平臺、小度智能音箱等百度自有業務,同時落地了百圖生科、長安汽車、地平線、知乎、軟通動力等企業場景。

        盡管很多場景還在探索之中,實際效果尚待驗證,但大模型在行業的 " 軟著陸 " 目前來看進展順利。

        二、推理性能提升 50 倍,文心一言主動 " 瘦身 " 賦能行業

        除了肉眼可見的應用方面進展,按照百度智能云公布的情況,文心一言大模型本身的迭代也達四版,效果和性能方面顯著提升。

        根據百度智能云官方數據,自 3 月 16 日文心一言開放測試以來,模型本身的推理性能已提升 10 倍。同時,在企業應用的高頻、核心場景中,文心一言的高性能模式 " 文心一言 -Turbo",其推理服務性能已經提升了 50 倍。

        文心一言 -Turbo 是什么意思?50 倍性能提升又意味著什么?

        文心一言 -Turbo,簡單來說,可以理解為一個 " 瘦身 " 的文心一言大模型,能在保證實現文心一言相同效果的同時,降低模型參數規模,從而降低企業的使用大模型的算力成本。

        而在 50 倍這一數字背后,施恩告訴智東西,隨著文心一言 -Turbo 帶來 50 倍性能提升,未來客戶將能感受到使用成本的降低。同時,模型的響應時長將被縮短,使得對時延要求高的場景體驗大大提升。此外,在資源擴展性方面,文心一言 -Turbo 使得私有云部署的客戶算力儲備和占用變少,取得明顯收益。

        文心一言及文心一言 Turbo 有各自適用的場景,為不同企業提供了不同選擇。

        一類是通用應用型企業,往往需要用大模型改善終端應用效果或孵化創新應用,比如 WPS、石墨等,核心關注的是大模型的效果保障。由于很多企業的應用是通用的,因此會選擇泛化性更強的文心一言,以解決更多問題。

        一類是行業龍頭企業,希望構建行業大模型服務上下游企業。比如教育、金融、能源等方向的龍頭企業,手握行業數據和場景積累,需要在專業領域構建基于行業大模型的應用。文心一言 Turbo 更適用于終端的應用場景,結合企業自身數據能達到更好的場景化效果。

        可以看到,經過近 3 個月迭代發展,百度文心一言的行業落地正在分出兩條清晰的路線:通用大模型和行業大模型并舉。

        縱觀全球 AI 大模型發展格局,國內 AI 大模型與 OpenAI 旗下的 GPT-4 的差距難以在短時間內趕上。但 3 個月的落地讓施恩對這一問題有了新認識,他認為,企業更關注的是大模型如何與企業場景做結合解決實際問題,而不是大模型評測情況。

        " 通用模型能力是一方面的,怎樣更好地跟行業數據、行業知識相結合,去解決問題是更重要實用的。" 施恩說," 我們這兩個方面都會關注。通用模型的邏輯、推理等能力提升,有助于更好訓練行業大模型;同時也不完全依賴于通用模型的全面性,不影響我們在一些特定的行業去應用落地。"

        三、文心千帆進化 10 周,大模型正顛覆云計算范式

        根據科技部新一代人工智能發展研究中心發布的《中國人工智能大模型地圖研究報告》顯示,目前中國 10 億以上參數規模的大模型已達 79 個。但這可能僅僅是冰山之上的情況,一場 " 千模大戰 " 在過去三個月里已經鋪開。

        市場需求在過去三個月已發生微妙變化,也影響著智能云產業的發展走勢。

        百度集團副總裁侯震宇在 5 月的閉門技術交流會上談道,在 3 月 16 日文心一言剛開放時,來咨詢的客戶大多是 CEO 級別的一把手,從戰略上認可大模型的重要性;兩個多月之后,團隊接觸到越來越多業務負責人,他們希望更快用大模型提高業務能力,從而在競爭中獲得優勢。

        與此同時,隨著 AI 大模型落地行業,一些實際挑戰也顯現出來。施恩告訴智東西,一是客戶使用上的困難,比如大模型需要較好的 Prompt(提示詞)做觸發,而一些客戶難以結合場景去編寫 Prompt,就使效果打折扣;二是通用大模型與專用場景的匹配不足,專業知識庫的缺乏阻礙大模型效果發揮;另外是與企業業務系統集成的挑戰,這需要與更具行業經驗的伙伴合作,等等。

        AI 大模型發展勢在必行,產業如何解決這些挑戰?

        對此,百度實際上在文心一言上線之后就給出了解法——標準化平臺賦能行業。

        3 月 27 日,百度文心千帆一站式企業級大模型平臺開啟測試。這是一個包含了文心大模型及第三方模型,以及構建大模型能力所需要的全場景工具鏈。比如行業伙伴需要的 SFT 大模型效果調優、Prompt 工程等,都可以從這個平臺上獲取。

        而經過近 10 周的迭代,文心千帆平臺雖然還不能說取得成績,但已經在生態方面有一些進展。除了文心一言大模型本身已迭代 4 個版本,還包括 15 萬企業申請內測、推出五大行業樣板間、400 多場景測試取成效等,包括長安汽車、百圖生科等伙伴都已經公布了成果。如下圖所示,文心千帆平臺大目標是能夠覆蓋 AI 研發的全生命周期,包括數據管理、模型訓練、模型評估、預測部署和插件服務等多項能力,支持公有云服務和私有化部署多樣化部署方式,從而實現更易用、更全面、更安全、更高效、更開放、更集成。據悉,文心千帆的核心迭代思路可以歸結為兩個核心關鍵點:一是效果,推理能力如何,與業務結合能否解決問題,是企業第一關心的。二是性能,要持續降本,對百度智能云的要求就是要在技術架構上持續提升性能。為此,大模型落地需要由算力、框架、模型、應用構筑的四層架構相互配合提供支撐。百度智能云正通過 AI 大底座,從芯片層、操作系統層、框架層、應用層 4 層架構占據先發優勢。

        可以看到,隨著 AI 大模型展開落地,云計算行業的產業規則正在被 AI 改變。主流商業模式正從強調規模的 IaaS(基礎設施即服務),向強調多層技術棧協同的 MaaS(模型即服務)發展,為云計算產業帶來進化升級的新機遇。

        結語:" 千模大戰 "100 天,頭部企業服務版圖基本成形

        隨著 AI 大模型加速產業落地,打頭陣的百度文心一言已實現多次進化迭代。

        3 月 16 日,百度大語言模型產品文心一言邀請測試;3 月 27 日,百度智能云文心千帆大模型平臺面向首批企業客戶啟動內測,在智能辦公、旅行服務、電商直播、政務服務、金融服務五大領域打造行業樣板間。

        4 月 25 日,百度智能云宣布六大智能產品系列將基于文心一言升級,未來將在安全評估完成后上線。4 月 26 日,百度智能云宣布文心一言大模型推理成本降到原來的 1/10。

        5 月 9 日、5 月 23 日百度智能云在北京、深圳舉辦技術交流會,首次演示用 " 文心千帆 " 大模型平臺可視化微調大模型的全過程。5 月 31 日,百度將設立 10 億元人民幣的百度文心投資基金。

        6 月 6 日,百度智能云推出文心一言高性能模式(文心一言 -Turbo)、開放代碼助手 Comate 邀測。

        可以看到,百度文心一言企業服務版圖成形。追溯到其升級思路,則是主要沿著效果和性能兩條主干線,以助各行各業的企業更快地通過大模型,滿足業務的實際需求。

        當我們提到 AI 大模型時,很自然地想到的是算力。而實際上,隨著大模型在產業場景中找到更多的結合點,能否解決客戶問題成為最關鍵的問題。因此,更智能的算力、靈活的框架平臺、豐富的大模型體系以及優質的應用方案,都將成為企業決勝 " 千模大戰 " 的關鍵。

        關鍵詞:

        責任編輯:hnmd003

        相關閱讀

        相關閱讀

        推薦閱讀

        亚洲AV无码AV吞精久久| 亚洲狠狠ady亚洲精品大秀| 亚洲人成网站在线观看播放动漫 | 亚洲六月丁香婷婷综合| 久久久久久亚洲AV无码专区| 久久亚洲精品无码| 亚洲av无码一区二区三区不卡| 亚洲色精品88色婷婷七月丁香| 久久久青草青青国产亚洲免观| 久久99亚洲综合精品首页| 久久久久亚洲AV综合波多野结衣| 国产日产亚洲系列| 精品国产亚洲一区二区三区| 日本亚洲视频在线| 亚洲成人中文字幕| 911精品国产亚洲日本美国韩国| 亚洲视频在线观看网址| 亚洲综合小说久久另类区| 亚洲无砖砖区免费| 国产成人亚洲合集青青草原精品 | MM1313亚洲国产精品| 国产亚洲综合一区二区三区| 亚洲国产成人爱av在线播放| 国产偷国产偷亚洲高清日韩| 亚洲一区二区三区在线观看精品中文 | 久久亚洲春色中文字幕久久久| 色拍自拍亚洲综合图区| 18亚洲男同志videos网站| 亚洲成人黄色在线观看| 亚洲三级高清免费| 亚洲国产精品无码中文lv| 在线观看亚洲电影| 国产亚洲精品AA片在线观看不加载| 亚洲中文字幕无码爆乳AV| 亚洲Av熟妇高潮30p| 亚洲色大成网站www永久| 亚洲综合偷自成人网第页色| 亚洲国产成人精品无码区花野真一 | 亚洲麻豆精品果冻传媒| 亚洲入口无毒网址你懂的| 久久久久亚洲精品无码网址色欲 |