首頁 > 新聞 > 智能 > 正文

“千模大戰” 100 天，文心一言與 15 萬申測企業如何“軟著陸”？-當前熱門

2023-06-07 21:05:57來源：ZAKER科技

智東西（公眾號：zhidxcom）

作者 | 三北

編輯 | 漠影

(資料圖片)

過去三個月，隨著 " 千模大戰 " 在全國爆發，頭部玩家百度文心一言 " 大招 " 不斷。

昨日，百度智能云在成都舉辦的技術交流會上公布了最新成績單：過去近三個月，文心一言實現了推理性能提升 10 倍，高性能版推理性能提升 50 倍。這意味著，同等效果的大模型，企業獲取的成本大大降低。

同時，百度文心一言大模型在應用上 " 再攻一城 "：繼百度搜索、百度地圖、小度音箱等應用接入文心一言之后，昨日，基于文心大模型的 AI 輔助編程工具 Comate 啟動邀測，助開發者提高研發效率。

▲基于 Comate 輔助的 " 貪吃蛇 " 游戲編程

在市場和生態方面，百度智能云也公布了一組數據：截至當下，已有超 15 萬客戶申請接入文心一言，超 300 家企業成為文心一言生態伙伴，實現超 400 個具體場景落地。結合此前百度公布的 10 億元文心投資基金，這些數據展現出文心一言的強勁表現。

頭部客戶方面，包括百圖生科、長安汽車、地平線、知乎、軟通動力等在內的多家企業，都基于百度文心千帆大模型平臺取得了大模型落地進展。

AI 大模型的 " 百度速度 "，從一定程度上代表了國產大模型的發展速度。而在國產大模型加速賽跑的同時，國外的微軟、亞馬遜的 AI 競賽同樣愈演愈烈，為國產大模型施壓。

加速 AI 發展成為各地政策所向，如何縮短與 GPT-4 的差距，也一直是國內產業持續關注的問題。通過對話百度智能云 AI 平臺副總經理施恩，我們深入了解了百度文心一言過去三個月的迭代思路和心路歷程，同時也探討了 AI 大模型落地產業的真實挑戰和應對之道。

一、從代碼助手到千行百業，國產 AI 大模型加速 " 軟著陸 "

首先來看看大模型應用更新。在本次技術交流會上，AI 代碼助手 Comate 是一個文心大模型應用矩陣中的新物種。

作為一款程序員 " 神器 "，Comate 可幫程序員實現代碼的快速補齊、自然語言推薦代碼、自動查找代碼錯誤，從而提升研發效率。根據百度官方數據，在 Comate 輔助編寫的代碼中，近 50% 的建議代碼被開發者采納。

實際上，市面上已經有一些同類 AI 代碼助手上線，包括微軟旗下 GitHub 推出的 Copilot X、AWS 推出的 CodeWhisperer 等。那么 Comate 的實際體驗效果如何？

會上，施恩通過一個 " 貪吃蛇 " 小游戲的開發現場演示了 Comate。當開發者輸入 "canvas"，以及 " 彈性布局，水平居中，垂直居中 " 等中文備注，"Comate" 即自動識別語義，生成游戲畫布代碼。當他再輸入 "param color"、"left"、"food=" 等顏色、方向、食物的簡單詞匯，"Comate" 自動聯系上下文理解指令，補全代碼，并在多條推薦代碼之間切換，選擇合適代碼，系統就直接生成了可運行的 " 貪吃蛇 " 小游戲。

據悉，百度自 2021 年起就基于文心大模型研發代碼輔助工具，自 2022 年 9 月起就在內部全面測試。Comate 目前已經覆蓋了 30 余種編程語言，包括 C/C++、Python、Java、Go、PHP、JavaScript 等。Comate 支市面上主流 IDE，開發者可以通過插件等形式，在不同軟件中使用 Comate。同時，結合飛槳深度學習框架與文心大模型，Comate 可確保推理單次請求 300ms 左右，以極快的響應速度保障用戶使用體驗。

面對市面上已有大廠的編程輔助工具，百度的 AI 代碼助手有什么差異化價值？

施恩告訴智東西，市面上代碼助手工具的定位都是用于輔助代碼撰寫，提升效率，Comate 的一大差異化在于考慮了國內開發者的中文注釋習慣，具備中文注釋推薦代碼能力。同時，相比于市面上產品大多基于開源代碼訓練，百度 Comate 是結合其內部眾多業務開發代碼訓練而來，能做到業務實用性更強；此外，相比市面上產品需要基于公有云部署，Comate 則支持私有化部署，從而減少安全隱患。

根據百度智能云的規劃，在第一階段，Comate 的主要功能是以輔助代碼撰寫為主；在第二階段，Comate 將實現在特定領域、場景的自然語言代碼生成；第三階段，將實現全領域的自然語言開發。

縱觀過去三個月里文心一言落地的應用，已經形成了一個矩陣。除了 Comate，文心一言已落地百度搜索、新聞推薦、百度地圖、如流辦公平臺、小度智能音箱等百度自有業務，同時落地了百圖生科、長安汽車、地平線、知乎、軟通動力等企業場景。

盡管很多場景還在探索之中，實際效果尚待驗證，但大模型在行業的 " 軟著陸 " 目前來看進展順利。

二、推理性能提升 50 倍，文心一言主動 " 瘦身 " 賦能行業

除了肉眼可見的應用方面進展，按照百度智能云公布的情況，文心一言大模型本身的迭代也達四版，效果和性能方面顯著提升。

根據百度智能云官方數據，自 3 月 16 日文心一言開放測試以來，模型本身的推理性能已提升 10 倍。同時，在企業應用的高頻、核心場景中，文心一言的高性能模式 " 文心一言 -Turbo"，其推理服務性能已經提升了 50 倍。

文心一言 -Turbo 是什么意思？50 倍性能提升又意味著什么？

文心一言 -Turbo，簡單來說，可以理解為一個 " 瘦身 " 的文心一言大模型，能在保證實現文心一言相同效果的同時，降低模型參數規模，從而降低企業的使用大模型的算力成本。

而在 50 倍這一數字背后，施恩告訴智東西，隨著文心一言 -Turbo 帶來 50 倍性能提升，未來客戶將能感受到使用成本的降低。同時，模型的響應時長將被縮短，使得對時延要求高的場景體驗大大提升。此外，在資源擴展性方面，文心一言 -Turbo 使得私有云部署的客戶算力儲備和占用變少，取得明顯收益。

文心一言及文心一言 Turbo 有各自適用的場景，為不同企業提供了不同選擇。

一類是通用應用型企業，往往需要用大模型改善終端應用效果或孵化創新應用，比如 WPS、石墨等，核心關注的是大模型的效果保障。由于很多企業的應用是通用的，因此會選擇泛化性更強的文心一言，以解決更多問題。

一類是行業龍頭企業，希望構建行業大模型服務上下游企業。比如教育、金融、能源等方向的龍頭企業，手握行業數據和場景積累，需要在專業領域構建基于行業大模型的應用。文心一言 Turbo 更適用于終端的應用場景，結合企業自身數據能達到更好的場景化效果。

可以看到，經過近 3 個月迭代發展，百度文心一言的行業落地正在分出兩條清晰的路線：通用大模型和行業大模型并舉。

縱觀全球 AI 大模型發展格局，國內 AI 大模型與 OpenAI 旗下的 GPT-4 的差距難以在短時間內趕上。但 3 個月的落地讓施恩對這一問題有了新認識，他認為，企業更關注的是大模型如何與企業場景做結合解決實際問題，而不是大模型評測情況。

" 通用模型能力是一方面的，怎樣更好地跟行業數據、行業知識相結合，去解決問題是更重要實用的。" 施恩說，" 我們這兩個方面都會關注。通用模型的邏輯、推理等能力提升，有助于更好訓練行業大模型；同時也不完全依賴于通用模型的全面性，不影響我們在一些特定的行業去應用落地。"

三、文心千帆進化 10 周，大模型正顛覆云計算范式

根據科技部新一代人工智能發展研究中心發布的《中國人工智能大模型地圖研究報告》顯示，目前中國 10 億以上參數規模的大模型已達 79 個。但這可能僅僅是冰山之上的情況，一場 " 千模大戰 " 在過去三個月里已經鋪開。

市場需求在過去三個月已發生微妙變化，也影響著智能云產業的發展走勢。

百度集團副總裁侯震宇在 5 月的閉門技術交流會上談道，在 3 月 16 日文心一言剛開放時，來咨詢的客戶大多是 CEO 級別的一把手，從戰略上認可大模型的重要性；兩個多月之后，團隊接觸到越來越多業務負責人，他們希望更快用大模型提高業務能力，從而在競爭中獲得優勢。

與此同時，隨著 AI 大模型落地行業，一些實際挑戰也顯現出來。施恩告訴智東西，一是客戶使用上的困難，比如大模型需要較好的 Prompt（提示詞）做觸發，而一些客戶難以結合場景去編寫 Prompt，就使效果打折扣；二是通用大模型與專用場景的匹配不足，專業知識庫的缺乏阻礙大模型效果發揮；另外是與企業業務系統集成的挑戰，這需要與更具行業經驗的伙伴合作，等等。

AI 大模型發展勢在必行，產業如何解決這些挑戰？

對此，百度實際上在文心一言上線之后就給出了解法——標準化平臺賦能行業。

3 月 27 日，百度文心千帆一站式企業級大模型平臺開啟測試。這是一個包含了文心大模型及第三方模型，以及構建大模型能力所需要的全場景工具鏈。比如行業伙伴需要的 SFT 大模型效果調優、Prompt 工程等，都可以從這個平臺上獲取。

而經過近 10 周的迭代，文心千帆平臺雖然還不能說取得成績，但已經在生態方面有一些進展。除了文心一言大模型本身已迭代 4 個版本，還包括 15 萬企業申請內測、推出五大行業樣板間、400 多場景測試取成效等，包括長安汽車、百圖生科等伙伴都已經公布了成果。如下圖所示，文心千帆平臺大目標是能夠覆蓋 AI 研發的全生命周期，包括數據管理、模型訓練、模型評估、預測部署和插件服務等多項能力，支持公有云服務和私有化部署多樣化部署方式，從而實現更易用、更全面、更安全、更高效、更開放、更集成。據悉，文心千帆的核心迭代思路可以歸結為兩個核心關鍵點：一是效果，推理能力如何，與業務結合能否解決問題，是企業第一關心的。二是性能，要持續降本，對百度智能云的要求就是要在技術架構上持續提升性能。為此，大模型落地需要由算力、框架、模型、應用構筑的四層架構相互配合提供支撐。百度智能云正通過 AI 大底座，從芯片層、操作系統層、框架層、應用層 4 層架構占據先發優勢。

可以看到，隨著 AI 大模型展開落地，云計算行業的產業規則正在被 AI 改變。主流商業模式正從強調規模的 IaaS（基礎設施即服務），向強調多層技術棧協同的 MaaS（模型即服務）發展，為云計算產業帶來進化升級的新機遇。

結語：" 千模大戰 "100 天，頭部企業服務版圖基本成形

隨著 AI 大模型加速產業落地，打頭陣的百度文心一言已實現多次進化迭代。

3 月 16 日，百度大語言模型產品文心一言邀請測試；3 月 27 日，百度智能云文心千帆大模型平臺面向首批企業客戶啟動內測，在智能辦公、旅行服務、電商直播、政務服務、金融服務五大領域打造行業樣板間。

4 月 25 日，百度智能云宣布六大智能產品系列將基于文心一言升級，未來將在安全評估完成后上線。4 月 26 日，百度智能云宣布文心一言大模型推理成本降到原來的 1/10。

5 月 9 日、5 月 23 日百度智能云在北京、深圳舉辦技術交流會，首次演示用 " 文心千帆 " 大模型平臺可視化微調大模型的全過程。5 月 31 日，百度將設立 10 億元人民幣的百度文心投資基金。

6 月 6 日，百度智能云推出文心一言高性能模式（文心一言 -Turbo）、開放代碼助手 Comate 邀測。

可以看到，百度文心一言企業服務版圖成形。追溯到其升級思路，則是主要沿著效果和性能兩條主干線，以助各行各業的企業更快地通過大模型，滿足業務的實際需求。

當我們提到 AI 大模型時，很自然地想到的是算力。而實際上，隨著大模型在產業場景中找到更多的結合點，能否解決客戶問題成為最關鍵的問題。因此，更智能的算力、靈活的框架平臺、豐富的大模型體系以及優質的應用方案，都將成為企業決勝 " 千模大戰 " 的關鍵。

關鍵詞：

責任編輯：hnmd003

“千模大戰” 100 天，文心一言與 15 萬申測企業如何“軟著陸”？-當前熱門

相關閱讀

相關閱讀

精彩推薦

閱讀排行

精彩推送

推薦閱讀