首頁 > 新聞 > 智能 > 正文

        國產大模型,也分「武當」和「少林」

        2023-07-10 10:11:27來源:ZAKER科技  

        國產大模型,WAIC(世界人工智能大會)來了半壁江山。


        【資料圖】

        這也是 ChatGPT 技驚四座大半年后,30 多個國產大模型第一次在同一個舞臺上,接受不同背景參會者的審視。

        能明顯感受到,相較于半年前效仿 OpenAI 大煉通用語言模型的熱潮,如今 WAIC 呈現出的國產大模型圖景,已經大致分為 " 增值派 " 和 " 聚焦派 " 兩大路徑。

        所謂的 " 增值派 ",指的是不僅研發通用大模型基座,還基于基座提供模型 API、算力、訓練、部署等配套服務的廠商,典型案例是推出 MaaS(Model as a Service)平臺、攜 " 通用大模型、行業大模型、云、芯片 " 等全家桶到場的云廠商們。

        帶著全套模型服務方案入場的大廠們

        而 " 聚焦派 " 則恰恰相反,找準少量應用場景深挖,推出垂直領域的大模型,是他們的策略。這些廠商往往是資源能力和服務范圍有限的創企,比如聚焦在金融等四個領域的瀾舟科技,或者是原有業務的應用場景十分聚焦。

        這兩天被不少學生和家長圍觀的網易有道則是后者的典型案例。他們在教育領域推出的 " 子曰 " 大語言模型,參數規模為 200 億,在一眾動輒上千億的通用大模型中并不算大。

        基于網易有道 " 子曰 " 大模型的虛擬人口語教練。

        即便派系分化,但對大模型感到 " 臉盲 ",仍是不少觀展者給 36 氪的反饋:不同廠商呈現出的大模型能力和服務體系大同小異—— " 增值派 " 廠商將大模型和云、部署等服務打包售賣," 聚焦派 " 廠商則是兩手抓:一邊賣行業模型服務,一邊賣自身被 AI 升級后的應用。

        " 逛了一圈大模型,感覺都差不多,沒有留下太深的印象。" 一名 7 月 6 日開幕當天就蹲守在的電器公司銷售經理,背著上司 " 改造公司 OA 系統 " 的指標來到 WAIC,但現實與理想仍有差距。

        有 ChatGPT 珠玉在前,多數廠商背負了不小壓力。即便在部分任務的表現能力能與 GPT-4 掰手腕,但大部分廠商都承認,通用大模型的表現與目前賽道的 " 天花板 "GPT-4,依然存在不小差距。

        好與壞,難判斷

        數十家大模型企業,上百款產品,怎么合作?如何落地?不少參會者迷失在巨大的上海 WAIC 展館里。

        對大模型判斷失準,癥結首先出在難以統一的模型能力評判標準上。

        曠視科技多次在公開采訪中表示,會持續在大模型技術方向進行投入。曠視 CTO 唐文斌告訴 36 氪,模型的測評分為學術和業務兩個標準,更易證明的是前者,但對落地最有價值的在于后者。

        若是讓曠視站在客戶的角度選模型合作方,一定得在實際業務中長期跑起來后,結合 ROI、效益等指標綜合評判," 應用價值是檢驗大模型能力的最好標準 "。

        " 學術和工程之間隔著鴻溝。" 第四范式聯合創始人、首席架構師胡時偉說,模型的算法、參數都是學術 " 肌肉 ",但能不能給客戶解決實際問題,需要考驗模型廠商本身對具體行業、具體業務的認知。模型的實用價值并非是靜態、單維的。

        他直言 WAIC 不是一個拉客戶的場合:" 這里你怎么在短時間內給客戶證明模型的業務價值?"

        大模型讓人臉盲的另一個現實原因則在于,目前不同廠商的模型能力仍然沒有拉開差距,尤其是通用大模型與 GPT-4 存在明顯差距。

        一個典型的例子是,對于 C 端應用場景明晰且有數據積累的有道而言,在通用大模型的基礎上精調是捷徑,但有道依然選擇了自訓 " 子曰 " 大模型的荊棘路。" 國產通用大模型的能力滿足不了垂直場景需求 " 就是有道的工作人員給 36 氪列舉的其中一個原因。

        沿著 Transformer 的訓練路徑,目前 GPT-4 就是面世模型中的能力天花板,也給國內廠商提供了行之有效的技術路線參考。但在今年 3 月 36 氪的專訪中,百度 CEO 李彥宏認為創企做類似 ChatGPT 的大語言模型是 " 重復造輪子 ":" 創業公司重新做一個 ChatGPT 其實沒有多大意義。"

        " 這個階段國內大部分廠商只能做重復造輪子的工作。" 面壁智能聯合創始人兼 CTO 曾國洋對 36 氪說道,"GPT-4 也被證明與 AGI(通用人工智能)有差距,但國內公司先得追上 GPT-4,才有資格開始造車。"

        在他看來,造輪子不等于沒意義,而是在模型發展初期需要做的 "Dirty Work"。曾國洋打了個比方,就像學數學,現階段廠商是洗數據、堆參數、調試代碼的小學生,需要打好 10 以內數學運算的基礎;等到上了大學,廠商才有可能去碰線性代數、微積分等更高維的東西,跳出造輪子的階段去做創新。

        用 B 端的生意打磨輪子

        現階段,C 端場景的價值并不大——這是不少模型廠商的共識。

        真金得用火煉,但不少 C 端場景都不夠復雜,對模型能力的打磨效果不顯著。" 用模型直接做 toC 應用,滿足的基本是生成功能,這是一個交付流程很短的場景。" 商湯的工作人員對 36 氪表示。

        再者,即便 C 端能帶來大量的用戶反饋數據,但企業還需面對 " 多數據、低質量 " 的問題。一名網易有道的工作人員告訴 36 氪,訓練 " 子曰 " 最可用的數據來自于試題和標準答案,靠用戶反饋的數據依然需要大量的人工清洗和標注。

        因此,靠 B 端業務獲得營收,并在業務場景中用較高質量數據資源提高工程能力,是不少模型廠商如今的發力點。

        極少公開露面的 AI" 當紅炸子雞 "MiniMax,這次特地來為合作方金山辦公站了臺,順勢推出了自研通用大模型 Abab 的 5.0 版本。這兩家公司在今年 5 月攜手推出了 " 中國版辦公 Copilot" ——自動生成 PPT 大綱和模板、PDF 文檔重點提取等熱門功能,在 WPS 的展位大屏上循環播放。

        WPS AI 的功能。圖源:WPS

        " 高質量的標注數據,依然是稀缺資源。"MiniMax 技術總監劉啟君對 36 氪直言。對 2022 年就儲備了一批顯卡的 MiniMax 而言,算力還不算卡脖子的問題,但想要讓模型能力更上一層,高質量的標注數據必不可少。

        為了用最低的成本獲取高質量數據,和 B 端的頭部廠商合作是 MiniMax 所選的捷徑。劉啟君分析與 WPS 合作的理由:" 一是 WPS 積累的數據足夠高質,可以直接拿來用;二是 WPS 的業務場景涉及圖片、文字識別、提取、轉換等復雜的場景,可以借此打磨模型能力。"

        不過具體到對 B 端場景的選擇," 增值派 " 和 " 聚焦派 " 選擇的是截然不同的兩條路徑。

        " 拿著錘子找釘子 ",即場景的橫向擴張,多年來是具有豐富客戶資源、的 " 增值派 " 大廠的標配。

        "(大廠商)最主要的考量是用大模型業務帶動大廠的其他業務,比如云、芯片。" 一名參加展會的券商告訴 36 氪。比如,對于 BTA、華為等具有云計算優勢的廠商而言,將通用大模型的 API 服務與云計算結合,就能做訓練、微調和部署等端到端的好生意。

        不過,捆綁銷售的策略也意味著 " 增值派 " 的服務對象往往是本身具有雄厚經濟實力的政府和國央企——客戶只需拿出數據,企業就能提供模型精調、部署等全套服務。36 氪從阿里云工作人員和多個咨詢客戶的口中了解到,通義千問的私有化部署方案,目前給出的參考價格高達百萬、甚至千萬元一年。

        與之相對的," 聚焦派 " 則往往從 B 端企業的細分需求切入,除了能在較短時間內創收,也能與相繼發布通用模型的 BTA 等云廠商打差異化策略。

        比如第四范式和瀾舟科技布局的重點,往往都延續了之前就有客戶積累和工程經驗的 B 端場景。第四范式這次 WAIC 帶來了 " 式說 " 大模型的一些行業進展,其中一個行業案例是與一家零售企業的合作,此前,決策類的 AI 技術已經被廣泛應用在電子菜單推薦系統的開發,如今基于大模型的生成式 AI,開始逐漸被應用于對門店管理系統的改造。

        在談及周圍 " 廠均 " 拋出十多個行業模型方案,胡時偉告訴 36 氪,他并不擔心大廠造成的競爭壓力,因為先找到釘子比拿著錘子更重要:" 我要再次強調,模型研發和落地之間有鴻溝。"

        而企業瞄準 B 端發力的目的,最終是讓造輪子和造車兩條腿一起走起來。

        與大部分廠商一樣,MiniMax 仍然有對標 OpenAI 的野心。" 我們只做一個通用大模型基座,不做分開做行業大模型。" 劉啟君覺得現階段 MiniMax 這樣資源有限的企業需要集中算力、數據和金錢資源辦大事,即提升通用模型的能力。他透露,目前 MiniMax 能夠按周迭代模型能力。

        7 月 6 日的 WAIC 開幕式上," 深度學習之父 " 楊立昆重申 "LLM 不會是那條通往人類智能的道路 "。這也讓許多廠商嘗試跳脫出 Transformer 的框架,去做創新。" 做創新性的研究,包括和學界合作是國內廠商今年開始很重要的命題。" 胡時偉說。

        關鍵詞:

        責任編輯:hnmd003

        相關閱讀

        相關閱讀

        推薦閱讀

        亚洲天堂一区在线| 亚洲日韩中文字幕天堂不卡| 亚洲成a人片在线观看中文!!!| 国产AV无码专区亚洲AV毛网站| 亚洲日本韩国在线| 亚洲国产成人久久综合区| 亚洲国产精品成人AV在线| 亚洲午夜精品一区二区麻豆| 亚洲精品第一国产综合野| 亚洲a级在线观看| 亚洲自国产拍揄拍| 国产成人亚洲综合一区| 亚洲人成77777在线播放网站不卡 亚洲人成77777在线观看网 | 亚洲五月综合网色九月色| 亚洲videosbestsex日本| 亚洲va在线va天堂va手机| 国产成人精品日本亚洲专 | 日本系列1页亚洲系列| 久久精品国产亚洲av瑜伽| WWW国产亚洲精品久久麻豆| | 激情小说亚洲色图| 亚洲成av人片一区二区三区| 亚洲精品专区在线观看| 337p日本欧洲亚洲大胆裸体艺术| 中文字幕第一页亚洲| 亚洲精品成人无码中文毛片不卡| 久久久亚洲欧洲日产国码农村| 亚洲AV区无码字幕中文色| 亚洲理论精品午夜电影| 亚洲国产精品综合久久20| 亚洲熟女精品中文字幕| 亚洲JIZZJIZZ妇女| 亚洲精品国产va在线观看蜜芽| 中文字幕无码精品亚洲资源网| 国产精品亚洲片在线观看不卡 | 亚洲日韩乱码中文无码蜜桃臀网站| 亚洲国产成人高清在线观看| 亚洲午夜在线电影| 亚洲综合丁香婷婷六月香| 色偷偷噜噜噜亚洲男人|