大模型激戰(zhàn)半年:王小川進(jìn)擊、王慧文退場,騰訊字節(jié)姍姍來遲
本文來源:時(shí)代財(cái)經(jīng) 作者:謝斯臨
(資料圖片僅供參考)
國產(chǎn)通用大模型的混戰(zhàn)遠(yuǎn)未結(jié)束。在半年左右的蟄伏期過后,大部分玩家都浮出了水面。
在這之中,有人加速迭代。8 月 8 日,由搜狗搜索創(chuàng)始人王小川創(chuàng)立的百川智能發(fā)布了旗下第三款大模型產(chǎn)品 Baichuan-53B,背后訓(xùn)練參數(shù)高達(dá) 530 億。此時(shí)距離王小川宣布進(jìn)軍大模型戰(zhàn)場不過 4 個(gè)月的時(shí)間,這家創(chuàng)業(yè)公司進(jìn)展神速。
這還只是一個(gè)開始,百川智能方面向時(shí)代財(cái)經(jīng)透露,后續(xù)還會有多款產(chǎn)品發(fā)布,包括規(guī)模更大、參數(shù)超千億的大模型。
也有人黯淡退場。由美團(tuán)聯(lián)合創(chuàng)始人王慧文創(chuàng)立,吸引源碼資本、五源資本等知名 VC 機(jī)構(gòu),以及美團(tuán)創(chuàng)始人王興、快手創(chuàng)始人宿華等互聯(lián)網(wǎng)大佬投資的光年之外,曾一度被市場認(rèn)為是國內(nèi)大模型戰(zhàn)場上最強(qiáng)有力的玩家之一。
然而,隨著 6 月下旬王慧文因健康問題離崗?fù)顺觯瑹o法繼續(xù)執(zhí)掌光年之外,這家備受期待的大模型創(chuàng)業(yè)公司只能賣身美團(tuán),一眾投資人也隨之退股。
還有人另辟蹊徑。AI 大牛周明創(chuàng)立的瀾舟科技,強(qiáng)調(diào)輕量化模型,希望用更低的成本解決 B 端場景問題。而曾幫助谷歌將 BERT 模型的訓(xùn)練時(shí)間從 3 天降到 76 分鐘的新加坡國立大學(xué)校長青年教授尤洋,則成立了潞晨科技,試圖用低成本訓(xùn)練大模型的解決方案突圍。
相比之下,大廠自研的大模型則姍姍來遲。直到 8 月初,騰訊自研的混元大模型和字節(jié)打造的 AI 對話類產(chǎn)品 Grace 才先后傳出內(nèi)測消息,具體面世時(shí)間仍未可知。
同樣停留在測試階段的,還有李開復(fù)創(chuàng)立的 AI 2.0 企業(yè) " 零一萬物 "。在 7 月 3 日舉辦的對外交流會上,李開復(fù)透露,該公司在三個(gè)月內(nèi)已實(shí)現(xiàn)百億參數(shù)規(guī)模的模型內(nèi)測,目前正向 300 億— 700 億參數(shù)規(guī)模擴(kuò)大。不過,該產(chǎn)品至今仍未向市場開放。
這些仍未發(fā)布的大模型產(chǎn)品將為科技行業(yè)帶來什么樣的改變,值得市場期待。從這個(gè)角度來看,這場混戰(zhàn)或許還要持續(xù)很久。
進(jìn)擊的王小川
由王小川創(chuàng)立的百川智能,正以其驚人的產(chǎn)品發(fā)布速度吸引市場的關(guān)注。
在其 4 月宣布下場做大模型后,僅用了兩個(gè)月零五天的時(shí)間,就在 6 月 15 日發(fā)布 70 億參數(shù)開源大模型 Baichuan-7B。不到一個(gè)月時(shí)間,又發(fā)布了 130 億參數(shù)開源大模型 Baichuan-13B。
8 月 8 日發(fā)布的 Baichuan-53B,已經(jīng)是這家大模型創(chuàng)業(yè)公司半年內(nèi)發(fā)布的第三款產(chǎn)品,百川智能進(jìn)展神速。
百川智能相關(guān)負(fù)責(zé)人回復(fù)時(shí)代財(cái)經(jīng)表示,公司在創(chuàng)立之前就已經(jīng)花了很多時(shí)間做前期準(zhǔn)備,開始就把路線和方法想得比較清楚。
其指出,做大模型都會考慮三個(gè)層面:數(shù)據(jù)、算法和算力。拋開算力不說,做搜索的公司天然有優(yōu)秀的數(shù)據(jù)能力,百川智能的核心團(tuán)隊(duì)此前已經(jīng)做了 20 年的數(shù)據(jù)抓取、抽取、清洗、去重、反垃圾等操作,可以更快拿到高質(zhì)量數(shù)據(jù)集。
而算法是以自然語言處理為中心,將算法工程進(jìn)行迭代,不是單一的工程問題,而是在文本數(shù)據(jù)驅(qū)動下,算法和工程共同運(yùn)行。此前在搜索領(lǐng)域積累的經(jīng)驗(yàn)在這里也能很好地發(fā)揮作用,利用數(shù)據(jù)評價(jià)推動模型進(jìn)步。
" 有了之前多年的技術(shù)和經(jīng)驗(yàn)積累,百川智能做大模型產(chǎn)品的速度才會又快又好。"
不過,在發(fā)布會上,王小川亦指出,當(dāng)下國產(chǎn)通用大模型仍處在一個(gè)分型復(fù)刻的階段。各家廠商基本都在對標(biāo) OpenAI,不可避免地會出現(xiàn)同質(zhì)化的問題。
正因如此,在他看來,與美國閉源大模型的頭部格局已定的情況不同," 中國誰的大模型最好 " 現(xiàn)在并沒有結(jié)論。在這場混戰(zhàn)之中,錢是重要的,但最終決定的力量還是人和團(tuán)隊(duì)、組織能力。大廠錢多、人多、算力多,但組織效率通常不一定夠好,創(chuàng)業(yè)公司的組織效率可能好,也可能不好。
" 大家都在爭取機(jī)會,而且不一定落在大廠里。"
王小川還在采訪中談及退場的王慧文。其指出,王慧文是國內(nèi)幾個(gè)主流做大模型里唯一一個(gè)沒有強(qiáng)勢技術(shù)背景的,對他的挑戰(zhàn)比其他家要大。工作中要做大量的技術(shù)決策,招什么人、走什么技術(shù)路線圖、需要多少計(jì)算資源,一定會面臨非常多的決策壓力。
" 不是做大模型壓力大,是沒有技術(shù)背景做決策壓力會大很多。但是技術(shù)足夠的話,其實(shí)挺愉悅的。"
騰訊、字節(jié)姍姍來遲
大模型混戰(zhàn)開啟之初,互聯(lián)網(wǎng)大廠因?yàn)樽鴵砀嗨懔Α⑷瞬拧①Y金和數(shù)據(jù),被認(rèn)為是強(qiáng)大的競爭對手。
百度自研的文心一言早在今年 3 月底就已率先落地;阿里打造通義千問緊隨其后,在 4 月 11 日舉辦的阿里云峰會上揭曉。就在阿里發(fā)布通義千問的前一天,王小川才剛剛宣布下場,成立百川智能。
相比之下,同為一線大廠的騰訊跟字節(jié),推出通用大模型的步調(diào)要慢許多。
8 月 3 日,據(jù) 36kr 報(bào)道,騰訊自研的 " 騰訊混元大模型 " 已經(jīng)進(jìn)入應(yīng)用內(nèi)測階段。三天后,8 月 6 日,字節(jié)旗下的 AI 對話類產(chǎn)品 Grace 也被爆出歷經(jīng)兩個(gè)月的研發(fā)后,終于進(jìn)入測試階段。
此時(shí)距離百度發(fā)布文心一言已經(jīng)過去 4 個(gè)月。對于騰訊通用大模型產(chǎn)品步調(diào)稍慢的原因,馬化騰曾公開表示," 騰訊也一樣在埋頭研發(fā),但是并不急于早早做完,把半成品拿出來展示。"
不過," 并不著急 " 的騰訊,還是在今年 6 月中旬率先公布了 " 行業(yè)大模型 " 的路線,一口氣拋出 10 大行業(yè)超過 50 個(gè)解決方案。無獨(dú)有偶,字節(jié)跳動也同樣在 6 月發(fā)布大模型服務(wù)平臺 " 火山方舟 ",通過集成多家 AI 科技公司及科研院所的大模型,向企業(yè)提供全方位的平臺服務(wù)。
市場曾一度認(rèn)為,行業(yè)大模型將成為這兩家大廠突圍的方法。
但事實(shí)或許并非如此。當(dāng)下被鼓吹的行業(yè)大模型始終存在著被替代的風(fēng)險(xiǎn)。科大訊飛總裁吳曉如曾向時(shí)代財(cái)經(jīng)指出,10 年前,在語音識別技術(shù)上,也曾誕生過諸多聚焦在通話、行車、辦公等不同場景的專用模型,但隨著通用模型技術(shù)的成熟,專用模型也隨之退場。
" 我認(rèn)為大模型也會經(jīng)歷一樣的階段。"
相比之下,從更長遠(yuǎn)角度看,通用大模型才真正代表著一個(gè)平臺級或顛覆性的大機(jī)會。正是因此,騰訊和字節(jié)都不可能放任自己錯(cuò)過,哪怕進(jìn)度緩慢,但它們必定要堅(jiān)持在場。
有騰訊內(nèi)部人士向時(shí)代財(cái)經(jīng)指出,騰訊的計(jì)劃一直是兩條腿走路,通用和行業(yè)齊頭并進(jìn)。只是與一些激進(jìn)的廠商相比,旗下產(chǎn)品涵蓋社交、游戲、廣告、內(nèi)容創(chuàng)作等多個(gè)領(lǐng)域的騰訊,要更為謹(jǐn)慎一些。
學(xué)院派創(chuàng)業(yè)者另辟蹊徑
在大模型戰(zhàn)場上,來自高校、研究機(jī)構(gòu)的學(xué)院派創(chuàng)業(yè)公司組成了競爭的第三極。
它們既不是王小川、王慧文這樣的種子選手,在創(chuàng)業(yè)之初就能憑借人脈吸引到數(shù)億美元的投資,并以此迅速起步。也不像騰訊、阿里、百度這樣的大廠,在算力、人才、資金等各個(gè)方面都占據(jù)難以逾越的優(yōu)勢。
但憑借著他們對于人工智能技術(shù)的深度理解,這些創(chuàng)業(yè)者仍然能在夾擊之下,另辟蹊徑找到新的發(fā)展方向。
比如由原微軟亞洲研究院副院長周明創(chuàng)立的瀾舟科技,不同于市面上一眾追逐千億乃至萬億參數(shù)的大模型產(chǎn)品,這位從 1980 年就開始研究 NLP(自然語言處理)的華人 AI 大牛希望以更輕量級模型解決 B 端場景的問題。
其推出的孟子大模型曾以十億參數(shù),刷新此前被百億、千億級別參數(shù)模型輪番霸榜的中文語言理解權(quán)威評測基準(zhǔn) CLUE 榜單。
這是一項(xiàng)務(wù)實(shí)的決策。出于數(shù)據(jù)安全考慮,絕大部分企業(yè)都不會將數(shù)據(jù)上傳,而是會要求本地化部署,成本因此被顯著拉高。在接受媒體采訪時(shí),周明指出,哪怕只是本地部署推理,拿訓(xùn)練好的大模型來用,千億參數(shù)大模型也需要 8 到 16 塊 A100,換算下來至少是一兩百萬元的投入," 對很多場景來說,客戶需要便宜和夠用 "。
由新加坡國立大學(xué)校長青年教授尤洋創(chuàng)立的潞晨科技,則希望利用算法技術(shù)降低大模型的調(diào)用成本。
現(xiàn)如今,無論是大廠,還是創(chuàng)業(yè)公司,都必須面對國產(chǎn)大模型同質(zhì)化趨勢愈發(fā)明顯的問題。如果這一問題不被解決,未來大模型極有可能陷入當(dāng)下云服務(wù)廠商面臨的低毛利困境。
尤洋對時(shí)代財(cái)經(jīng)表示,這是因?yàn)榈讓蛹夹g(shù)基座迭代成本過于高昂。他以 GPT 舉例,OpenAI 每一次的訓(xùn)練成本高達(dá) 6000 萬美元,每隔三四個(gè)月就需要訓(xùn)練一次,迭代一次則需要四五次訓(xùn)練。以此計(jì)算,每迭代一次技術(shù)基座可能需要 2 億到 3 億美元。
過于高昂的成本導(dǎo)致市場上的技術(shù)基座極其稀缺。基本上只有 GPT、LLAMA,還有國內(nèi)的 GLM。各家廠商基本都是在模仿這幾家大模型做產(chǎn)品,才導(dǎo)致了同質(zhì)化的問題愈發(fā)凸顯。
長期研究高性能計(jì)算的尤洋因此成立了潞晨科技。該公司目前推出的開源系統(tǒng) Colossal-AI 可通過高效多維并行、異構(gòu)內(nèi)存等技術(shù),顯著降低 AI 大模型訓(xùn)練、微調(diào)和推理的開發(fā)與應(yīng)用成本。
尤洋認(rèn)為,只有伴隨大模型訓(xùn)練成本快速下降,或者采取更好的優(yōu)化技術(shù),使得參數(shù)控制在 200 億左右,還依然能夠達(dá)到和千億參數(shù)一樣的效果時(shí),才會真正迎來大模型百花齊放的那一天。
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
大模型激戰(zhàn)半年:王小川進(jìn)擊、王慧文退場,騰訊字節(jié)姍姍來遲
本文來源:時(shí)代財(cái)經(jīng)作者:謝斯臨圖片來源:Pixabay國產(chǎn)通用大模型的混
2023-08-13
相關(guān)閱讀
-
大模型激戰(zhàn)半年:王小川進(jìn)擊、王慧文退場,騰訊字節(jié)姍姍來遲
本文來源:時(shí)代財(cái)經(jīng)作者:謝斯臨圖片來源:Pixabay國產(chǎn)通用大模型的混
-
郵輪市場迎政策利好 赴日韓出境團(tuán)隊(duì)游市場開放提振復(fù)蘇信心
8月10日,文化和旅游部發(fā)布了第三批恢復(fù)出境團(tuán)隊(duì)游的國家和地區(qū)名單,
-
488 家藥企去年銷售費(fèi)用超 3000 億,學(xué)術(shù)會議卷入反腐風(fēng)暴,合規(guī)邊界成爭議焦點(diǎn)
本文來源:時(shí)代財(cái)經(jīng)作者:文若楠張羽岐圖片來源:圖蟲創(chuàng)意醫(yī)藥醫(yī)療反腐
-
大模型激戰(zhàn)半年:王小川進(jìn)擊、王慧文退場,騰訊字節(jié)姍姍來遲
圖片來源:Pixabay國產(chǎn)通用大模型的混戰(zhàn)遠(yuǎn)未結(jié)束。在半年左右的蟄伏期
-
法爾克:拜仁拒絕了曼聯(lián)對帕瓦爾的首份報(bào)價(jià)
直播吧8月13日訊法爾克消息,拜仁拒絕了曼聯(lián)給帕瓦爾的首份報(bào)價(jià)。法爾
-
dnf騎士萊恩寵物附魔叫什么 dnf騎士萊恩怎么進(jìn)化
dnf騎士萊恩寵物附魔叫做寵物加持,它可以為寵物增加屬性和技能,提升
-
受強(qiáng)降雨影響 遼東沿海流域碧流河繭場站超警戒水位0.38米
遼寧省遼東沿海流域部分河流出現(xiàn)漲水過程:營口市熊岳河、鞍山市大洋河
-
莫言賬號被封?B 站:傳謠博主已被禁言
8月13日,B站發(fā)布公告稱莫言作家賬號被封是謠言。B站在微信公眾號發(fā)文
-
19歲婚嫁險(xiǎn)一年要交多少?怎么交?
視具體情況而定。 首先,我們需要了解19歲婚嫁險(xiǎn)的保費(fèi)計(jì)算方式。一般
-
團(tuán)建意外險(xiǎn)多少錢?怎么買?
一般來說,團(tuán)建意外險(xiǎn)的價(jià)格在每人每天幾元到幾十元不等。 團(tuán)建意外險(xiǎn)
-
終身壽險(xiǎn)是什么意思?有哪些產(chǎn)品?
終身壽險(xiǎn)是一種長期保障性質(zhì)的壽險(xiǎn)產(chǎn)品,它提供終身的保險(xiǎn)保障。 與其
-
商業(yè)意外險(xiǎn)影響應(yīng)屆生身份嗎?如何購買呢?
不影響。商業(yè)意外險(xiǎn)是一種保險(xiǎn)產(chǎn)品,旨在為被保險(xiǎn)人在意外事故發(fā)生時(shí)提
-
重疾險(xiǎn)包不包括意外險(xiǎn)?要如何選擇購買呢?
不包括,重疾險(xiǎn)和意外險(xiǎn)是兩種不同的保險(xiǎn),它們有著不同的保障范圍和賠
-
中國光大銀行原黨委副書記、副行長張華宇受賄案一審公開宣判
2023年8月11日,山東省菏澤市中級人民法院對中國光大銀行股份有限公司
-
電燒傷皮膚用什么藥好得快(電燒傷)
1、觸電、雷擊均可引起電燒傷。2、電擊傷輕者僅有一過性神志喪失、頭暈
-
婚嫁保險(xiǎn)中途退能退多少?怎么退?
可以。 首先,我們需要明確一點(diǎn),婚嫁保險(xiǎn)是一種長期保險(xiǎn)產(chǎn)品,通常保
-
重疾險(xiǎn)交多少年可以返還?買哪種類型的好呢?
重疾險(xiǎn)的返還期限是根據(jù)不同保險(xiǎn)公司的產(chǎn)品設(shè)計(jì)而定的。一般來說,重疾
-
企業(yè)給員工買意外險(xiǎn)的好處有哪些?是怎么買的?
首先,企業(yè)給員工買意外險(xiǎn)可以提高員工的工作積極性和幸福感。員工是企
-
健康福星增額終身重大疾病保險(xiǎn)怎么樣?有什么亮點(diǎn)?
總體看來還不錯(cuò)。 健康福星增額終身重大疾病保險(xiǎn)保障內(nèi)容還是比較充分
-
重疾險(xiǎn)生效多長時(shí)間可以理賠?怎么理賠?
視具體情況而定。 1 合同生效即可理賠。有些重疾險(xiǎn)產(chǎn)品在合同生效后即
-
臨電“轉(zhuǎn)正” “電”亮百姓美好生活
“感謝你們的優(yōu)質(zhì)服務(wù),讓我們小區(qū)的臨電問題終于得到解決。”近日,包
-
廣東海事局發(fā)布航行警告:8月14日南海海域預(yù)計(jì)有火箭殘骸落區(qū)
據(jù)中國海事局網(wǎng)站消息,廣東海事局發(fā)布粵航警136 23,南海,8月14日13
-
快手公開 AIGC 方案,助力短視頻創(chuàng)作全流程提效
日前,快手方面在上海召開了以熱愛,讓收獲更多為主題的2023快手光合創(chuàng)
-
iTunes Movie Trailers 將會全面并入 Apple TV
日前有消息顯示,蘋果方面已更新了iTunesMovieTrailers應(yīng)用,并在頂部
-
維珍銀河日前已完成首次商業(yè)載人太空旅行任務(wù)
此前在今年6月,太空旅游公司維珍銀河完成代號為Galactic01的發(fā)射任務(wù)
-
忘掉碧桂園!萬科突然宣布!!
01天雷滾滾,一個(gè)接一個(gè)。這幾天地產(chǎn)圈又一次炸鍋了。先是碧桂園突然宣
-
豐田正考慮推出插混 / 燃料電池 / 純電版普拉多車型
IT之家8月13日消息,據(jù)外媒AutomotiveNews本周六報(bào)道,豐田汽車在8月2
-
電信詐騙,怎樣騙走我 100 萬?
詐騙套路千千萬,總有一個(gè)坑到你。定焦(dingjiaoone)原創(chuàng)作者|向園布
-
《永劫無間》受身博弈機(jī)制一覽
一個(gè)游戲中,最令人感到困擾的就是遇到《永劫無間》受身博弈機(jī)制一覽,
-
荷的多音字的組詞是什么(ldquo 荷 rdquo 的多音字組詞有哪些)
1、[hé]荷花荷包荷塘荷錢荷得紫荷芋荷荷寵揚(yáng)荷荷眷膺荷荷睠媿荷所荷荷
精彩推薦
- 羌塘草原景色美
- 西藏林芝市森林消防開展進(jìn)山入林實(shí)戰(zhàn)化訓(xùn)練
- 今年以來西藏累計(jì)收回財(cái)政存量資金126.99億元
- 中華美食 西藏味道“美食新煮意” 傳...
- 風(fēng)雪運(yùn)維路上的王勝利:12載堅(jiān)守青藏聯(lián)...
- “雪域江南”:正是八月好風(fēng)光 綠水青...
- 昌都市第九屆三江茶馬文化藝術(shù)節(jié)將于8月...
- 西藏加快推進(jìn)362個(gè)農(nóng)村公路通暢項(xiàng)目
- 院士進(jìn)藏助力神經(jīng)外科醫(yī)學(xué)發(fā)展
- 西藏那曲恰青賽馬節(jié)開幕
閱讀排行
精彩推送
- 買終身重疾險(xiǎn)好不好?怎么買?
- 兒童意外險(xiǎn)能賠付多少錢?怎么賠...
- 學(xué)生意外險(xiǎn)多久可以報(bào)銷打款?怎...
- 重疾險(xiǎn)如何購買才最劃算呢?要交...
- 意外險(xiǎn)可以買當(dāng)天的嗎?怎么買?
- 王傳福哭著要在一起,但長城想打...
- 沙漠上的一個(gè)個(gè)“神秘怪圈”,真...
- 小米 MIX Fold 3 公布首支產(chǎn)...
- iPhone 14 電池為啥如此不耐用...
- 電影市場冰火兩重天:票房爆火創(chuàng)...
- 沙特豪門拼了!6個(gè)月3輸決賽,全...
- 二級建造師合格分?jǐn)?shù)線各地區(qū) 二...
- 當(dāng)天生效的運(yùn)動意外險(xiǎn)有哪些?在...
- 員工意外險(xiǎn)理賠流程是什么?要注...
- 深圳政府30元重疾險(xiǎn)保障范圍是什...
- 60萬的意外險(xiǎn)多少錢一個(gè)月啊?怎...
- 平安智慧星意外險(xiǎn)報(bào)銷比例是多少...
- 488家藥企去年銷售費(fèi)用超3000億...
- 上汽通用五菱周钘:寶駿品牌明年...
- 網(wǎng)友稱岳陽機(jī)場停車場禁止特斯拉...
- AIGC+ 游戲:一個(gè)被忽視的長賽道
- 日本年輕人遠(yuǎn)離“鐵飯碗”:全國...
- 建議幫幫碧桂園、龍湖等優(yōu)質(zhì)民營...
- 房本滿兩年和滿五年的區(qū)別(買二...
- 50歲的老寡婦真以為自己是處女,...
- 人壽的重疾險(xiǎn)可以退嗎?怎么退?
- 重疾險(xiǎn)的坑有哪些?多少錢?
- 公司意外險(xiǎn)多少錢一個(gè)月?有什么...
- 365元意外險(xiǎn)保障范圍包含哪些?...
- 虎牙大變局:營收頹勢下初創(chuàng)團(tuán)隊(duì)...