首頁 > 新聞 > 智能 > 正文

        騰訊推出混元大模型,已接入騰訊會議、微信搜一搜等 50 多個騰訊業(yè)務(wù)和產(chǎn)品

        2023-09-07 18:12:17來源:ZAKER科技  

        騰訊補上了大模型布局中最重要的一塊拼圖。


        (相關(guān)資料圖)

        9 月 7 日,在 2023 騰訊全球數(shù)字生態(tài)大會上,騰訊混元大模型正式亮相,并宣布通過騰訊云對外開放。騰訊介紹,混元大模型是由騰訊全鏈路自研的通用大語言模型,具備強大的中文創(chuàng)作能力,復(fù)雜語境下的邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力。

        馬化騰此前曾經(jīng)表示騰訊不急于推出大模型半成品。但很顯然,首次亮相的混元大模型不可能是通俗意義上的「完美版」。對此,騰訊集團副總裁蔣杰將當(dāng)下推出的混元大模型,定義成一個「可用」「可實踐」的版本。

        「我們一直在演進我們的能力,從大語言模型到文生圖,到今天演講最后非常科技感的視頻,也是混元生成的視頻。」蔣杰說,「我們今天的發(fā)布只是一個開始,還不值得大家對我們有很高的要求,我希望我們每個月都會給大家驚喜。」

        此前在今年 6 月和 7 月,騰訊先后發(fā)布了面向 B 端客戶的騰訊云 MaaS 解決方案和 AI 原生向量數(shù)據(jù)庫 Tencent Cloud VectorDB,加上此次發(fā)布的自研通用大模型,騰訊已經(jīng)搭建起一套包含通用大模型、云服務(wù)平臺、向量數(shù)據(jù)庫的完整大模型產(chǎn)品服務(wù)體系。

        大模型時代,所有的軟件服務(wù)都將被重塑。騰訊旗下的社交、游戲、娛樂、金融等產(chǎn)品擁有廣泛的 C 端和 B 端用戶,騰訊也在加快用大模型升級這些產(chǎn)品的進程。

        目前,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ 瀏覽器等超過 50 個騰訊業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測試,并取得初步效果。此外,混元大模型也將作為騰訊云 MaaS 服務(wù)的底座,客戶不僅可以直接通過 API 調(diào)用混元,也可以將混元作為基底模型,為不同產(chǎn)業(yè)場景構(gòu)建專屬應(yīng)用。

        會上,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群 CEO 湯道生表示,騰訊將邁入「全面擁抱大模型」時代。騰訊集團副總裁蔣杰進一步表示:「我們研發(fā)大模型的目標不是在評測上獲得高分,而是將技術(shù)應(yīng)用到實際場景中。」

        混元大模型

        今年 6 月,騰訊發(fā)布了行業(yè)大模型及大模型的工具鏈 TI 平臺。但對其通用大模型,一直被傳在公司內(nèi)部應(yīng)用測試。

        在今日舉辦的 2023 騰訊全球數(shù)字生態(tài)大會上,騰訊自己的通用大模型——混元大模型,終于亮相。

        騰訊云 MaaS 服務(wù)全景圖丨拍攝:極客公園

        在現(xiàn)場演示中,混元大模型揭開了「自己」的神秘面紗。現(xiàn)場,工作人員向混元大模型進行了一系列提問:

        混元是誰?

        混元的核心技術(shù)架構(gòu)是什么?

        混元模型參數(shù)量多大?

        混元訓(xùn)練數(shù)據(jù)截止什么時候?(今年 7 月,每個月不斷迭代)

        混元大模型,你有什么特點、優(yōu)點?

        據(jù)混元大模型自述,它擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超 2 萬億 tokens,是騰訊自研的通用大模型。就其能力而言,騰訊方面表示,混元大模型的中文能力超過 GPT3.5,英文能力目前比 GPT3.5 差。此外,騰訊還自研了機器學(xué)習(xí)框架 Angel,使訓(xùn)練速度相比業(yè)界主流框架提升 1 倍,推理速度比業(yè)界主流框架提升 1.3 倍。

        現(xiàn)場,騰訊集團副總裁蔣杰介紹道,訓(xùn)練燒錢、百模大戰(zhàn),在投入大模型時騰訊在期待什么?他認為是更成熟,更可靠的大模型

        但在技術(shù)手段上,他稱,搜索增強、知識圖譜,通過這些通過外掛、開卷考試,來解決大模型的「幻覺」等不可靠問題,存在局限性。在接受采訪時,蔣杰進一步解釋道:「盡管這些技術(shù)我們也會用,但是比例不是很高,混元大模型是在大模型的預(yù)訓(xùn)練階段,來控制這個問題」。據(jù)悉,騰訊在預(yù)訓(xùn)練階段通過「探真」算法進行事實修正,讓混元大模型出現(xiàn)幻覺的概率降到最低。

        他補充說,更成熟、更可靠的大模型,是一個拼細節(jié)的過程。「大家都知道什么叫強化學(xué)習(xí),都知道大語言模型是通過 Transformer 來做、通過 decode 來做,但每個公司做的效果都不一樣。這需要在算法、工程、數(shù)據(jù)標注的完整性等一系列綜合能力上,摳細節(jié)。」

        騰訊方面稱,針對大模型容易「胡言亂語」的問題,騰訊優(yōu)化了預(yù)訓(xùn)練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了 30% 至 50%;通過強化學(xué)習(xí)的方法,讓模型學(xué)會識別陷阱問題;通過位置編碼優(yōu)化,提高了超長文的處理效果和性能;提出思維鏈的新策略,讓大模型能夠像人一樣結(jié)合實際的應(yīng)用場景進行推理和決策。

        對于混元大模型何時開始研發(fā),蔣杰稱,從 2020 年開始,騰訊一直在跟進和投入這樣的技術(shù)能力,最早起于 400 GB、用于支撐廣告業(yè)務(wù)的稀疏大模型,并不是現(xiàn)在看到的稠密大模型。當(dāng)時,這一模型使得 GMV 提升了大約 13%,在這之后,騰訊對大模型的投入和積累逐漸增加。

        在中國信通院《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用的評估方法》的標準符合性測試中,混元大模型共測評 66 個能力項,在「模型開發(fā)」和「模型能力」兩個重要領(lǐng)域的綜合評價均獲得了當(dāng)前的最高分。在主流的評測集 MMLU、CEval 和 AGI-eval 上,混元大模型均有優(yōu)異的表現(xiàn),特別是在中文的理科、高考題和數(shù)學(xué)等子項上表現(xiàn)突出。

        騰訊大模型的決戰(zhàn),還是在產(chǎn)品

        騰訊自研通用大模型的首次亮相在主要大廠中并不算早。從今天披露的進展來看,技術(shù)上也很難說明顯的差異或者突破性的變革,就像騰訊高管自己說的那樣,混元大模型才剛剛起步,今天還不能對其有太多不切實際的要求。

        但這不意味著騰訊就是這場競爭中的陪跑。雖然大模型的基礎(chǔ)能力和積累上騰訊沒有太多優(yōu)勢,但推動大模型落地,騰訊強大的產(chǎn)品和其背后廣闊的用戶體量,就是其最大的優(yōu)勢所在。

        就在發(fā)布會的前一天,微信向一部分受邀用戶開放了「騰訊混元助手」小程序,這是一款騰訊混元大模型多模態(tài)對話 Bot 產(chǎn)品,可以回答各類問題,也能處理多種任務(wù),如:獲取知識、解決數(shù)學(xué)問題、翻譯、提供旅游攻略、工作建議等,也能進行 AI 繪畫。

        大模型本身只是一項技術(shù),落地到真正的場景需要解決產(chǎn)品、用戶、運營等一系列具體的問題,這也是為什么大模型廠商需要找第三方合作。但當(dāng)下構(gòu)建大模型的門檻越來越低,有場景的更愿意開發(fā)自己的大模型,這就讓云服務(wù)商的定位越來越像一個提供開發(fā)平臺和算力的供應(yīng)商,巨大投入自研的通用大模型,卻不容易找到場景。

        而騰訊是中國最大的軟件服務(wù)商,社交有微信、QQ 兩個 10 億用戶級的產(chǎn)品,游戲能占到中國市場四成甚至更多的市場份額,旗下還有著中國前兩大的支付工具,前三大的視頻平臺,前三大的短視頻平臺,以及中國最大的音樂 App、網(wǎng)文 App,此外在辦公領(lǐng)域,騰訊會議、騰訊文檔、企業(yè)微信等產(chǎn)品也有著領(lǐng)先的市場份額。

        混元大模型就像是一個生在金礦上的「孩子」,別人都是拿著錘子找釘子,騰訊最不缺的就是釘子。會上公布 50 多個騰訊產(chǎn)品已經(jīng)接入混元大模型,其中數(shù)億級用戶的產(chǎn)品比比皆是,比如有 4 億用戶的騰訊會議,覆蓋 6 億用戶的騰訊廣告、也有幾億用戶的騰訊文檔。

        會上,蔣杰展示了騰訊會議、騰訊文檔、騰訊廣告等多個業(yè)務(wù)在接入騰訊混元大模型后的實際應(yīng)用情況。

        比如騰訊會議基于混元大模型打造了AI小助手,只需要簡單的自然語言指令,就能完成會議信息提取、內(nèi)容分析等復(fù)雜任務(wù),會后還能生成智能總結(jié)紀要。據(jù)實測,在指令理解、會中問答、會議摘要、會議待辦項等多個方面,混元大模型均獲得較高的用戶采納率。

        騰訊會議 AI 助手丨來自:騰訊

        在文檔處理方面,騰訊混元大模型支持數(shù)十種文本創(chuàng)作場景,在騰訊文檔推出的智能助手功能中已有應(yīng)用。同時,混元還能夠一鍵生成標準格式文本,精通數(shù)百種 Excel 公式,支持自然語言生成函數(shù),并基于表格內(nèi)容生成圖表,目前這些功能正在內(nèi)測階段,將在成熟后面向用戶開放。

        在廣告業(yè)務(wù)場景,騰訊混元大模型支持智能化的廣告素材創(chuàng)作,能夠適應(yīng)行業(yè)與地域特色,滿足千人千面的需求,實現(xiàn)文字、圖片、視頻的自然融合。此外,基于混元大模型的能力,廣告智能導(dǎo)購能夠幫助商家在企業(yè)微信等場景,提升服務(wù)質(zhì)量和服務(wù)效率。

        騰訊廣告 AI 創(chuàng)意工具丨來自:騰訊

        蔣杰在接受采訪時表示,其實今天騰訊大模型的應(yīng)用就是跟騰訊業(yè)務(wù)的深度結(jié)合,今天是跟會議的結(jié)合,跟文檔的結(jié)合,那未來可以是跟微信的結(jié)合,QQ 的結(jié)合,是跟騰訊視頻的結(jié)合,騰訊音樂的結(jié)合。

        大模型的發(fā)展不能也不會只靠燒錢推動,一定需要落地到具體的場景產(chǎn)生價值,落的場景越多,使用的用戶越多,產(chǎn)生的商業(yè)價值、數(shù)據(jù)越多,通用大模型的訓(xùn)練成本就會被攤的越薄、推理成本也就降的越低,而模型能力卻會更強,形成互聯(lián)網(wǎng)老生常談的「飛輪效應(yīng)」。

        在這場大模型競爭中,騰訊是最不需要「搶」的那個。做好自己的事情,持續(xù)提升模型能力,做好為現(xiàn)有的產(chǎn)品的賦能和升級,給用戶創(chuàng)造價值,騰訊就足以贏下一張大模型時代的船票。

        關(guān)鍵詞:

        責(zé)任編輯:hnmd003

        相關(guān)閱讀

        相關(guān)閱讀

        精彩推送

        推薦閱讀

        国产精品亚洲天堂| 自拍日韩亚洲一区在线| 亚洲成_人网站图片| 久久狠狠高潮亚洲精品| 亚洲人成电影福利在线播放| 亚洲精品成人无码中文毛片不卡| 久久久久久A亚洲欧洲AV冫| 国产L精品国产亚洲区久久| 国产精品亚洲а∨天堂2021| 国产精品亚洲а∨天堂2021| av无码东京热亚洲男人的天堂| MM1313亚洲国产精品| 国产精品亚洲综合| 亚洲第一区精品观看| 亚洲综合区小说区激情区| 国产精品亚洲不卡一区二区三区 | 亚洲色图综合网站| 亚洲国产精品自在线一区二区| 亚洲AV日韩精品久久久久久| 无码专区—VA亚洲V天堂| 久久久久亚洲精品天堂| 亚洲精品国产福利在线观看| 亚洲国产夜色在线观看| 日韩亚洲国产综合高清| 亚洲国产精品18久久久久久| 国产午夜亚洲精品不卡电影| 亚洲伊人久久综合影院| 亚洲无线码在线一区观看| 亚洲成Av人片乱码色午夜| 亚洲天天做日日做天天看| 亚洲女人初试黑人巨高清| 美女视频黄免费亚洲| 久久亚洲精品无码gv| 亚洲人成网站在线观看青青| 亚洲精品自在在线观看| 亚洲va在线va天堂va888www| 亚洲无限乱码一二三四区| 亚洲综合成人婷婷五月网址| 在线观看亚洲网站| 亚洲人成网77777亚洲色| 亚洲日本在线看片|