騰訊推出混元大模型,已接入騰訊會議、微信搜一搜等 50 多個騰訊業(yè)務(wù)和產(chǎn)品
騰訊補上了大模型布局中最重要的一塊拼圖。
(相關(guān)資料圖)
9 月 7 日,在 2023 騰訊全球數(shù)字生態(tài)大會上,騰訊混元大模型正式亮相,并宣布通過騰訊云對外開放。騰訊介紹,混元大模型是由騰訊全鏈路自研的通用大語言模型,具備強大的中文創(chuàng)作能力,復(fù)雜語境下的邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力。
馬化騰此前曾經(jīng)表示騰訊不急于推出大模型半成品。但很顯然,首次亮相的混元大模型不可能是通俗意義上的「完美版」。對此,騰訊集團副總裁蔣杰將當(dāng)下推出的混元大模型,定義成一個「可用」「可實踐」的版本。
「我們一直在演進我們的能力,從大語言模型到文生圖,到今天演講最后非常科技感的視頻,也是混元生成的視頻。」蔣杰說,「我們今天的發(fā)布只是一個開始,還不值得大家對我們有很高的要求,我希望我們每個月都會給大家驚喜。」
此前在今年 6 月和 7 月,騰訊先后發(fā)布了面向 B 端客戶的騰訊云 MaaS 解決方案和 AI 原生向量數(shù)據(jù)庫 Tencent Cloud VectorDB,加上此次發(fā)布的自研通用大模型,騰訊已經(jīng)搭建起一套包含通用大模型、云服務(wù)平臺、向量數(shù)據(jù)庫的完整大模型產(chǎn)品服務(wù)體系。
大模型時代,所有的軟件服務(wù)都將被重塑。騰訊旗下的社交、游戲、娛樂、金融等產(chǎn)品擁有廣泛的 C 端和 B 端用戶,騰訊也在加快用大模型升級這些產(chǎn)品的進程。
目前,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ 瀏覽器等超過 50 個騰訊業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測試,并取得初步效果。此外,混元大模型也將作為騰訊云 MaaS 服務(wù)的底座,客戶不僅可以直接通過 API 調(diào)用混元,也可以將混元作為基底模型,為不同產(chǎn)業(yè)場景構(gòu)建專屬應(yīng)用。
會上,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群 CEO 湯道生表示,騰訊將邁入「全面擁抱大模型」時代。騰訊集團副總裁蔣杰進一步表示:「我們研發(fā)大模型的目標不是在評測上獲得高分,而是將技術(shù)應(yīng)用到實際場景中。」
混元大模型
今年 6 月,騰訊發(fā)布了行業(yè)大模型及大模型的工具鏈 TI 平臺。但對其通用大模型,一直被傳在公司內(nèi)部應(yīng)用測試。
在今日舉辦的 2023 騰訊全球數(shù)字生態(tài)大會上,騰訊自己的通用大模型——混元大模型,終于亮相。
騰訊云 MaaS 服務(wù)全景圖丨拍攝:極客公園在現(xiàn)場演示中,混元大模型揭開了「自己」的神秘面紗。現(xiàn)場,工作人員向混元大模型進行了一系列提問:
混元是誰?
混元的核心技術(shù)架構(gòu)是什么?
混元模型參數(shù)量多大?
混元訓(xùn)練數(shù)據(jù)截止什么時候?(今年 7 月,每個月不斷迭代)
混元大模型,你有什么特點、優(yōu)點?
據(jù)混元大模型自述,它擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超 2 萬億 tokens,是騰訊自研的通用大模型。就其能力而言,騰訊方面表示,混元大模型的中文能力超過 GPT3.5,英文能力目前比 GPT3.5 差。此外,騰訊還自研了機器學(xué)習(xí)框架 Angel,使訓(xùn)練速度相比業(yè)界主流框架提升 1 倍,推理速度比業(yè)界主流框架提升 1.3 倍。
現(xiàn)場,騰訊集團副總裁蔣杰介紹道,訓(xùn)練燒錢、百模大戰(zhàn),在投入大模型時騰訊在期待什么?他認為是更成熟,更可靠的大模型。
但在技術(shù)手段上,他稱,搜索增強、知識圖譜,通過這些通過外掛、開卷考試,來解決大模型的「幻覺」等不可靠問題,存在局限性。在接受采訪時,蔣杰進一步解釋道:「盡管這些技術(shù)我們也會用,但是比例不是很高,混元大模型是在大模型的預(yù)訓(xùn)練階段,來控制這個問題」。據(jù)悉,騰訊在預(yù)訓(xùn)練階段通過「探真」算法進行事實修正,讓混元大模型出現(xiàn)幻覺的概率降到最低。
他補充說,更成熟、更可靠的大模型,是一個拼細節(jié)的過程。「大家都知道什么叫強化學(xué)習(xí),都知道大語言模型是通過 Transformer 來做、通過 decode 來做,但每個公司做的效果都不一樣。這需要在算法、工程、數(shù)據(jù)標注的完整性等一系列綜合能力上,摳細節(jié)。」
騰訊方面稱,針對大模型容易「胡言亂語」的問題,騰訊優(yōu)化了預(yù)訓(xùn)練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了 30% 至 50%;通過強化學(xué)習(xí)的方法,讓模型學(xué)會識別陷阱問題;通過位置編碼優(yōu)化,提高了超長文的處理效果和性能;提出思維鏈的新策略,讓大模型能夠像人一樣結(jié)合實際的應(yīng)用場景進行推理和決策。
對于混元大模型何時開始研發(fā),蔣杰稱,從 2020 年開始,騰訊一直在跟進和投入這樣的技術(shù)能力,最早起于 400 GB、用于支撐廣告業(yè)務(wù)的稀疏大模型,并不是現(xiàn)在看到的稠密大模型。當(dāng)時,這一模型使得 GMV 提升了大約 13%,在這之后,騰訊對大模型的投入和積累逐漸增加。
在中國信通院《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用的評估方法》的標準符合性測試中,混元大模型共測評 66 個能力項,在「模型開發(fā)」和「模型能力」兩個重要領(lǐng)域的綜合評價均獲得了當(dāng)前的最高分。在主流的評測集 MMLU、CEval 和 AGI-eval 上,混元大模型均有優(yōu)異的表現(xiàn),特別是在中文的理科、高考題和數(shù)學(xué)等子項上表現(xiàn)突出。
騰訊大模型的決戰(zhàn),還是在產(chǎn)品
騰訊自研通用大模型的首次亮相在主要大廠中并不算早。從今天披露的進展來看,技術(shù)上也很難說明顯的差異或者突破性的變革,就像騰訊高管自己說的那樣,混元大模型才剛剛起步,今天還不能對其有太多不切實際的要求。
但這不意味著騰訊就是這場競爭中的陪跑。雖然大模型的基礎(chǔ)能力和積累上騰訊沒有太多優(yōu)勢,但推動大模型落地,騰訊強大的產(chǎn)品和其背后廣闊的用戶體量,就是其最大的優(yōu)勢所在。
就在發(fā)布會的前一天,微信向一部分受邀用戶開放了「騰訊混元助手」小程序,這是一款騰訊混元大模型多模態(tài)對話 Bot 產(chǎn)品,可以回答各類問題,也能處理多種任務(wù),如:獲取知識、解決數(shù)學(xué)問題、翻譯、提供旅游攻略、工作建議等,也能進行 AI 繪畫。
大模型本身只是一項技術(shù),落地到真正的場景需要解決產(chǎn)品、用戶、運營等一系列具體的問題,這也是為什么大模型廠商需要找第三方合作。但當(dāng)下構(gòu)建大模型的門檻越來越低,有場景的更愿意開發(fā)自己的大模型,這就讓云服務(wù)商的定位越來越像一個提供開發(fā)平臺和算力的供應(yīng)商,巨大投入自研的通用大模型,卻不容易找到場景。
而騰訊是中國最大的軟件服務(wù)商,社交有微信、QQ 兩個 10 億用戶級的產(chǎn)品,游戲能占到中國市場四成甚至更多的市場份額,旗下還有著中國前兩大的支付工具,前三大的視頻平臺,前三大的短視頻平臺,以及中國最大的音樂 App、網(wǎng)文 App,此外在辦公領(lǐng)域,騰訊會議、騰訊文檔、企業(yè)微信等產(chǎn)品也有著領(lǐng)先的市場份額。
混元大模型就像是一個生在金礦上的「孩子」,別人都是拿著錘子找釘子,騰訊最不缺的就是釘子。會上公布 50 多個騰訊產(chǎn)品已經(jīng)接入混元大模型,其中數(shù)億級用戶的產(chǎn)品比比皆是,比如有 4 億用戶的騰訊會議,覆蓋 6 億用戶的騰訊廣告、也有幾億用戶的騰訊文檔。
會上,蔣杰展示了騰訊會議、騰訊文檔、騰訊廣告等多個業(yè)務(wù)在接入騰訊混元大模型后的實際應(yīng)用情況。
比如騰訊會議基于混元大模型打造了AI小助手,只需要簡單的自然語言指令,就能完成會議信息提取、內(nèi)容分析等復(fù)雜任務(wù),會后還能生成智能總結(jié)紀要。據(jù)實測,在指令理解、會中問答、會議摘要、會議待辦項等多個方面,混元大模型均獲得較高的用戶采納率。
騰訊會議 AI 助手丨來自:騰訊在文檔處理方面,騰訊混元大模型支持數(shù)十種文本創(chuàng)作場景,在騰訊文檔推出的智能助手功能中已有應(yīng)用。同時,混元還能夠一鍵生成標準格式文本,精通數(shù)百種 Excel 公式,支持自然語言生成函數(shù),并基于表格內(nèi)容生成圖表,目前這些功能正在內(nèi)測階段,將在成熟后面向用戶開放。
在廣告業(yè)務(wù)場景,騰訊混元大模型支持智能化的廣告素材創(chuàng)作,能夠適應(yīng)行業(yè)與地域特色,滿足千人千面的需求,實現(xiàn)文字、圖片、視頻的自然融合。此外,基于混元大模型的能力,廣告智能導(dǎo)購能夠幫助商家在企業(yè)微信等場景,提升服務(wù)質(zhì)量和服務(wù)效率。
騰訊廣告 AI 創(chuàng)意工具丨來自:騰訊蔣杰在接受采訪時表示,其實今天騰訊大模型的應(yīng)用就是跟騰訊業(yè)務(wù)的深度結(jié)合,今天是跟會議的結(jié)合,跟文檔的結(jié)合,那未來可以是跟微信的結(jié)合,QQ 的結(jié)合,是跟騰訊視頻的結(jié)合,騰訊音樂的結(jié)合。
大模型的發(fā)展不能也不會只靠燒錢推動,一定需要落地到具體的場景產(chǎn)生價值,落的場景越多,使用的用戶越多,產(chǎn)生的商業(yè)價值、數(shù)據(jù)越多,通用大模型的訓(xùn)練成本就會被攤的越薄、推理成本也就降的越低,而模型能力卻會更強,形成互聯(lián)網(wǎng)老生常談的「飛輪效應(yīng)」。
在這場大模型競爭中,騰訊是最不需要「搶」的那個。做好自己的事情,持續(xù)提升模型能力,做好為現(xiàn)有的產(chǎn)品的賦能和升級,給用戶創(chuàng)造價值,騰訊就足以贏下一張大模型時代的船票。
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
騰訊推出混元大模型,已接入騰訊會議、微信搜一搜等 50 多個騰訊業(yè)務(wù)和產(chǎn)品
騰訊補上了大模型布局中最重要的一塊拼圖。9月7日,在2023騰訊全球數(shù)字
2023-09-07
相關(guān)閱讀
-
騰訊推出混元大模型,已接入騰訊會議、微信搜一搜等 50 多個騰訊業(yè)務(wù)和產(chǎn)品
騰訊補上了大模型布局中最重要的一塊拼圖。9月7日,在2023騰訊全球數(shù)字
-
華爾街日報:中國公務(wù)員不得用 iPhone 蘋果今年難了?
【手機中國新聞】近日,華爾街日報中文網(wǎng)在社交平臺上發(fā)文稱,中國已要
-
緬北一地官方發(fā)文:針對中國公民的詐騙將全面清理!
據(jù)澎湃新聞9月6日報道,針對緬甸撣邦第二特區(qū)內(nèi)存在的電信詐騙及進而引
-
我,211 碩士,在澳洲送外賣:一單能賺約 30 元,不會因超時和差評被罰款
本文來源:時代財經(jīng)作者:王瑩嶺近日,山東臨沂大學(xué)教師邢斌因送外賣而
-
芯片龍頭重挫超 8%,兩市超 4500 股下跌,情緒冰點后能否迎來修復(fù)
財聯(lián)社9月7日訊,今日17股漲停,15股炸板,封板率為53%,華映科技6天5
-
專家解讀存量房貸利率調(diào)整細則:若未達預(yù)期或還將下調(diào)
fix_video_size(df9e57b247c8b22dc97a83614a21a60e,540,360);【宅男財
-
賣車已救不了長城汽車
原創(chuàng)首發(fā)|金角財經(jīng)(ID:F-Jinjiao)作者|塞爾達長城汽車正面臨嚴峻考驗
-
今年新能源車滲透率數(shù)據(jù)分析 乘聯(lián)會:初步統(tǒng)計8月新能源車市場零售69.8萬輛 同比增長32%
乘聯(lián)會:初步統(tǒng)計8月新能源車市場零售69 8萬輛同比增長32%乘聯(lián)會消息,
-
農(nóng)產(chǎn)品加工業(yè)發(fā)展分析 我國規(guī)模以上農(nóng)產(chǎn)品加工企業(yè)年營收超19萬億元
我國規(guī)模以上農(nóng)產(chǎn)品加工企業(yè)年營收超19萬億元據(jù)央視新聞,從今天開幕的
-
中國制造業(yè)穩(wěn)定恢復(fù) 8月份全球制造業(yè)PMI為48.3% 連續(xù)兩個月環(huán)比上升
8月份全球制造業(yè)PMI為48 3%連續(xù)兩個月環(huán)比上升9月6日,中國物流與采購
-
多家豬企8月銷售收入環(huán)比上升 2023年第35周生豬及豬肉價格分析
多家豬企8月銷售收入環(huán)比上升近日,多家豬企發(fā)布8月生豬銷售業(yè)績,天邦
-
車市迎來政策利好 乘聯(lián)會:初步統(tǒng)計8月乘用車市場零售190.2萬輛 同比增長2%
乘聯(lián)會:初步統(tǒng)計8月乘用車市場零售190 2萬輛同比增長2%乘聯(lián)會消息,初
-
香港保險要去香港買嗎?需要什么證件?
是否要去香港購買保險,需要根據(jù)個人的需求和情況來決定。 首先,香港
-
吉祥樹終身重疾保險怎么樣?保障內(nèi)容有哪些?
總體表現(xiàn)還行。 吉祥樹終身重疾保險是一款由天安人壽吉祥樹終身壽險分
-
香港投資保險理財可靠嗎?有哪些?
可靠的。香港作為國際金融中心,擁有嚴格的金融監(jiān)管制度和健全的法律體
-
團體意外險可以按月購買嗎?幾個人可以買?
可以,但是通常的購買方式是按年購買。然而,隨著市場需求的變化和保險
-
泰康的意外險怎么樣?怎么買?
還可以。 泰康的意外險產(chǎn)品種類繁多,包括個人意外險、兒童意外險、老
-
海底撈“名利雙收”,不斷“整活”背后,是一線創(chuàng)新活力的進一步釋放
疫情期間陷入關(guān)店與虧損的海底撈,在今年上半年,堪稱創(chuàng)造了商業(yè)奇跡,
-
服務(wù)實體守初心,創(chuàng)新變革向未來,鄭州銀行精彩亮相2023年中國國際服務(wù)貿(mào)易交易會
9月2日,由商務(wù)部和北京市人民政府共同主辦的2023年中國國際服務(wù)貿(mào)易交
-
磁盤容量不足,豐田14家日本工廠停工
近日,據(jù)相關(guān)報道陳,豐田在日本的全部14家車輛組裝工廠停工,工廠何時
-
復(fù)云健康擬向現(xiàn)時三方股東借款不超1129萬元
9月6日,復(fù)星醫(yī)藥(02196)發(fā)布公告,公司控股子公司復(fù)云健康擬向現(xiàn)時股
-
融創(chuàng)中國前8月合同銷售額同比減少54.4% 單月同比下降61%
融創(chuàng)中國控股有限公司(簡稱:融創(chuàng)中國,1918 HK)公告披露2023年8月未
-
美團就糾紛案起訴餓了么 曾因不正當(dāng)競爭賠償后者百萬
美團就與餓了么糾紛案件上訴,此前壟斷行為敗訴,被判賠償餓了么100萬
-
信邦制藥截止目前 累計回購公司股份約1522萬股
據(jù)公開信息顯示,截至2023年8月31日,信邦制藥(以下稱公司)累計回購
-
大地鋪金迎豐收
西藏日喀則市年楚河流域是西藏糧食的主產(chǎn)區(qū)之一,今年雨水豐沛,糧食長
-
古村有支“黨員文物保護隊”——走進西藏林芝市工布江達縣錯高鄉(xiāng)錯高村
西藏自治區(qū)林芝市工布江達縣錯高鄉(xiāng)錯高村位于巴松錯景區(qū)盡頭,村落完整
-
第八屆“創(chuàng)客中國”(西藏賽區(qū))暨第二屆“創(chuàng)客中國”中小企業(yè)創(chuàng)新創(chuàng)業(yè)大賽初賽舉辦
月5日上午,第八屆“創(chuàng)客中國”(西藏賽區(qū))暨第二屆“創(chuàng)客中國”中小
-
西藏味道美食體驗周活動閉幕 7天營業(yè)額超1000萬元
6日,為期7天的西藏味道美食體驗周活動正式落下帷幕。此次西藏味道美食
-
拉薩開展打擊欺詐騙保專項檢查全覆蓋工作 計劃檢查全市570家定點醫(yī)藥機構(gòu)
醫(yī)保基金是廣大人民群眾的“治病錢”“救命錢”,加強醫(yī)保基金監(jiān)管是維
-
Costco 擴張,山姆、盒馬迎敵,倉儲式會員超市“三足鼎立”
圖片來源@視覺中國文|鋅財經(jīng),作者|路世明‍‍,編輯|大風(fēng)幾
精彩推薦
閱讀排行
精彩推送
- 出圈又出海,中國原創(chuàng)音樂海外正...
- 別再狂吹數(shù)字人了
- 9.9 元的咖啡時代,最慌的是“...
- 騰訊發(fā)布混元大模型!在微信里有...
- 證監(jiān)會立案!牛股 8 個漲停,...
- 舉報材料瘋傳!分析師評選又見“...
- 高房價、高利率雙重夾擊!美國逾...
- 太空游戲,21 世紀最大的互聯(lián)網(wǎng)...
- 比爾蓋茨的抄底行動:一家走入困...
- 極氪001入列亞運警用服務(wù)車隊
- 中國二冶榮獲“全區(qū)廠務(wù)公開民主...
- 智能網(wǎng)聯(lián)汽車發(fā)展分析 預(yù)測2023...
- 預(yù)計2027 年中國人工智能市場IT...
- 8月份銀行理財規(guī)模增速明顯放緩...
- 服裝家紡公司上半年投資并購力度...
- 智能光伏產(chǎn)業(yè)發(fā)展分析 兩部門:...
- 林芝市人民醫(yī)院婦產(chǎn)科專家前往波...
- 北京市少年宮在拉薩市開展教育援...
- 拉薩市曲水縣扎實推進鄉(xiāng)村人才振興
- 拉薩高新區(qū):舉行食品安全突發(fā)事...
- 誰能調(diào)?怎么調(diào)?詳解四大銀行存...
- 萬科:前8月合同銷售金額2485.9億元
- 中南建設(shè):前8月合同銷售金額同...
- 保利發(fā)展:前8月簽約金額同比增...
- 中海地產(chǎn):前8月合約物業(yè)銷售額...
- 意外險醫(yī)療費用報銷比例是多少?...
- 意外險包含牙齒種植嗎?金額要多...
- 6年全球第一!通威順應(yīng)“N型”趨...
- 駕乘險和意外險區(qū)別在哪?可以一...
- 存量房貸利率調(diào)整細則出爐!四大...