全球報道:大模型時代,商湯怎么做?
當人們紛紛猜測,GPT-4 的參數量,將會在 GPT-3 的 1750 億參數的基礎上如何再增加時,OpenAI 選擇了不公布。這種期待也反應出了一種普遍認知:隨著參數量級的增加,模型的能力會再次躍升。
「今天我們衡量一個模型能力的時候,不能夠簡單來看模型的參數量,而是在以有限的計算量的前提下,來分配資源給參數或者是訓練的數據。」4 月 10 日商湯的科技交流會上,CEO 徐立在開場給出了自己的觀點。
這場為時長一個半小時的發布會上,大部分的時間用于實時演示。跟隨著在舞臺一側、連接大屏幕的電腦,觀眾看到了商湯大模型,用于多輪對話、文本和圖像生成、3D 視覺生成、以及實時互動的各項能力。
(相關資料圖)
大模型是計算「暴力美學」的勝利,描述模型的能力,需要用到參數規模和訓練的數據集。商湯認為,大模型的參數量乘以處理的數據量,就能得到模型的計算量?!肝磥碛懻摯竽P?,希望大家討論的是它的計算量,這才是它的能力。」
扎進人工智能領域 9 年,見證了深度學習到大模型時代更替,商湯也以這場技術交流會,展示了自己將擁抱大模型,并提供全面服務的姿態。
這既包括在通用大模型上的持續推進,也包括結合已有的場景、數據、算力設施優勢,推進大模型的行業應用。商湯認為,多模態大模型的下一步,將是通用人工智能,「我們也會將 AGI 作為核心的發展目標,在未來幾年持續推動大模型和 AGI 技術的突破?!剐炝⒄f。
01 日日新大模型體系
在技術交流會上,商湯科技董事長兼 CEO 徐立發布了「日日新 SenseNova」大模型體系,分別展示了在自然語言生成、圖片視頻內容生成、3D 建模實時交互上的能力。
之所起名為「日日新」,是寓指大模型通過數據閉環,不斷提升能力。「這代表人工智能大模型,在以周為單位的數據輸入上,可以日日更新,能力日日增強?!?/p>商湯 CEO 徐立介紹「日日新 sensenova」大模型體系
技術路線圖顯示,商湯在 2019 年開始探索大模型,訓練了 10 億參數級別的視覺大模型,到了 2022 年,已經訓練了 320 億參數級別的大模型。
前不久的 3 月,商湯開源了有 30 億參數的書生 2.5 多模態大模型。在架構上,運用兼容解碼的 Uni- Perceiver 架構。這是為了將圖像、視頻、語言不同模態的信息,以同一種方式在一個空間進行編碼。這樣的設計也體現了商湯對未來模型發展的思考,希望能夠以一個更強大的底層模型,兼容不同的下游任務。
此次的「日日新 SenseNova」大模型體系不同場景的演示,也展示了商湯較為全面的技術積累。
自研語言大模型「商量」
作為商湯自研的中文語言大模型應用平臺,「商量」具有語言理解、生成能力,現場演示了不同場景、領域的應用。
在文字創作方面,通過多輪對話,「商量」能夠按要求生成宣傳語,并在此基礎上寫作新產品邀請函;而通過對話引導,它也能夠輔助寫作適合兒童閱讀的童話故事。此外,「商量」也具有處理長文本的能力,能夠閱讀 PDF 后,回答用戶提出的針對性問題。
除了基本的語言模型,發布會現場還展示了基于語言能力的兩個擴展場景:編碼能力、以及基于醫學專業知識的對話咨詢。徐立表示,「商量」接入了自然語言編程的能力后,80% 的代碼可以通過提示詞生成,人工手寫的部分只剩下 20%。此外,使用某個垂直領域的公司代碼進行微調后,即能夠幫助公司內部的程序員共享編程經驗,增加開發能力。商湯內部實測顯示,使用了編程工具后,代碼的編寫效率提升了 62%。
文生圖大模型「秒畫」AI 作畫的能力已經成為大模型的「標配」,發布會現場展示了基于一長串的修飾詞的 Prompt 生成圖片的能力。修改 Prompt 里的個別描述短語(比如「穿西裝」改為「穿漢服」),模型能夠快速生成與之相匹配的圖片。
除此之外,「秒畫」還支持用戶上傳 20 張圖片,供模型學習風格。在現場的演示中,工作人員上傳了 20 張「港風」的明星圖片,幾分鐘后,學習完成,模型就能夠學會生成具有「港風」的人像。
數字人生成平臺「如影」基于「如影」平臺,用戶上傳一段符合要求的視頻,即可生成自己的孿生數字人,并在此基礎上使用平臺的工具,生成想要的背景圖片、文字段落、以及根據文字生成語音,最終集成為一段數字人做演示的短視頻。
在現場展示中,工作人員讓 AI 生成一段介紹絲綢之路的文字,再分別翻譯為英語、阿拉伯語兩種不同的文字,讓數字人分別用對應的語言進行介紹。
3D 內容生成平臺「瓊宇」與「格物」在 3D 建模的生成領域,商湯分別展示了城市空間、建筑、園區的生成平臺「瓊宇」,與對普通物品掃描后進行 3D 建模的「格物」。
基于這兩個平臺,以及「如影」的數字人平臺的綜合能力,能夠實現人、物、場的便捷編輯創作。徐立介紹,要實現便捷的編輯能力,難點在于實現實時的渲染。這一能力能夠應用到游戲設計、空間效果的創意設計、虛擬人直播等領域。
02 從「小模型」到「大模型」,帶來研發體系變革從 2018 年谷歌的 Bert、GPT-1 先后誕生,大模型的技術路線便初露雛形。到了 2022 年底,ChatGPT 這樣的現象級產品,正式標志了人工智能大模型的產業時代來臨。「AI2.0 時代的平臺式變革」、「AI 的 IPhone 時刻」、「不亞于 PC 和互聯網的誕生」,人們用不同的方式去形容這一時刻。
大模型突破了以往深度神經網絡處理個別任務的性能天花板。在到達了百億參數級別后,模型在處理任務的表現上出現了明顯突破;其次,一個底層的通用模型,具備了泛化能力,在不同的任務上都有出色的表現。
通用人工智能大模型帶來了人工智能范式的變化,商湯科技聯合創始人、首席科學家王曉剛表示,在這個時間點上,「也帶來商湯自身研發體系的變革」。
在過去,AI 落地的方式是「小模型 + 場景」,這種形式下,針對每個不同的場景,都會訓練一個專用的模型。這就導致了成千上萬個模型散落在不同的長尾場景中,研發成本高,周期長,每解決一個新問題,就需要訓練新的模型。
以輔助駕駛系統的為例,在「學校區域」指示牌前需要減速這個指令的執行,每一個環節都是一個針對子任務的專用模型進行執行。首先需要經過「物體檢測」識別指示牌;其次需要通過「文字識別」理解指示牌的文字內容;最后通過「決策模型」進行決策,確定減速。當有了大模型的多模態和思維鏈能力后,給定圖片后,只需要輸入「這個圖標是什么意思?我們應該做什么?」大模型就能夠根據已有的信息進行推理,作出將降低車速的決定。這也是 GPT-4 最新展現出的基于多模態信息的推理能力。
「大模型出現后,可以不斷的去解鎖這個模型新的功能,以極低的成本,非常高效的方式去不斷的去解決各個領域里面新出現的各種開放性的任務。」王曉剛介紹。
除了以更高效的方式解決問題,大模型還能夠帶來系統能力的提升。商湯科技聯合創始人、大裝置事業群副總裁陳宇恒介紹,視覺大模型能夠解決小模型時代自動駕駛中 Corner Case 的痛點。以往的模型會在吸收新的 Corner Case 的時候遺忘更早期的數據,而大模型的學習能力能夠解決數據遺忘的問題。
因此,大模型可以通過數據驅動、參數規模不斷突破性能,而在實際應用中,可以通過知識蒸餾等方法,以小模型的方式,將大模型的能力部署到車輛或者其他端側,實現高性價比的方案。
商湯首席科學家王曉剛介紹數據標注服務商湯的技術強項是計算機視覺,通過預訓練大模型,也能夠更有效地做圖像數據的預標注和篩選?!缚梢钥焖俚亟鉀Q原來海量的數據回流后的數據預篩選和標注的問題。」相關的標注效率能夠提升 4 倍以上。
王曉剛稱,比此前人工智能產業化面臨的問題「周期長、落地成本比較高」,而大模型的出現將為行業帶來新的轉機,「能夠以一個模型去解決各個場景里面的這些問題,會極大的推廣各個領域的應用。」
03 大裝置 + 大模型,AI 服務的延伸
大模型需要在多張卡上實現超大規模并行計算,這就涉及到分布式計算的工程實現和算力調配等關鍵能力。
這次的技術交流日,在上海的臨港 AI 大裝置進行。這也是 2022 年初正式啟動的「商湯人工智能計算中心」。目前是亞洲最大的智算平臺之一。這也是商湯大模型體系所展示的多項能力的算力基礎。
商湯介紹,目前大裝置擁有超過 27000 張 GPU 卡,可以輸出 5000PetaFlops 的算力。大模型的基礎條件是算力資源,ChatGPT 依托微軟的智算集群,才能實現暴力計算后的優異結果。而為了更好地服務大模型的訓練,微軟也專門為其打造了基礎設施?!溉ピ斐?AI 計算機去完成任務,訓練人工智能大模型,我認為是工程的奇跡。」陳恒宇表示。
在多卡的并行計算上,商湯很早就開始探索。在 2018 年,商湯就探索了 1000 塊 GPU 的并行計算能力。目前,大裝置能夠最大以 4000 卡的規模集群進行單任務訓練,并且可以做到七天以上的不間斷穩定訓練。陳宇恒介紹,這背后有兩個方面的技術難點。首先,要保證多卡并聯的計算效率。這需要「通過一個很好的系統架構和網絡架構設計,把這么多 GPU 高效地連接起來去做通訊,使它們可以有非常高的并行效率」。目前,商湯在千卡級也能夠達到 90% 以上的線性度。這意味著 GPU 規模增加的情況下,單卡性能依舊發揮出色。
其次,要實現長時間、無故障的運行時間。用 100 張卡去做聯合訓練的情況下,每天會有 0.1 張卡的故障。隨著集群增加,故障的卡數就會隨之增長。因此,大規模的 GPU 運算需要解決硬件的可靠性、軟件的容錯度,這在分布式系統的設計上和軟件框架的設計上,提出了很大的挑戰。
「商湯得益于過去的經驗,在這兩方面也有很好的技術積累?!龟愑詈惚硎?。
在 2022 年,大裝置除了支持自己的大模型體系訓練,商湯已經作為算力服務方,服務了其他 8 家客戶的大模型訓練。王曉剛表示,商湯的特殊之處在于,這些年一直將自己作為「人工智能的平臺型的公司」,投入了很大的資源進行基礎設施建設。
大模型能力是在原有算力能力上新的疊加層。「商湯沒有云,其實是個誤解。」陳恒宇表示,商湯一直對外提供 AI 原生的算力、存儲網絡、軟件等不同的服務。
生成式 AI 大火后,商湯也提供大模型的訓練、推理、數據管理,以及基于「日日新」大模型體系的 API 服務,甚至是提升生產效率的整套工具鏈,讓政府和行業客戶去高效地開發人工智能大模型。責任編輯:hnmd003
相關閱讀
-
舒適好音質,韶音首款分體式不入耳藍牙耳機 OpenFit 舒適圈評測_當前熱聞
如今真無線耳機的種類是越來越多了,除了音質外,我們在挑選耳機的時候佩戴的舒適度也是一個很重要的考...
2023-04-11
相關閱讀
-
全球報道:大模型時代,商湯怎么做?
當人們紛紛猜測,GPT-4的參數量,將會在GPT-3的1750億參數的基礎上如何再增加時,OpenAI選擇了不公布。...
-
京東零售啟動采銷單元組織調整:取消事業群 世界快播報
京東零售啟動采銷單元組織調整:取消事業群在4月9日的經營管理會上,京東零售確立了最新的組織架構變革...
-
全球即時:兩市成交額再破萬億!TMT 穩居半壁江山,市場分歧 AI 行情持續性,聽聽機構怎么說
財聯社(上海,編輯梓?。┯?,今日(4月11日),市場資金成交繼續活躍,截至收盤,兩市成交額達1 08萬...
-
世界速讀:短久期二永債不香了?“資產荒”下,二永債投資或適度拉長久期
財聯社4月11日訊(編輯楊一駿)2023年,二永債收益率整體下行。而3月中旬以來,二永債的行情出現分化,...
-
天天即時看!100萬定期壽險一年交多少錢?去哪里買靠譜?
大約為300~1000元左右。 實際上,100萬的定期壽險具體一年交多少錢,主要還是取決于產品本身。因為不同...
-
平安金玉滿堂兩全保險萬能型的優點是什么?缺點是什么?_世界新動態
1、保障內容豐富:平安金玉滿堂兩全保險萬能型不僅可以保障您的財產,還可以保障您的身體。如果您在購買...
-
萬能賬戶的錢可以全部領出來嗎?如何查詢萬能賬戶的可領取金額?-焦點速訊
部分萬能賬戶保險在取錢是會有限額規定,不能全額取出,例如有些產品會規定每個保單年度內,從萬能賬戶...
-
車險要提前一個月續保嗎?提前買才有優惠嗎?
車險續保可以在到期前一個月內進行。 如果超過這個時間,就需要重新購買新的保險。因此,建議您在到期前...
-
國壽鑫尊寶終身壽險萬能型慶典版優點有哪些?收益如何?
保險金額設置比較大方。國壽鑫尊寶慶典版規定18-41歲時,合同的保險金額是基本保險金額的160%再與賬戶價...
-
全球新消息丨狂攬1290億!隆基綠能大動作:35億擴產光伏電池,氫能連虧兩年仍加碼
圖片來源:圖蟲創意隆基綠能(601012 SH)連發公告,陜西首富又有大動作!4月10日盤后,在公布2022年營...
-
估值暴跌的創新藥活過來了?華蓋資本許小林:藥品商業化階段內卷問題嚴重-天天快播報
“生物醫藥行業的春天應該是來了。”華蓋資本創始合伙人、董事長許小林如是說,隨后,他向時代周報回憶...
-
長城藍山 DHT-PHEV訂單突破1萬單 前沿熱點
長城藍山DHT-PHEV訂單突破1萬單4月10日,長城汽車宣布,旗下的藍山DHT-PHEV自開啟預訂以來,累計訂單量...
-
消息稱車主投訴蔚來ET5行駛中疑似方向盤失控 精選
消息稱車主投訴蔚來ET5行駛中疑似方向盤失控4月11日,蓋世汽車注意到,有蔚來車主向相關投訴平臺反映,...
-
看點:香港3月底官方外匯儲備資產為4307億美元 ?
香港金管局今日公布,香港于2023年3月底的官方外匯儲備資產為4,307億美元(2023年2月底為4,291億美元)...
-
英特集團擬收購百善醫療51%股權:世界聚焦
4月11日,英特集團發布公告,公司擬與杭州百善醫療設備有限公司全體股東簽署《股權轉讓協議》,以自有資...
-
天津:“投資熱土”聚集效應初顯|每日時訊
圍繞科技型中小企業普遍存在的抵押物不足、科技創新能力難以量化識別等難題,天津濱海高新區專門聯合合...
-
全國二級公立醫院運營能力如何?一組數據告訴你
昨天(10日),國家衛生健康委通報2021年度全國二級公立醫院績效考核國家監測分析情況。
-
焦點滾動:時政微視頻丨瞰廣東
2022年全省地區生產總值超12 9萬億元,連續34年居全國首位……改革開放是廣東最鮮明特征,高質量發展是...
-
舒適好音質,韶音首款分體式不入耳藍牙耳機 OpenFit 舒適圈評測_當前熱聞
如今真無線耳機的種類是越來越多了,除了音質外,我們在挑選耳機的時候佩戴的舒適度也是一個很重要的考...
-
熱消息:2023智能變電站行業發展趨勢及市場現狀分析
2023智能變電站行業發展趨勢及市場現狀分析智能變電站行業發展趨勢及市場現狀如何?隨著城市化進程的加快...
-
當前視點!2023年3月份居民消費價格同比上漲0.7% 預計今年中國GDP增速分析
2023年3月份居民消費價格同比上漲0 7%2023年3月份全國居民消費價格同比上漲0 7%。其中,城市上漲0 7%...
-
世界關注:中國支付清算協會倡議 從業人員慎用ChatGPT等工具 chatgpt最新消息
中國支付清算協會倡議從業人員慎用ChatGPT等工具4月10日,中國支付清算協會發布《關于支付行業從業人員...
-
世界黃金協會:3月黃金ETF迎十個月來首次凈流入 3月我國外匯和黃金儲備雙增
世界黃金協會:3月黃金ETF迎十個月來首次凈流入世界黃金協會(WGC)的最新報告顯示,這場自2008年金融危機...
-
新華保險是正規公司嗎?有什么注意事項?:焦點熱文
新華保險成立于1996年的9月,是經保監會批準成立的保險公司,已經于2011年在香港聯合交易所和上海證券交...
-
今日關注:中國人壽只要住院就全部報銷嗎?報銷要哪些材料?
不能。 中國人壽旗下能夠報銷住院的保險產品通常是醫療險,需按具體的報銷政策來報銷,并非只要住院就...
-
萬億渝農商行迎來新行長,“老將”隋軍回歸_環球熱消息
文|記者黃宇昆農商行“一哥”迎來新行長。4月10日,渝農商行(601077 SH)發布公告稱,經該行董事會全...
-
退保有沒有秒退的方法?退保需要注意什么?_實時焦點
退保在還沒有完成保險產品繳費的情況下,是可以向保險公司申請秒退的,一般我們繳納了保險的費用之后,...
-
?百度抖音已可支持查詢多款加密貨幣行情,比特幣今日升破3萬美元
據媒體報道,有業內人士稱,在微信朋友圈轉發抖音、百度可以實時查
-
全球即時:哈弗梟龍系列開啟預訂
哈弗梟龍系列開啟預訂4月11日,哈弗汽車宣布旗下的全新中型SUV梟龍MAX和緊湊型SUV梟龍均開啟預訂,新車...
-
經銷商曝光零跑汽車銷量造假,官方回應:不實信息_世界資訊
經銷商曝光零跑汽車銷量造假,官方回應:不實信息近日,一則“零跑濟南經銷商店長張某向媒體爆料公司數...
精彩推薦
閱讀排行
精彩推送
- 【天天熱聞】“價格戰”成效初現...
- 無人機“上崗” 助力土右春耕_...
- 用愛心托起希望
- 天天觀點:安徽出臺22條舉措服務...
- 中關村擬2.64億元投建山東中關村...
- 英特集團擬9996萬元收購百善醫療...
- 馬鞍山曼迪新重組后新公司51%股...
- 上海車展丨MINI COOPER SE敞篷...
- 出片即大片,所見即所得:華為 ...
- 風口上的“新物種”,談取代手機...
- 【獨家焦點】Canalys:智能手機...
- 悍高集團更新招股書,存多起專利...
- 天天最新:小心!當美歐英“印鈔...
- 天天日報丨“小超人”李澤楷旗下...
- 精選!推特又出 Bug 了:僅好...
- “ 1 個 BP 玩一天”,雞肋...
- 即時:平均兌付收益率現回升,重...
- 烏海銀行業保險業大力開展新市民...
- 焦點日報:中國人壽分紅型退保計...
- 小孩買什么保險最好最劃算?有買...
- 【世界熱聞】個人年金險有必要買...
- 百萬醫療險包括意外險嗎?區別是...
- 熱推薦:全額退保金最好的方法有...
- 世界新消息丨“粵貿全國”走進消...
- 通過瞳孔識別用戶狀態 蘋果新專...
- 上海車展丨一汽奔騰T90官圖發布...
- 第三屆消博會震撼開幕
- 全聚德連虧三年:去年營收降24%...
- 邁可隆獲數千萬元天使輪融資,專...
- 運動員蘇炳添起訴網易侵權,案由...