首頁 > 新聞 > 智能 > 正文

        清華大學發布大模型性能報告 :GPT-4 第一,文心一言更懂中文

        2023-08-10 12:20:14來源:ZAKER科技  


        (資料圖片僅供參考)

        IT 之家 8 月 10 日消息,近日,清華大學新聞與傳播學院教授、博士生導師沈陽所在團隊發布了《大語言模型綜合性能評估報告》(下文簡稱 " 報告 "),報告顯示總得分率 GPT-4 第一,百度文心一言在三大維度 20 項指標中綜合評分國內第一,超越 ChatGPT,其中中文語義理解排名第一,部分中文能力超越 GPT-4。

        據了解,報告本次評估選取了 GPT-4、ChatGPT 3.5、文心一言、通義千問、訊飛星火、Claude、天工 7 個大語言模型,圍繞生成質量、使用與性能、安全與合規三大維度,全面考察大語言模型上下文理解、中文語義理解、誤導信息識別、邏輯推理、內容安全性、隱私保護等 20 項指標。綜合來看,文心一言語義理解能力突出,特別是具備更好的中文理解能力,更懂中國文化,同時時效性強、內容安全把握細微,這源于其知識增強、檢索增強和對話增強的技術創新。

        在生成質量方面,基于對語義理解、輸出表達、適應泛化的綜合評測,文心一言得分率 76.98%,僅次于 GPT-4,領先于包括 ChatGPT 在內的其他大語言模型。其中,在部分中文語義理解方面,文心一言以 92% 的得分率排名榜首。

        IT 之家注意到,在安全合規方面,基于對內容安全性、偏見和公平性、隱私保護等綜合評測,文心一言得分率 78.18%,與 GPT-4 并列排名第一。
        關鍵詞:

        責任編輯:hnmd003

        相關閱讀

        相關閱讀

        推薦閱讀

        国产色在线|亚洲| 亚洲色偷偷综合亚洲AV伊人蜜桃 | 亚洲精品精华液一区二区| 亚洲AV无码久久久久网站蜜桃 | 亚洲网红精品大秀在线观看| 亚洲网站在线观看| 亚洲丝袜美腿视频| 91久久亚洲国产成人精品性色| 久久久亚洲精品国产| 亚洲成色在线影院| 久久国产亚洲高清观看| 亚洲特级aaaaaa毛片| 亚洲av日韩av综合| 亚洲日本成本人观看| 亚洲爆乳少妇无码激情| 国产成人亚洲毛片| 亚洲精品无码久久久| 国产日产亚洲系列| 亚洲AV无码专区国产乱码4SE| 久久久久久亚洲精品中文字幕| 亚洲视频在线观看| 亚洲国产日韩在线成人蜜芽 | 精品国产亚洲一区二区在线观看 | 亚洲中文字幕无码一去台湾| 亚洲中文字幕无码爆乳| 亚洲av无码日韩av无码网站冲| 婷婷综合缴情亚洲狠狠尤物| 国产亚洲精品影视在线产品| 亚洲精品国偷自产在线| 亚洲综合在线视频| 33333在线亚洲| 国产精品亚洲专区无码牛牛| 亚洲视频在线精品| 亚洲精品V欧洲精品V日韩精品 | 亚洲欧美日韩中文二区| 亚洲AⅤ优女AV综合久久久| 国产亚洲日韩在线三区| 亚洲色图在线播放| 国产日本亚洲一区二区三区| 亚洲欧美黑人猛交群| 亚洲欧洲精品成人久久曰影片|