首頁 > 新聞 > 智能 > 正文

        模型大亂斗,小羊駝團隊推出大模型競技平臺 Chatbot Arena

        2023-06-08 15:28:08來源:ZAKER科技  


        (資料圖片)

        品玩 6 月 8 日訊,由伯克利大學主導(dǎo)一個團隊 LMSYS Org 近日發(fā)布了一個針對大語言模型的基準平臺 Chatbot Arena。

        據(jù)悉,該平臺采用匿名、隨機的方式進行對抗評測,評測方式基于國際象棋等競技游戲中廣泛使用的 Elo rating system。排名通過用戶投票產(chǎn)生,系統(tǒng)每次會隨機選擇兩個不同的大模型機器人和用戶聊天,并讓用戶在匿名的情況下判定哪款大模型產(chǎn)品的表現(xiàn)更好一些。 Elo rating system 會根據(jù)用戶的選擇最后判定大模型產(chǎn)品的積分,并以排行榜的形式出現(xiàn)在首頁中。

        目前 OpenAI 的 ChatGPT-4 排名第一,之后是 Anthropic 的 claude,同樣來自 Anthropic 的 claude Instant 排名第三。

        LMSYS Org 是一個松散的研究組織,由加州大學伯克利分享額學生團隊組建,曾推出過大語言模型小羊駝。
        關(guān)鍵詞:

        責任編輯:hnmd003

        相關(guān)閱讀

        相關(guān)閱讀

        精彩推送

        推薦閱讀

        亚洲午夜激情视频| 亚洲精品无码久久久| 精品国产亚洲男女在线线电影| 亚洲国产区男人本色| 在线亚洲午夜片AV大片| 33333在线亚洲| 国产亚洲精品bv在线观看| 成人亚洲国产va天堂| 中文文字幕文字幕亚洲色| 亚洲一级在线观看| 亚洲av日韩av综合| 国产精品高清视亚洲精品| 亚洲无吗在线视频| 456亚洲人成影院在线观| 亚洲成A人片在线播放器| 亚洲久热无码av中文字幕| 亚洲国产精品成人午夜在线观看| 亚洲精品国产综合久久久久紧| 亚洲国产精品99久久久久久| 亚洲av无码专区在线电影| 337p日本欧洲亚洲大胆人人| 亚洲精品99久久久久中文字幕| 亚洲人成影院在线无码观看| 亚洲熟妇av一区二区三区 | 亚洲人JIZZ日本人| 国产AV无码专区亚洲Av| 亚洲av无码不卡| 亚洲综合无码一区二区三区| 亚洲一区二区久久| 亚洲老熟女五十路老熟女bbw| 国产精品亚洲色图| 亚洲小说区图片区另类春色| 亚洲成a人片在线观看日本| 亚洲伊人tv综合网色| 亚洲免费观看网站| 亚洲精品成a人在线观看☆| 亚洲Av无码国产情品久久| 亚洲愉拍99热成人精品热久久| 亚洲av午夜福利精品一区| 亚洲麻豆精品果冻传媒| 亚洲成a人片在线看|