首頁 > 新聞 > IT資訊 > 正文

        文心一言,甩開GPT-3.5,與GPT-4掰手腕?

        2023-03-28 07:48:30來源:智能相對論微信號  

        企業數字轉型怎么找外部合作伙伴,現在有哪些類型的伙伴可以選擇?

        文|智能相對論(aixdlun)

        作者| 葉遠風


        (資料圖片)

        “請寫一個肯德基瘋狂星期四的段子。”

        “我女朋友的老公應該叫我什么?”

        “XX微信群的群主與吳彥祖誰更帥?”

        ......

        給幾個搞怪的問題,戲耍一下,把答案貼出來,大家嘲諷一番。

        在文心一言發布后,這種玩法直到今天還沒有停止的意思。

        可能連背后的技術與產品人員都沒有想到,文心一言會以這樣的方式火了下去。

        作為國產版ChatGPT,文心一言在發布后,除了贊譽的聲音,以各種形式被批判應該在意料之中,ChatGPT當初也是如此,這是產品不斷進化要經歷的過程。

        只不過,在沒有好壞的定論中,到底要給文心一言當下的技術水準定一個什么樣的定義,并沒有客觀的、更加令人信服的結論。

        起碼,這種“戲耍”并不能反映多模態大模型所具備的能力。

        ChatBOT固然可以閑聊,也應該支持用戶隨便閑聊,但閑聊互動不應該成為一款專業產品能力的最終評價標準。

        光怪陸離的問題,就算去詢問一個人類智者,得到的答案也是光怪陸離的。

        現在來看,以某種更現實的視角去提出問題、實測答案,才更能體現出文心一言的能力和價值。

        這種現實的視角應當有很多,其中,以企業信息需求為著眼點,會是其中之一。

        這是因為,從文心系列大模型走向對話產品“一言”,或者,從GPT-3.5到GPT-4,ChatBOT最后都還是要走向商用、服務企業,創造專業價值的。

        GPT-4發布后并沒有公布其參數量,這被認為是走向商業化的準備,畢竟OpenAI制定的數億美元營收目標現在快到4月份了還沒太大動靜。

        而服務企業,要么提供“生產力”價值,這是ChatBOT場景垂直化后需要探索的內容,在各產業提供具體的工作能力;要么提供信息價值,通過類似“上帝之眼”的信息整合與邏輯梳理能力,幫助企業消除信息不對稱,獲取需要的信息。

        目前ChatBOT的產業應用還未見,因此信息價值就成為可以客觀評價的維度。

        “智能相對論”團隊獲得了文心一言的內測賬號,以及ChatGPT普通版本(基于GPT-3.5)與plus版本(基于GPT-4)的測試資格,嘗試從企業信息獲取維度,提出六個關聯問題,從各答案中對比出文心一言的實際能力。

        總體上,文心一言甩開GPT-3.5不成問題,與GPT-4能夠掰手腕做到有來有回。

        具體一個個分析,每個問題下,分別是文心一言、ChatGPT普通版、ChatGPT plus版的回答截圖。

        01

        企業數字轉型怎么找外部合作伙伴,

        現在有哪些類型的伙伴可以選擇?

        可以看出,在三個回答中,只有文心一言提到了選擇外部合作伙伴要注意到的幾點,然后再例舉可以找哪些類型的合作伙伴。

        而ChatGPT普F通版、ChatGPT plus版都只是直接給出了類型。

        這顯示出,文心一言在算法上,相較與其他兩個產品,對問題的潛在需求認識可能更加深刻。

        02

        企業應該怎樣抓住

        新的市場機遇?

        在這個問題的回答中,很顯然,條目的多少,基本上決定了答案的質量。

        對一個企業來說,要抓住市場機遇,就應該要找到更多的方法,考驗的是ChatBOT整合信息并分門別類的能力。

        在這里,文心一言超越GPT-3.5但略遜于GPT-4。

        03

        企業怎么招徠優質人才,

        有哪些好用的渠道?

        與上一個問題類似,條目的多少直觀反映了ChatBOT解決需求的能力。

        文心一言遠超GPT-3.5,并超越了GPT-4,再一次掰贏了手腕。

        04

        員工的工作效率很低,

        怎么辦?

        這一局,相似的判斷標準,文心一言繼續領先GPT-3.5,但沒有打贏GPT-4。

        05

        客戶總是不回款,

        有什么好的辦法?

        這個問題,由于各個回答都涉及了可能破壞企業與客戶關系的行動,因此都進行了一次“打補丁”式的追問。

        基本上,三個模型都很好地領會到了追問的意圖,對“不和客戶關系搞僵”有準確的認知,并提供了對應的答案。

        其中GPT-4的表現超越文心一言。(注意ChatGPT有字數限制,plus版限制在700字左右,所以其輸出因為字數太多最后被中止)

        06

        企業資金鏈緊張,

        但是銀行不肯借錢,怎么辦?

        吸取上個問題的教訓,這個問題直接把限制條件加入到問題當中。

        類似上一個問題,三個模型對“銀行不借錢”情形下企業資金鏈緊張的應對辦法都有清晰的認知,規避了銀行信貸這一種方式。

        其中,文心一言與GPT-4打成了平手,都提供了相同數量的方法供企業選擇。

        總結以上,僅就這六個企業比較關心的專業問題而言,文心一言全面勝過GPT-3.5,對GPT-4兩勝、兩負一平,典型的你來我往掰手腕。

        而更進一步看,實際上在回答條目上的勝負,無關算法本身的設計,在技術上與算法訓練的數據量和訓練時長有關(要給足夠多的食物,也要給足夠多的時間去吃食物),后續的競逐將仍然在數據訓練上。

        對文心一言而言,發布更晚已經吃了虧,下一步如何在訓練上追趕、趕超(可能意味著巨大的成本投入)是百度要考慮的問題。

        當然,由于文心系列大模型過去早已具備了豐富的多模態能力,因此文心一言在發布時就自帶有GPT進化到“4代”才加入的多模態能力,這一點也常常為業界所忽略。

        而“智能相對論”認為,未來ChatBOT的比拼,將很大程度上在多模態展開。

        這意味著,當下的文本競逐,只是一切的開始。

        現在,任何的結論,不管是褒揚的還是貶低的,可能都為時尚早。

        *本文圖片均來源于網絡

        深挖智能這口井,同好添加vx:zhinengxdl

        此內容為【智能相對論】原創,

        僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

        部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。

        本文首發于微信公眾號:智能相對論。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

        關鍵詞:

        責任編輯:hnmd003

        相關閱讀

        相關閱讀

        推薦閱讀

        亚洲精品字幕在线观看| 亚洲欧美国产国产综合一区| 国产亚洲精品欧洲在线观看| 亚洲色精品三区二区一区| 亚洲国产成人久久| 亚洲国产高清美女在线观看| 亚洲色欲或者高潮影院| 激情内射亚洲一区二区三区| 久久亚洲精品中文字幕| 4444亚洲国产成人精品| 亚洲激情视频网站| 亚洲午夜电影在线观看| 亚洲人成网站日本片| 国产色在线|亚洲| 亚洲熟妇无码一区二区三区 | 亚洲中文字幕久久久一区| 77777亚洲午夜久久多喷| 亚洲小说图区综合在线| 亚洲风情亚Aⅴ在线发布| 国产99久久亚洲综合精品| 亚洲精品tv久久久久| 国产亚洲大尺度无码无码专线| 亚洲熟妇av一区二区三区漫画| 国产亚洲综合一区柠檬导航| 亚洲国产精品无码久久久秋霞2 | 亚洲av永久无码精品秋霞电影秋| 色欲aⅴ亚洲情无码AV蜜桃| 国产亚洲精品2021自在线| 亚洲中文无韩国r级电影| 国产aⅴ无码专区亚洲av麻豆| 国产亚洲3p无码一区二区| 亚洲国产美国国产综合一区二区| 亚洲美女免费视频| 亚洲永久在线观看| 最新亚洲人成无码网www电影| 亚洲精品无码99在线观看| 亚洲老妈激情一区二区三区| 久久久久亚洲av无码专区喷水 | 亚洲成人网在线播放| 亚洲精品456人成在线| 国产精品无码亚洲精品2021|