首頁 > 新聞 > 智能 > 正文

        ChatGPT,能成為新的「維基百科」嗎? 世界滾動

        2023-05-13 21:27:31來源:ZAKER科技  

        22 年前,2001 年初,維基百科 Wikipedia 橫空出世,在其后的互聯(lián)網(wǎng)時代,成為人們獲取知識的重要平臺。


        【資料圖】

        但在剛開始,人們對維基「人人可編輯」的組織形式產(chǎn)生過質(zhì)疑。甚至有電視主持人諷刺其為「wikiality」,即如果在維基百科上編造條目,只要有足夠多的人同意,它就會成為現(xiàn)實。

        后來,隨著《自然》(Nature)雜志的調(diào)查研究,發(fā)現(xiàn)維基百科準(zhǔn)確度接近大英百科全書,Google 開始把維基百科放到搜索結(jié)果的首項,維基社區(qū)和內(nèi)容貢獻(xiàn)者也持續(xù)壯大,維基百科用了很多年時間終于取得了公眾的信任。

        誕生之初遭到質(zhì)疑,越來越多人參與去完善,而后平反收到大眾認(rèn)可,繼而成為日常的工具,這一過程,僅誕生半年的 ChatGPT 正在經(jīng)歷,不僅于此,它還成為了維基百科的挑戰(zhàn)者。

        不久前,維基媒體基金會召開 2023-2024 年度計劃的電話會議,會議中提及了 35 次 AI,討論的主題也是圍繞 ChatGPT 帶來的挑戰(zhàn)。

        但維基百科所擔(dān)心的挑戰(zhàn),并不是被 ChatGPT 取代。而是更深刻地考驗:未來的維基百科,會由 ChatGPT 來撰寫嗎

        維基百科的內(nèi)容哪里來的?

        要想知道 ChatGPT 能否撰寫維基百科,得先知道維基百科目前內(nèi)容來源于哪里。

        維基百科主要是由來自互聯(lián)網(wǎng)上的志愿者共同合作編寫而成,任何使用網(wǎng)絡(luò)進(jìn)入維基百科的用戶都可以編寫和修改里面的文章。它是互聯(lián)網(wǎng)上一個極大的自由內(nèi)容、公開編輯、多語言的網(wǎng)絡(luò)百科全書協(xié)作計劃。

        截至 2021 年初,所有語種的維基百科條目數(shù)量達(dá) 5500 萬條,如何確保內(nèi)容上的準(zhǔn)確,全靠維基社群志愿者們的篩查。

        在 ChatGPT 出現(xiàn)前,維基百科已經(jīng)長期在用 AI 去減少一些人力成本。應(yīng)用最多的就是把現(xiàn)有條目直接機(jī)器翻譯,再由人工編輯校對。

        2016 年時,資深科學(xué)家 Aaron Halfaker 開發(fā)了一套開源機(jī)器學(xué)習(xí)算法,可以自動識別維基百科里那些惡意破壞條目和編輯假消息的行為;2020 年,MIT 的研究人員也為維基百科推出過基于 AI 的修改功能,可以精確定位維基百科句子中的特定信息,并自動替換為類似于人類編輯的語言。

        Wikipedia 關(guān)于 ChatGPT 的頁面|Wikipedia

        以及如維基社群所述,人工智能非常擅長總結(jié)把一篇很長的技術(shù)類條目,總結(jié)成兒童都能理解的版本,讓 AI 去生成兒童版的維基百科效果很好

        翻譯、檢查、概括簡化已有內(nèi)容,維基百科一直以來對 AI 的應(yīng)用僅限于此,直到大型語言模型 ChatGPT 的出現(xiàn)。

        目前仍以文字方式交互為主的 ChatGPT,除了回答用戶直接的提問以外,還可以用于甚為復(fù)雜的語言工作,包括自動生成文本、自動問答、自動摘要等等。

        ChatGPT 可以寫出相似真人的文章,并在許多知識領(lǐng)域給出詳細(xì)和清晰的回答。哪怕 ChatGPT 生成內(nèi)容的事實準(zhǔn)確度還需要人工去二次查閱,但這時維基百科面臨的問題已經(jīng)很明顯了:志愿者能否用 ChatGPT 來撰寫維基百科條目?

        能不能和想不想

        紐約市維基媒體分會的老維基人 Richard Knipel 就用 ChatGPT 在維基百科上起草了一個名為「藝術(shù)作品標(biāo)題」的新條目,Knipel 表示,ChatGPT 給出的版本一般但語法正確,定義了藝術(shù)作品標(biāo)題的概念,給出了從古至今的例子。他在草稿基礎(chǔ)上只做了輕微修改。

        但另一位編輯在條目上標(biāo)注,將會進(jìn)行大量修改并完善。如今,我們再點(diǎn)進(jìn)這一條目,會發(fā)現(xiàn)它增加了大量內(nèi)容和理論索引,還梳理出了目錄,給出了圖片案例。像 Knipel 這樣的維基人認(rèn)為,ChatGPT 可以作為生成維基百科條目草稿、骨架的工具,在此基礎(chǔ)上,人工再驗證內(nèi)容,編輯和充實條目

        但另一派維基人則認(rèn)為,在維基百科條目的創(chuàng)作里 ChatGPT 應(yīng)該完全被禁用。一位維基百科編輯就表示「我們應(yīng)該強(qiáng)烈呼吁不使用 AI 工具來生成條目草稿,即使這些條目隨后會被人工審閱。ChatGPT 太擅長引入那些看起來很有道理的謊言。」

        ChatGPT 起草,人工簡單編輯的版本|Wikipedia人工大量干預(yù)后產(chǎn)生的版本|Wikipedia

        但另一派也反駁這種說法,就像 Knipel 認(rèn)為,修改并豐富不完善的信息,這就是維基百科在實踐中一直運(yùn)作的方式。ChatGPT 將繼續(xù)存在并飛速發(fā)展,利用它同時強(qiáng)調(diào)人工干預(yù)的必要性怎么就不行呢?把 ChatGPT 上來就視作洪水猛獸實在有些偏頗。

        但在想不想之前,我們先看看能不能。ChatGPT 還夠不夠格直接編寫維基百科呢?

        3 月 30 日時,維基百科創(chuàng)始人 Jimmy Wales 在接受 Evening Standard 采訪時討論了這個議題。Wales 認(rèn)為,讓 ChatGPT 能獨(dú)立寫一個完整的維基條目,目前還有一段距離,但距離多遠(yuǎn)就難說了。「ChatGPT 的一大問題是會胡編亂造,業(yè)內(nèi)把這種情況稱為 hallucinating(幻覺)——我稱之為編瞎話。」(One of the issues with the existing ChatGPT is what they call in the field 『hallucinating』— I call it lying.)

        「ChatGPT 有一種憑空捏造的傾向,這對維基百科來說真的不太行。」Wales 在采訪里說道。實踐中也是如此,你在維基百科上搜一個詞,維基百科可能會反饋「該條目不存在」,但你問 ChatGPT,它可能會給你生成一段沒由頭的假消息。

        ChatGPT 會「說瞎話」,這種事已經(jīng)不新鮮了。但 ChatGPT 誕生僅半年,它的自我迭代能力已經(jīng)令人咋舌,讓 ChatGPT「句句吐真言」,似乎只是時間問題,那維基百科現(xiàn)在擔(dān)憂的是什么呢?

        人力有限,算力「無限」

        維基百科團(tuán)隊并沒有那么擔(dān)心內(nèi)容到底來源于人類還是 AI,它擔(dān)心的是內(nèi)容質(zhì)量是否過關(guān)。

        在維基媒體基金會在電話會議總結(jié)報告里,「挑戰(zhàn)」被放到了開篇,其中最大比重的部分,也是維基百科團(tuán)隊最大的擔(dān)憂在于:維基百科涌入大量 AI 生成的內(nèi)容,把真正高質(zhì)量的、正確的信息給淹沒了

        「Wiki 項目有大量高質(zhì)量的、可靠的,結(jié)構(gòu)化的、分類好的內(nèi)容。這就是我們帶給世界的價值。最讓我害怕的不是人們使用 GPT 之類的大語言模型來獲取知識,而是需要巡查的 AI 生成的內(nèi)容會爆炸式增長。

        對高質(zhì)量內(nèi)容來說,創(chuàng)作比消費(fèi)的時間成本高很多,就像一篇較為完整的維基條目,需要許多人參與撰寫,花許多時間,走過很多流程后完成,對讀者來說幾分鐘就閱讀完了。

        像維基百科這種平臺,為了保證內(nèi)容質(zhì)量,還需要專業(yè)人士核查一條條目中每個信息、數(shù)據(jù)、引用是否來源準(zhǔn)確,篩查和編輯的成本同樣很高。因此 AI 生成內(nèi)容越多,人工核查的時間也更長。而且哪怕 ChatGPT 給出了正確的結(jié)論,但它并不會直接給出結(jié)論的論據(jù)來源何處,人工還需要再找到論據(jù)。到最后,修正可能比撰寫耗時更長

        Wikipedia 的條目下會有很多延展閱讀鏈接|Wikipedia

        目前維基百科志愿者們已經(jīng)發(fā)現(xiàn)了許多 ChatGPT 自動生成內(nèi)容上的問題。比如 ChatGPT 很容易太籠統(tǒng)地概括定義,導(dǎo)致表意不明。還有 ChatGPT 遣詞造句過于肯定,不夠匹配維基百科想呈現(xiàn)的客觀中性的文字風(fēng)格。

        最重要的是信源難以查詢,維基百科的可信度和擴(kuò)展閱讀性,很大程度上是基于條目底下豐富的信息參考來源,但 ChatGPT 不會主動提供參考,甚至?xí){空捏造。

        擔(dān)任了 20 年維基百科志愿編輯的 Andrew Lih 在用 ChatGPT 起草新條目時就發(fā)現(xiàn),ChatGPT 概述定義做得很不錯,但它所提供的消息來源于《福布斯》、《衛(wèi)報》、《今日心理學(xué)》,但 Lih 仔細(xì)查閱后發(fā)現(xiàn),這些信源文章并不存在,甚至 ChatGPT 給出的 URL 都是自動生成找不到頁面的假鏈接

        綜上,維基百科團(tuán)隊直接表示,AI 生成內(nèi)容的速度和效率,可能會超出項目的運(yùn)行能力。

        除此之外,還有許多維基百科團(tuán)隊會擔(dān)心的點(diǎn),比如如今的維基百科貢獻(xiàn)者里,使用英語的白人男性依舊是主體,維基內(nèi)容已帶有語言和內(nèi)容偏見,ChatGPT 靠吸納互聯(lián)網(wǎng)信息為養(yǎng)料的 AI 機(jī)器,生成出的內(nèi)容會進(jìn)一步放大偏見。

        Wikipedia 聯(lián)合創(chuàng)始人 Jimmy Wales 在接受 Standard 采訪時談及 AI 參與撰寫維基的問題|Standard.co

        維基百科團(tuán)隊也無法把握志愿者對 AI 工具使用的傾向。Lih 就認(rèn)為,維基人不缺動力,缺的是時間,ChatGPT 生成的糟糕草稿,可以激發(fā)維基志愿者的修改欲。這也符合維基之父 Ward Cunningham 所提出的「坎寧安定律」:在互聯(lián)網(wǎng)上得到優(yōu)秀答案的最佳方法不是去提問而是發(fā)布一個錯誤的答案

        維基百科團(tuán)隊還擔(dān)心,當(dāng)維基百科充斥著 AI 生成的內(nèi)容時,用戶們會降低對它信息的信任度,轉(zhuǎn)而去信任更有「人類作者」標(biāo)識的媒體內(nèi)容,比如會出鏡的視頻,標(biāo)記了作者的媒體報刊。

        就不能共存嗎

        維基百科和 ChatGPT 有很多相似性,比如都以文本為主,試圖「回答一切」。但二者最顯著的區(qū)別,在于回答方式的不同

        維基百科是有框架、系統(tǒng)、詳細(xì)索引的百科式信息,你點(diǎn)進(jìn)一個條目,可以從最簡單的概括式介紹了解到其歷史的變化,通過條目里豐富的擴(kuò)展鏈接,可以在縱向里深入了解,也能在橫向里在不同條目之間跳轉(zhuǎn),擴(kuò)展對一整個領(lǐng)域的了解。

        ChatGPT 目前呈現(xiàn)出的還是提問式的交互,需要用戶明確了解自己想知道的問題,向外擴(kuò)展也是需要建立在 ChatGPT 給出的回答之上,進(jìn)一步詢問。

        不同用戶獲取信息的傾向不同,選擇工具也不同,維基百科無法做到 ChatGPT 一樣能回答非常具體的問題,ChatGPT 也不會像維基百科一樣有那么精準(zhǔn)且梳理好的知識類信息。這二者的使用方式,就像我們選擇閱讀教科書,還是直接向教授提問。

        就像維基百科并沒有因為搜索引擎 Google 的崛起而磨滅,反而它會出現(xiàn)在 Google 搜索結(jié)果的第一條和邊欄上。

        維基百科團(tuán)隊也并沒有如 Google 一般有那么大的危機(jī)感,在年度會議里,雖然開篇點(diǎn)了 ChatGPT 帶來的挑戰(zhàn),但整個會議更多的時間留給了「機(jī)會」。

        「當(dāng)互聯(lián)網(wǎng)上有大量 AI 生成的內(nèi)容時會發(fā)生什么?在一個由數(shù)萬億個低質(zhì)量、低可信度的頁面組成的互聯(lián)網(wǎng),創(chuàng)建大模型的人和用戶都需要去找到可靠的信息,他們可能會更多地使用維基百科。」這就是維基人眼中的「機(jī)會」。

        利用大語言模型去查 bug、翻譯、內(nèi)容總結(jié)、豐富媒體形式,比如 GPT-4 中體現(xiàn)的視頻生成,AI 生成的圖片也可以放到很多抽象概念的條目里,增加可讀性,還可以在文本和語音之間互相轉(zhuǎn)換。

        但以上的前提,都是不能讓大語言模型打打輔助,不能喧賓奪主。「維基百科是關(guān)于人類聚集在一起試圖定義真相。這些工具不可靠,會分散我們對實際任務(wù)的注意力。我們應(yīng)該小心要以多快的速度追趕這一趨勢,而不是放棄它。我們應(yīng)該關(guān)注創(chuàng)造知識的人。」

        維基百科團(tuán)隊的態(tài)度,也折射了我們當(dāng)下對 AI 的審慎態(tài)度。沒有被取代,想充分利用 AI 的同時不夠信任它,想發(fā)揮 AI 的最大價值,但真正有價值的內(nèi)容又不敢輕易交付,難以放下人類本位的核心概念,謹(jǐn)慎地靠近,小心地追趕。

        維基百科如何和大語言模型共存,或許就回答了我們?nèi)祟惾绾闻c AI 共存。

        關(guān)鍵詞:

        責(zé)任編輯:hnmd003

        相關(guān)閱讀

        相關(guān)閱讀

        精彩推送

        推薦閱讀

        亚洲日本中文字幕天堂网| 久久久久久亚洲Av无码精品专口 | 国产精品亚洲综合专区片高清久久久 | 青青青亚洲精品国产| 亚洲av日韩av无码av| 亚洲首页在线观看| 亚洲成年轻人电影网站www| 亚洲综合伊人久久大杳蕉| 最新国产AV无码专区亚洲 | 亚洲精品国产高清嫩草影院| 婷婷国产偷v国产偷v亚洲| 日韩精品亚洲专区在线影视| 亚洲AV成人精品日韩一区| 国产精品亚洲AV三区| gogo全球高清大胆亚洲| 亚洲?v女人的天堂在线观看| 亚洲精品国产电影| 亚洲一区二区女搞男| 国产亚洲福利精品一区| 久久久久亚洲AV无码专区首| 99久久精品国产亚洲| 亚洲国产精品美女| 亚洲首页国产精品丝袜| 亚洲无人区码一二三码区别图片| 亚洲人成网站色7799| 国产精品亚洲а∨无码播放麻豆 | 亚洲国产天堂久久综合| 日韩精品亚洲aⅴ在线影院| 亚洲精品国偷自产在线| 亚洲AV人无码综合在线观看| 亚洲综合免费视频| 亚洲中文字幕无码一去台湾| 亚洲AV无码专区在线观看成人| 国产亚洲午夜精品| 怡红院亚洲怡红院首页| 久久夜色精品国产亚洲AV动态图 | 亚洲高清资源在线观看| 91丁香亚洲综合社区| 狼人大香伊蕉国产WWW亚洲| 久久青青草原亚洲av无码| 亚洲av无码一区二区乱子伦as|