ChatGPT，能成為新的「維基百科」嗎？世界滾動

2023-05-13 21:27:31來源：ZAKER科技

22 年前，2001 年初，維基百科 Wikipedia 橫空出世，在其后的互聯(lián)網(wǎng)時代，成為人們獲取知識的重要平臺。

【資料圖】

但在剛開始，人們對維基「人人可編輯」的組織形式產(chǎn)生過質(zhì)疑。甚至有電視主持人諷刺其為「wikiality」，即如果在維基百科上編造條目，只要有足夠多的人同意，它就會成為現(xiàn)實。

后來，隨著《自然》（Nature）雜志的調(diào)查研究，發(fā)現(xiàn)維基百科準(zhǔn)確度接近大英百科全書，Google 開始把維基百科放到搜索結(jié)果的首項，維基社區(qū)和內(nèi)容貢獻(xiàn)者也持續(xù)壯大，維基百科用了很多年時間終于取得了公眾的信任。

誕生之初遭到質(zhì)疑，越來越多人參與去完善，而后平反收到大眾認(rèn)可，繼而成為日常的工具，這一過程，僅誕生半年的 ChatGPT 正在經(jīng)歷，不僅于此，它還成為了維基百科的挑戰(zhàn)者。

不久前，維基媒體基金會召開 2023-2024 年度計劃的電話會議，會議中提及了 35 次 AI，討論的主題也是圍繞 ChatGPT 帶來的挑戰(zhàn)。

但維基百科所擔(dān)心的挑戰(zhàn)，并不是被 ChatGPT 取代。而是更深刻地考驗：未來的維基百科，會由 ChatGPT 來撰寫嗎？

維基百科的內(nèi)容哪里來的？

要想知道 ChatGPT 能否撰寫維基百科，得先知道維基百科目前內(nèi)容來源于哪里。

維基百科主要是由來自互聯(lián)網(wǎng)上的志愿者共同合作編寫而成，任何使用網(wǎng)絡(luò)進(jìn)入維基百科的用戶都可以編寫和修改里面的文章。它是互聯(lián)網(wǎng)上一個極大的自由內(nèi)容、公開編輯、多語言的網(wǎng)絡(luò)百科全書協(xié)作計劃。

截至 2021 年初，所有語種的維基百科條目數(shù)量達(dá) 5500 萬條，如何確保內(nèi)容上的準(zhǔn)確，全靠維基社群志愿者們的篩查。

在 ChatGPT 出現(xiàn)前，維基百科已經(jīng)長期在用 AI 去減少一些人力成本。應(yīng)用最多的就是把現(xiàn)有條目直接機(jī)器翻譯，再由人工編輯校對。

2016 年時，資深科學(xué)家 Aaron Halfaker 開發(fā)了一套開源機(jī)器學(xué)習(xí)算法，可以自動識別維基百科里那些惡意破壞條目和編輯假消息的行為；2020 年，MIT 的研究人員也為維基百科推出過基于 AI 的修改功能，可以精確定位維基百科句子中的特定信息，并自動替換為類似于人類編輯的語言。

Wikipedia 關(guān)于 ChatGPT 的頁面｜Wikipedia

以及如維基社群所述，人工智能非常擅長總結(jié)把一篇很長的技術(shù)類條目，總結(jié)成兒童都能理解的版本，讓 AI 去生成兒童版的維基百科效果很好。

翻譯、檢查、概括簡化已有內(nèi)容，維基百科一直以來對 AI 的應(yīng)用僅限于此，直到大型語言模型 ChatGPT 的出現(xiàn)。

目前仍以文字方式交互為主的 ChatGPT，除了回答用戶直接的提問以外，還可以用于甚為復(fù)雜的語言工作，包括自動生成文本、自動問答、自動摘要等等。

ChatGPT 可以寫出相似真人的文章，并在許多知識領(lǐng)域給出詳細(xì)和清晰的回答。哪怕 ChatGPT 生成內(nèi)容的事實準(zhǔn)確度還需要人工去二次查閱，但這時維基百科面臨的問題已經(jīng)很明顯了：志愿者能否用 ChatGPT 來撰寫維基百科條目？

能不能和想不想

紐約市維基媒體分會的老維基人 Richard Knipel 就用 ChatGPT 在維基百科上起草了一個名為「藝術(shù)作品標(biāo)題」的新條目，Knipel 表示，ChatGPT 給出的版本一般但語法正確，定義了藝術(shù)作品標(biāo)題的概念，給出了從古至今的例子。他在草稿基礎(chǔ)上只做了輕微修改。

但另一位編輯在條目上標(biāo)注，將會進(jìn)行大量修改并完善。如今，我們再點(diǎn)進(jìn)這一條目，會發(fā)現(xiàn)它增加了大量內(nèi)容和理論索引，還梳理出了目錄，給出了圖片案例。像 Knipel 這樣的維基人認(rèn)為，ChatGPT 可以作為生成維基百科條目草稿、骨架的工具，在此基礎(chǔ)上，人工再驗證內(nèi)容，編輯和充實條目。

但另一派維基人則認(rèn)為，在維基百科條目的創(chuàng)作里 ChatGPT 應(yīng)該完全被禁用。一位維基百科編輯就表示「我們應(yīng)該強(qiáng)烈呼吁不使用 AI 工具來生成條目草稿，即使這些條目隨后會被人工審閱。ChatGPT 太擅長引入那些看起來很有道理的謊言。」

ChatGPT 起草，人工簡單編輯的版本｜Wikipedia人工大量干預(yù)后產(chǎn)生的版本｜Wikipedia

但另一派也反駁這種說法，就像 Knipel 認(rèn)為，修改并豐富不完善的信息，這就是維基百科在實踐中一直運(yùn)作的方式。ChatGPT 將繼續(xù)存在并飛速發(fā)展，利用它同時強(qiáng)調(diào)人工干預(yù)的必要性怎么就不行呢？把 ChatGPT 上來就視作洪水猛獸實在有些偏頗。

但在想不想之前，我們先看看能不能。ChatGPT 還夠不夠格直接編寫維基百科呢？

3 月 30 日時，維基百科創(chuàng)始人 Jimmy Wales 在接受 Evening Standard 采訪時討論了這個議題。Wales 認(rèn)為，讓 ChatGPT 能獨(dú)立寫一個完整的維基條目，目前還有一段距離，但距離多遠(yuǎn)就難說了。「ChatGPT 的一大問題是會胡編亂造，業(yè)內(nèi)把這種情況稱為 hallucinating（幻覺）——我稱之為編瞎話。」（One of the issues with the existing ChatGPT is what they call in the field 『hallucinating』— I call it lying.）

「ChatGPT 有一種憑空捏造的傾向，這對維基百科來說真的不太行。」Wales 在采訪里說道。實踐中也是如此，你在維基百科上搜一個詞，維基百科可能會反饋「該條目不存在」，但你問 ChatGPT，它可能會給你生成一段沒由頭的假消息。

ChatGPT 會「說瞎話」，這種事已經(jīng)不新鮮了。但 ChatGPT 誕生僅半年，它的自我迭代能力已經(jīng)令人咋舌，讓 ChatGPT「句句吐真言」，似乎只是時間問題，那維基百科現(xiàn)在擔(dān)憂的是什么呢？

人力有限，算力「無限」

維基百科團(tuán)隊并沒有那么擔(dān)心內(nèi)容到底來源于人類還是 AI，它擔(dān)心的是內(nèi)容質(zhì)量是否過關(guān)。

在維基媒體基金會在電話會議總結(jié)報告里，「挑戰(zhàn)」被放到了開篇，其中最大比重的部分，也是維基百科團(tuán)隊最大的擔(dān)憂在于：維基百科涌入大量 AI 生成的內(nèi)容，把真正高質(zhì)量的、正確的信息給淹沒了。

「Wiki 項目有大量高質(zhì)量的、可靠的，結(jié)構(gòu)化的、分類好的內(nèi)容。這就是我們帶給世界的價值。最讓我害怕的不是人們使用 GPT 之類的大語言模型來獲取知識，而是需要巡查的 AI 生成的內(nèi)容會爆炸式增長。」

對高質(zhì)量內(nèi)容來說，創(chuàng)作比消費(fèi)的時間成本高很多，就像一篇較為完整的維基條目，需要許多人參與撰寫，花許多時間，走過很多流程后完成，對讀者來說幾分鐘就閱讀完了。

像維基百科這種平臺，為了保證內(nèi)容質(zhì)量，還需要專業(yè)人士核查一條條目中每個信息、數(shù)據(jù)、引用是否來源準(zhǔn)確，篩查和編輯的成本同樣很高。因此 AI 生成內(nèi)容越多，人工核查的時間也更長。而且哪怕 ChatGPT 給出了正確的結(jié)論，但它并不會直接給出結(jié)論的論據(jù)來源何處，人工還需要再找到論據(jù)。到最后，修正可能比撰寫耗時更長。

Wikipedia 的條目下會有很多延展閱讀鏈接｜Wikipedia

目前維基百科志愿者們已經(jīng)發(fā)現(xiàn)了許多 ChatGPT 自動生成內(nèi)容上的問題。比如 ChatGPT 很容易太籠統(tǒng)地概括定義，導(dǎo)致表意不明。還有 ChatGPT 遣詞造句過于肯定，不夠匹配維基百科想呈現(xiàn)的客觀中性的文字風(fēng)格。

最重要的是信源難以查詢，維基百科的可信度和擴(kuò)展閱讀性，很大程度上是基于條目底下豐富的信息參考來源，但 ChatGPT 不會主動提供參考，甚至?xí){空捏造。

擔(dān)任了 20 年維基百科志愿編輯的 Andrew Lih 在用 ChatGPT 起草新條目時就發(fā)現(xiàn)，ChatGPT 概述定義做得很不錯，但它所提供的消息來源于《福布斯》、《衛(wèi)報》、《今日心理學(xué)》，但 Lih 仔細(xì)查閱后發(fā)現(xiàn)，這些信源文章并不存在，甚至 ChatGPT 給出的 URL 都是自動生成找不到頁面的假鏈接。

綜上，維基百科團(tuán)隊直接表示，AI 生成內(nèi)容的速度和效率，可能會超出項目的運(yùn)行能力。

除此之外，還有許多維基百科團(tuán)隊會擔(dān)心的點(diǎn)，比如如今的維基百科貢獻(xiàn)者里，使用英語的白人男性依舊是主體，維基內(nèi)容已帶有語言和內(nèi)容偏見，ChatGPT 靠吸納互聯(lián)網(wǎng)信息為養(yǎng)料的 AI 機(jī)器，生成出的內(nèi)容會進(jìn)一步放大偏見。

Wikipedia 聯(lián)合創(chuàng)始人 Jimmy Wales 在接受 Standard 采訪時談及 AI 參與撰寫維基的問題｜Standard.co

維基百科團(tuán)隊也無法把握志愿者對 AI 工具使用的傾向。Lih 就認(rèn)為，維基人不缺動力，缺的是時間，ChatGPT 生成的糟糕草稿，可以激發(fā)維基志愿者的修改欲。這也符合維基之父 Ward Cunningham 所提出的「坎寧安定律」：在互聯(lián)網(wǎng)上得到優(yōu)秀答案的最佳方法不是去提問，而是發(fā)布一個錯誤的答案。

維基百科團(tuán)隊還擔(dān)心，當(dāng)維基百科充斥著 AI 生成的內(nèi)容時，用戶們會降低對它信息的信任度，轉(zhuǎn)而去信任更有「人類作者」標(biāo)識的媒體內(nèi)容，比如會出鏡的視頻，標(biāo)記了作者的媒體報刊。

就不能共存嗎

維基百科和 ChatGPT 有很多相似性，比如都以文本為主，試圖「回答一切」。但二者最顯著的區(qū)別，在于回答方式的不同。

維基百科是有框架、系統(tǒng)、詳細(xì)索引的百科式信息，你點(diǎn)進(jìn)一個條目，可以從最簡單的概括式介紹了解到其歷史的變化，通過條目里豐富的擴(kuò)展鏈接，可以在縱向里深入了解，也能在橫向里在不同條目之間跳轉(zhuǎn)，擴(kuò)展對一整個領(lǐng)域的了解。

ChatGPT 目前呈現(xiàn)出的還是提問式的交互，需要用戶明確了解自己想知道的問題，向外擴(kuò)展也是需要建立在 ChatGPT 給出的回答之上，進(jìn)一步詢問。

不同用戶獲取信息的傾向不同，選擇工具也不同，維基百科無法做到 ChatGPT 一樣能回答非常具體的問題，ChatGPT 也不會像維基百科一樣有那么精準(zhǔn)且梳理好的知識類信息。這二者的使用方式，就像我們選擇閱讀教科書，還是直接向教授提問。

就像維基百科并沒有因為搜索引擎 Google 的崛起而磨滅，反而它會出現(xiàn)在 Google 搜索結(jié)果的第一條和邊欄上。

維基百科團(tuán)隊也并沒有如 Google 一般有那么大的危機(jī)感，在年度會議里，雖然開篇點(diǎn)了 ChatGPT 帶來的挑戰(zhàn)，但整個會議更多的時間留給了「機(jī)會」。

「當(dāng)互聯(lián)網(wǎng)上有大量 AI 生成的內(nèi)容時會發(fā)生什么？在一個由數(shù)萬億個低質(zhì)量、低可信度的頁面組成的互聯(lián)網(wǎng)，創(chuàng)建大模型的人和用戶都需要去找到可靠的信息，他們可能會更多地使用維基百科。」這就是維基人眼中的「機(jī)會」。

利用大語言模型去查 bug、翻譯、內(nèi)容總結(jié)、豐富媒體形式，比如 GPT-4 中體現(xiàn)的視頻生成，AI 生成的圖片也可以放到很多抽象概念的條目里，增加可讀性，還可以在文本和語音之間互相轉(zhuǎn)換。

但以上的前提，都是不能讓大語言模型打打輔助，不能喧賓奪主。「維基百科是關(guān)于人類聚集在一起試圖定義真相。這些工具不可靠，會分散我們對實際任務(wù)的注意力。我們應(yīng)該小心要以多快的速度追趕這一趨勢，而不是放棄它。我們應(yīng)該關(guān)注創(chuàng)造知識的人。」

維基百科團(tuán)隊的態(tài)度，也折射了我們當(dāng)下對 AI 的審慎態(tài)度。沒有被取代，想充分利用 AI 的同時不夠信任它，想發(fā)揮 AI 的最大價值，但真正有價值的內(nèi)容又不敢輕易交付，難以放下人類本位的核心概念，謹(jǐn)慎地靠近，小心地追趕。

維基百科如何和大語言模型共存，或許就回答了我們?nèi)祟惾绾闻c AI 共存。

關(guān)鍵詞：

責(zé)任編輯：hnmd003