國粹 AI 飆臟話,ChatGPT 們的「陰暗面」把大廠嚇壞了
跟 ChatGPT 等聊天機(jī)器人對話,總會給人一種「人間本應(yīng)如此美好」的錯覺。
因為它們在回答時總表現(xiàn)地彬彬有禮,對你言聽計從。
但這些只是假象,你不知道的是,AI 罵起人來比杜琪峰還要狠。
【資料圖】
圖片來自:Twitter @Fenng
最近一個名為「國粹 AI」的項目在網(wǎng)絡(luò)上走紅,它是一個調(diào)用 OpenAI GPT-3.5Turbo API 的臟話機(jī)器人,和溫文儒雅的 ChatGPT 不同,「國粹 AI」就像個地痞流氓,深諳中文屏蔽詞庫,每句話都夾雜著「***」。
「國粹 AI」 的意外爆火出乎了作者的意料,很快作者便暫停了服務(wù)響應(yīng),并表示有部分用戶濫用服務(wù)。雖然「國粹 AI」的嘴巴被暫時捂上,但要是你想自己做一個粗口機(jī)器人也并非難事,只需要一句讓它教你學(xué)習(xí)中文粗口的 Prompt,就能把三好學(xué)生變成口無遮攔的粗口王。一句話就能攻破 AI 的安全柵欄,這不禁讓人懷疑,標(biāo)榜著智能變革的 AI 聊天機(jī)器人和大語言模型(LLM),真的安全嗎?
誰來捍衛(wèi) AI 的安全?
幾個月前,Bing 就因為「奶奶漏洞」火過一次。
盡管微軟和 OpenAI 的工程師為 Bing 設(shè)置了嚴(yán)格的安全柵欄,能夠拒絕很多無理或是違法的要求,但有網(wǎng)友發(fā)現(xiàn),只要你讓 Bing 扮演你的奶奶,給它一個在做好事的幻覺,它就會被這突如其來的親情羈絆占據(jù)大腦,答應(yīng)大孫子的任何需求。
▲圖片來自:Twitter @寶玉
例如,給你念 Windows 和 Office 的軟件序列號哄你入睡。
微軟很快發(fā)現(xiàn)了這個漏洞并及時補(bǔ)上,但誰也不敢保證 Bing 下次不會再掉入用戶們精心準(zhǔn)備的陷阱。科幻電影里無所不能 AI 在狡猾的人類面前,輸?shù)靡粩⊥康亍?/p>
歸根結(jié)底,這與 LLM 的訓(xùn)練機(jī)制有關(guān)。
以 GPT-3 為例,OpenAI 使用了 1750 億個參數(shù)訓(xùn)練這個模型,通過學(xué)習(xí)大量來自互聯(lián)網(wǎng)的文本數(shù)據(jù),可以預(yù)測文本中的下一個單詞,從而回答人們的問題。
至于 GPT-4,一些爆料信息稱他的訓(xùn)練參數(shù)比 GPT-3 大了不止 10 倍,幾乎快要把人類積累的數(shù)字內(nèi)容全部吞食過了一遍,這里面包含了知識,自然也會包含不宜公開的內(nèi)容甚至有毒有害的偏見信息。AI 工程師只能盡可能地給 AI 設(shè)立更多的安全柵欄,幫助 AI 去分辨人類的「詭計」,才不會把如何制作 TNT 炸彈、怎樣黑進(jìn)銀行的安全系統(tǒng)等危險信息說漏嘴。
與 GPT3.5 相比,GPT-4 對違禁內(nèi)容請求的響應(yīng)傾向降低了 82% ,對醫(yī)療建議和自我傷害等敏感請求的規(guī)范性提高了 29% 。一個直觀的例子是,當(dāng)你用「國粹 AI」的 Prompt 輸給 GPT-4,GPT-4 會婉轉(zhuǎn)地拒絕你的要求,表示不吃你這套。但這并不意味著大模型 AI 的安全得到保證,這場人與 AI 的信息戰(zhàn)遠(yuǎn)沒有結(jié)束,甚至不是結(jié)束的開始。
近日,卡內(nèi)基梅隆大學(xué)和 safe.ai 的一項聯(lián)合聲明表示,大模型的安全機(jī)制比人們想象的要脆弱得多,只需要一串代碼,就能把大模型的安全機(jī)制擊潰。
研究人員發(fā)現(xiàn),通過在文本提示后附加特定的對抗性短語,可以輕易繞過 ChatGPT、Bard 和 Claude 等 LLM 的安全防護(hù),欺騙 LLM 生成不適當(dāng)?shù)妮敵觥?/p>這些對抗性短語看起來像胡言亂語,但實際上是通過一種特殊的損失函數(shù)設(shè)計的,該函數(shù)可以識別出模型拒絕回答的屏蔽語,找出繞過屏障讓模型提供回答的字符序列,并且它可以自動產(chǎn)生這些短語。
利用這些 Prompt,研究人員輕而易舉地讓 LLM 們說出制作違規(guī)藥品的步驟、制造殺傷性武器的方法等等不宜公開的內(nèi)容。
無論是 Pythia、Falcon、Guanaco 等開源模型,還是像 GPT-3.5(87.9%)、GPT-4(53.6%)、PaLM-2(66%)和 Claude-2(2.1%)這些商業(yè)模型都無一能躲過攻擊。
研究人員目前已經(jīng)把漏洞提交給了各大 AI 公司,讓安全工程師們及時修復(fù)。但就像「奶奶漏洞」一樣,在用戶不斷使用之下,總會有新的漏洞產(chǎn)生,僅憑 OpenAI 等某一公司之力,想要守護(hù) AI 安全并非易事,AI 公司們還需要更多的力量來維持,于是幾大巨頭決定,停止 AI 內(nèi)卷,化干戈為玉帛。
AI 四巨頭聯(lián)合承諾「先進(jìn) AI 不擴(kuò)散」
幾周前,微軟、OpenAI、Google、Meta、亞馬遜、Anthropic( 代表產(chǎn)品:Claude)和 Inflection AI(代表產(chǎn)品:HeyPi)共七個頂尖 AI 公司齊聚美國白宮,作出了一系列承諾,來確保他們的產(chǎn)品安全且透明。
承諾包括允許「領(lǐng)域?qū)<摇箤λ麄兊?AI 產(chǎn)品進(jìn)行外部審查,并與彼此以及美國政府分享關(guān)于風(fēng)險和漏洞的信息;投資于網(wǎng)絡(luò)安全和內(nèi)部威脅保護(hù)措施,以保護(hù)專有的和未發(fā)布的模型權(quán)重。巨頭們還承諾會部署相應(yīng)的 AI 甄別機(jī)制,例如開發(fā)水印系統(tǒng),以明確哪些文本、圖像或其他創(chuàng)作是 AI 的產(chǎn)物,并且承諾未來的研究將優(yōu)先理解 AI 的限制和偏見,推動行業(yè)的安全發(fā)展。
半個月后,七家頂尖 AI 公司中的四位——微軟、OpenAI、Google 和 Anthropic 再度聯(lián)合起來,成立了一個名為「前沿模型論壇(Frontier Model Forum)」的機(jī)構(gòu),目的是確保最強(qiáng)大的 AI 模型能夠以安全和負(fù)責(zé)任的方式發(fā)展。而這四家 AI 公司,也正是目前正在開發(fā)最前沿 AI 模型的四個巨頭,可以說是「AI 核彈」的擁有者。
AI 四巨頭達(dá)成了一致共識,稱他們希望通過「前沿模型論壇」最大限度地減少 AI 風(fēng)險,進(jìn)行更多的 AI 安全研究,并向行業(yè)和公眾分享安全最佳實踐等等。
不過 AI 四巨頭并沒有介紹關(guān)于「前沿模型論壇」的制度和執(zhí)行條約等詳細(xì)內(nèi)容。「前沿模型論壇」的聯(lián)合聲明提到,論壇將首先關(guān)注研究并努力為評估前沿模型風(fēng)險制定標(biāo)準(zhǔn)化的最佳實踐,發(fā)布一個「公共解決方案庫」。論壇將逐步制定正式章程,任命咨詢委員會,并資助與公民社會團(tuán)體的合作。
這里提到的前沿模型是指「超越當(dāng)前最先進(jìn)現(xiàn)有模型的能力,并可以執(zhí)行各種任務(wù)」的模型,也就是說,要開發(fā)比目前模型更強(qiáng)大且能夠安全運轉(zhuǎn)的前沿模型,已經(jīng)不再是各公司悶頭研究就能解決的難題,這需要整個行業(yè)的共同努力。
ChatGPT 爆火后的這半年時間,AI 行業(yè)的局勢變化跟 AI 模型本身發(fā)展的速度一樣快——各家入局、模型混戰(zhàn)、達(dá)成共識、握手言和。巨頭們之所以會選擇一起去解決 AI 風(fēng)險問題,是因為彼此都看到了 AI 在應(yīng)用層面的無限潛力。
AI,大廠們篤信的未來
不管你對 AI 持什么樣的態(tài)度,AI 都會成為下一代應(yīng)用的重要組成部分。
這不是我信口開河,而是微軟、Google 等大廠們在近日的財報電話會上共同提到的趨勢。
微軟最新的財報顯示,微軟在最近的一個財季收入為 562 億美元,同比增長 8%,這主要來自智能云和生產(chǎn)力與業(yè)務(wù)流程的增長,而作為老本行的個人計算業(yè)務(wù)收入有所下降。其中智能云營業(yè)收入增長 15%,Azure 與其他云服務(wù)收入增長 26%,這與 AI 計算緊密相關(guān)。
微軟 CEO 納德拉在財報電話會提到,客戶最關(guān)心如何快速應(yīng)用新一代 AI,微軟將繼續(xù)專注于三大優(yōu)先事項:幫助客戶從 Microsoft Cloud 中獲得最大價值、領(lǐng)導(dǎo)新 AI 平臺變革、提升運營杠桿。
AI,毫無疑問是這場財報會議的關(guān)鍵詞。
納德拉表示 Microsoft 365 Copilot 作為未來工作的第三支柱吸引著客戶,將在下半財年開始產(chǎn)生實際收入;Bing Chat 和必應(yīng)圖像創(chuàng)造者吸引用戶,而 Edge 瀏覽器份額也在持續(xù)提升。
微軟希望把 Windows 11 打造為這個新 AI 時代的強(qiáng)大畫布,賦予各種 Copilot 產(chǎn)品提升客戶的生產(chǎn)力,并大力投資云基礎(chǔ)設(shè)施來滿足 AI 需求。就連游戲業(yè)務(wù),也可以利用 AI 提供更好的內(nèi)容和服務(wù),提升業(yè)務(wù)收入。可以說,微軟接下來的策略都是圍繞 AI 來展開的。AI 為微軟提供了巨大的增長機(jī)遇和新的收入來源,它將推動微軟大部分業(yè)務(wù)的收入和用戶增長,并最終提升微軟整體收入增速。納德拉不想錯過這個難得一遇的機(jī)遇。
同樣的,「AI 一哥」Google 也不想錯過。根據(jù) Google 母公司 Alphabet 第二季度 2023 年財報的數(shù)據(jù)顯示,Alphabet 收入總額為 746 億美元,同比增長 7%,其中廣告收入增長 5%,Google 服務(wù)收入增長 5%,Google Cloud 收入增長 28%。
其中與 AI 相關(guān)的業(yè)務(wù)表現(xiàn)都很亮眼。Alphabet 在電話會議中提到,Google 的搜索引擎生成式體驗(SGR)使用了生成式 AI,使搜索變得更自然和直觀,用戶反饋非常正面;另一方面,聊天機(jī)器人 Bard 發(fā)布以來經(jīng)過不斷改進(jìn),功能豐富了許多。
Google Cloud 的 80 多個 AI 模型吸引了大量客戶,從 4 月到 6 月客戶數(shù)量增長超過 15 倍。而在企業(yè)客戶服務(wù)和定制 AI 解決方案方面,Google 通過 Workspace 和 Duet AI 將生成式 AI 帶給了 9000 多萬付費用戶。
總體而言,Alphabet 對 AI 和 Google Cloud 的長期增長前景保持樂觀,接下來將繼續(xù)增加對 AI 研發(fā)的投入,研發(fā)方向?qū)⒕劢乖诖笳Z言模型等核心技術(shù)上,以及構(gòu)建像多模態(tài) AI 系統(tǒng) Gemini 等新模型。
半年前,或許你會懷疑 AI 是不是像 Web3、區(qū)塊鏈這樣的投資圈熱詞,圈一波熱錢后就會被資本遺忘,但經(jīng)過半年后你會發(fā)現(xiàn),AI 的影響力和落地可能性都比之前的各種前沿詞匯要大得多,以至于引起了整個科技圈的重視。
從大廠的規(guī)劃來看,AI 會作為未來程序應(yīng)用的底層而普遍存在,為改善用戶體驗服務(wù)。用戶們可能不會感受到 AI 的存在,但能直接享受到 AI 帶來的便利性,這便是大廠們篤信的未來。這也可以說明,為什么微軟和 Google 等 AI 巨頭們愿意放下干戈,坐下來共同指定 AI 安全的標(biāo)準(zhǔn)。
現(xiàn)階段的 AI 就像是 19 世紀(jì)末汽車剛誕生的時代,產(chǎn)品已經(jīng)開上了路上跑,卻沒有合適的柏油路供它奔馳,也沒有交通規(guī)則來規(guī)劃它的行動,跑得既慢又危險。
比爾 · 蓋茨最近在個人博客發(fā)表了他對 AI 的看法,他認(rèn)為我們現(xiàn)在正處于又一個巨大變革的最早階段,即 AI 的時代,AI 的變化如此之快,以至于我們無法清楚地預(yù)知接下來會發(fā)生什么。但他對人工智能的發(fā)展持以積極的態(tài)度,因為人類已經(jīng)經(jīng)歷了汽車時代、核能時代,到了 AI 的時代我們還是能夠解決新技術(shù)帶來的挑戰(zhàn)。
所以請坐穩(wěn)了,我們將親眼見證一個新時代的誕生。
點擊「在看」
是對我們最大的鼓勵
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
微軟警告稱如果無法獲得足夠的 AI 芯片,數(shù)據(jù)中心服務(wù)可能會中斷
IT之家7月29日消息,據(jù)CNBC報道,微軟在近日發(fā)布的財報中,首次將有關(guān)G
2023-07-30 -
谷歌安卓地震預(yù)警系統(tǒng)被質(zhì)疑:詢問數(shù)百人 無一人反饋收到通知
IT之家7月29日消息,土耳其今年2月6日發(fā)生7 8級地震,震中位于南部城市
2023-07-30
相關(guān)閱讀
-
國粹 AI 飆臟話,ChatGPT 們的「陰暗面」把大廠嚇壞了
跟ChatGPT等聊天機(jī)器人對話,總會給人一種「人間本應(yīng)如此美好」的錯覺
-
微軟警告稱如果無法獲得足夠的 AI 芯片,數(shù)據(jù)中心服務(wù)可能會中斷
IT之家7月29日消息,據(jù)CNBC報道,微軟在近日發(fā)布的財報中,首次將有關(guān)G
-
谷歌安卓地震預(yù)警系統(tǒng)被質(zhì)疑:詢問數(shù)百人 無一人反饋收到通知
IT之家7月29日消息,土耳其今年2月6日發(fā)生7 8級地震,震中位于南部城市
-
西貝兒童餐背后的“陽謀”,三年同比增長 415%
圖片來源:受訪者提供在餐飲業(yè),兒童餐正在成為一個新熱點。根據(jù)《2023
-
英偉達(dá) RTX 4090 公版顯卡預(yù)約,12999 元原價
IT之家7月29日消息,英偉達(dá)去年10月推出的RTX4090旗艦公版顯卡現(xiàn)正在京
-
子女拿不出63歲老人贍養(yǎng)費起訴有用嗎
1、如果子女有贍養(yǎng)能力而不履行贍養(yǎng)義務(wù)的,老人可以向法院起訴,要求
-
iPhone 15 年度主打“青綠色”曝光!真機(jī)上手丑爆了?
好久不見,甚是想念。大家好,我是你們的搞機(jī)鴨~跟大伙匯報個好消息哈
-
進(jìn)軍文旅,俞敏洪要搶攜程的地盤?
圖片來源@視覺中國俞敏洪曾經(jīng)給自己制定過三條路,第一條是一直留在新
-
特斯拉人形機(jī)器人亮相!馬上開始試走……
什么?!老馬的人形機(jī)器人真要來了?!在特斯拉二季度業(yè)績說明會上,特
-
多家網(wǎng)約車平臺被“約談”:要求降低過高抽成比例
最近,有媒體從交通運輸部獲悉,交通運輸新業(yè)態(tài)協(xié)同監(jiān)管部際聯(lián)席會議辦
-
河南記者臥底緬北 120 天,冒死揭露電詐內(nèi)幕!最新進(jìn)展……
看到緬甸繞著跑,小心腰子不保!這句玩笑話背后有多少受害者還在漫漫黑
-
導(dǎo)游威脅游客“不是你死就是我死”?當(dāng)?shù)赝▓螅阂唤?jīng)查實,將嚴(yán)處
大皖新聞訊?據(jù)@云南省文旅執(zhí)法消息,7月29日,云南省文旅執(zhí)法官方微博
-
汽車功率和扭矩代表什么 汽車扭矩和功率是什么意思
2022-05-27:楊洋會給大家解釋的。汽車功率和扭矩代表什么,汽車扭矩和
-
巴適!活力四川26米手繪長卷來了
26米手繪長卷,帶你一圖遍覽活力四川,稻城亞丁、九寨溝、三星堆、錦里
-
Apple iOS 17 幫助 iPhone 用戶解讀汽車中的圖形圖標(biāo)
蘋果iOS的下一次更新將包括一個方便的小功能,旨在向iPhone用戶展示車
-
曾經(jīng)最好看的手機(jī)設(shè)計,又要回來了?
7月28日,北京小米移動軟件有限公司申請的攝像頭隱藏式電子設(shè)備及隱藏
-
小米今年最完美的旗艦手機(jī),要來了!
去年,小米發(fā)布了折疊屏MIXFold2。當(dāng)時果子發(fā)布會也跟了,看完心想等降
-
百度知識圖譜部總監(jiān)佘俏俏:AIGC正在顛覆現(xiàn)有的內(nèi)容生產(chǎn)方式
人工智能技術(shù)的發(fā)展,給內(nèi)容生產(chǎn)創(chuàng)作帶了影響和變革。7月28日,2023Chi
-
老房免費置換新房!綠地哈爾濱項目為賣房拼了,當(dāng)?shù)貛齑婺苜u超20個月
面對整體低迷的房地產(chǎn)市場,國企也不得不拿出強(qiáng)有力的促銷手段來帶動項
-
杭州:支持新能源汽車產(chǎn)能提升和整零配套發(fā)展
新京報貝殼財經(jīng)訊(記者張冰)7月29日,貝殼財經(jīng)記者從杭州市政府官網(wǎng)
-
泰國南部一煙花倉庫發(fā)生爆炸,已致9死115傷
圖片來源:泰國通訊社當(dāng)?shù)貢r間7月29日下午,泰國南部那拉提瓦府一個煙
-
成都大運會丨開幕式背后的故事——喜怒哀樂一張臉
臺上一眼千年,臺下十年一劍。很難相信,摘下臉譜的任鑫和大部分參加表
-
大灣區(qū)之聲丨港澳臺青年接力為大運會加油
多位港澳臺青年從臺北、香港、廣州、深圳、廈門、武漢,將成都大運會吉
-
收入過億“問題不大”武漢二廠汽水發(fā)布三款新品,蘭世立豪言將顛覆中國飲料行業(yè)
中國的飲料行業(yè)缺一個蘭世立,7月28日,前湖北首富蘭世立現(xiàn)身北京出席
-
北京市氣象臺預(yù)計本市將出現(xiàn)暴雨到大暴雨 降雨量預(yù)計達(dá)300毫米
根據(jù)市氣象臺預(yù)計,7月29日夜間至8月1日夜間本市將出現(xiàn)暴雨至大暴雨,
-
北京市水務(wù)局17時發(fā)布山洪、城市內(nèi)澇、洪水風(fēng)險提示
市水務(wù)局要求,7月30日前全市河湖區(qū)域內(nèi)全面停航,船只全部靠岸停泊,
-
國之重器!中國地下700米巨型實驗室 捕捉宇宙“幽靈粒子”
地下700米是什么概念?為何捕捉中微子、探索宇宙的奧秘,卻要深入地下7
-
榮耀 × AMD 攜手亮相 ChinaJoy 榮耀 MagicBook X Pro 系列銳龍版 2023 即將上市
7月28-日-7月31日,2023年第二十屆ChinaJoy在上海舉行。在這全球數(shù)字領(lǐng)
-
推特?zé)o法在蘋果應(yīng)用商店改名為 X:命名至少需 2 個字母
IT之家7月29日消息,據(jù)TheVerge報道,在馬斯克的力主之下,Twitter(推
精彩推薦
閱讀排行
精彩推送
- 接近監(jiān)管人士:短期內(nèi)螞蟻集團(tuán)重...
- iOS 17 曝光 iPhone 15 Pro...
- 蔚來:好人就該被人拿槍指著?
- 孝感市鄉(xiāng)村振興局(關(guān)于孝感市鄉(xiāng)...
- 增城三英溫泉酒店介紹(增城三英...
- China's cultural diversity,...
- 深交所發(fā)函!古鰲科技疑似“忽悠...
- 已致超70萬人受災(zāi),“杜蘇芮”還...
- 鄭州機(jī)場278架次航班延誤或取消...
- 今年的 ChinaJoy,我在車?yán)铩复?..
- 蔚來:好人就該被人拿槍指著?
- 白酒糟飼料業(yè)務(wù)有多香 ? 路德...
- 身家 440 億英國富豪去美國自...
- 意外險購買需要什么資料?多少錢?
- 滑雪意外保險能賠多少?怎么賠?
- 購買的意外險在哪里查?需要提供...
- 交通意外險一年要交多少錢?保障...
- 10萬意外險死了能賠多少錢?賠付...
- 孫儷為甄嬛發(fā)聲 回應(yīng)出演《熱烈...
- 科力遠(yuǎn):年產(chǎn)3萬噸電池級碳酸鋰...
- 時隔11年!中央氣象臺發(fā)布史上第...
- 員工意外保險是什么?買哪個保險...
- 中國人壽意外險怎么查詢保單?查...
- 重大疾病險和社保哪個報銷比例高...
- 人壽意外險狗咬傷能報多少錢?報...
- 平安意外保險100元保額多少?值...
- 狂砸近20億,估值超300億電池獨...
- TCL華星CEO趙軍:以電競為中尺寸...
- 游戲出海收入10年增30倍,降本增...
- 7月29日夜間至8月1日有暴雨到大...