面向現實世界場景,多語言大數據集 PRESTO 來了
機器之心報道
機器之心編輯部
(資料圖片僅供參考)
PRESTO –一個多語言數據集,用于解析現實的面向任務的對話。
虛擬助理正日益融入我們的日常生活。它們可以幫助我們完成很多事情:從設置鬧鐘到在地圖導航,甚至可以幫助殘疾人更容易地管理他們的家。隨著我們使用這些助手,我們也越來越習慣于使用自然語言來完成那些我們曾經用手完成的任務。
構建強大虛擬助理所面臨的最大挑戰之一是確定用戶想要什么,以及完成這些任務需要哪些信息。在自然語言處理(NLP)的相關文獻中,這件事被定義為一個面向特定任務的對話解析任務,其中給定的對話需要由系統解析,以理解用戶意圖并執行操作來實現該意圖。
基于定制化的數據集,如 MultiWOZ、TOP、SMCalFlow 等,學術界在處理面向特定任務的對話方面取得了一些進展。但這些數據集缺乏模型訓練所需的典型語音場景,無法優化語言模型性能,仍然有很大的進步空間。由此產生的模型往往表現不佳,用戶對互動功能的效果有一些失望。相關的語音場景涉及內容修改場景、不流暢的對話語序場景、不同語言混合使用場景,以及使用圍繞用戶環境的結構化上下文,其中可能涉及用戶的筆記、智能家居、聯系人列表等。
例如以下對話,該對話說明了用戶需要修改其話語時的一個常見實例:
體現了用戶修訂的對話實例。虛擬助理誤解了用戶的請求,并試圖撥打不正確的聯系人。因此,用戶必須修改他們的話語以糾正助手的錯誤。為了正確地解析最后一句話,助理還需要解釋用戶特指的內容 — 在這種情況下,它需要知道用戶在他們的手機中保存了一個聯系人名單,它應該參考這個名單。
另一類對虛擬助理具有挑戰性的困難場景是混合語言采場景,當用戶在對助理講話時從一種語言切換到另一種語言時,就會發生語言混合使用。例如下面的話語:
英語和德語文本混合使用的對話示意圖。在本例中,用戶從英語切換到德語,其中「vier Uhr」在德語中的意思是「四點鐘」。
為了推進解析這種現實存在的復雜語言文本的研究,近日,谷歌助手團隊和哥倫比亞大學俞舟教授合作推出一個名為 PRESTO 的新數據集,這是一個用于解析現實任務對話的多語言數據集,其中包括大約 50 萬人與虛擬助理之間的現實對話。
該數據集涵蓋六種不同的語言,包括用戶在使用助手時可能遇到的多種對話場景,包括用戶定制改變、不流暢的對話語序場景、不同語言混合使用場景。數據集還包括結構化的上下文,例如用戶的聯系人列表。PRESTO 對各種場景進行了標注,使人們能夠創建不同的測試集來分別分析這些語言場景的模型性能。
論文鏈接:https://arxiv.org/abs/2303.08954研究者發現,這些場景中的一些更容易建模,只需很少的樣本,而另一些場景則需要更多的訓練數據。
數據集特征
涉及六種語言
我們數據集中的所有對話都是由語言對應的原生使用者提供,包括六種語言 —— 英語、法語、德語、印地語、日語和西班牙語。這與其他數據集,如 MTOP 和 MASSIVE 形成了鮮明對比。上述數據集僅將話語從英語翻譯成其他語言,并不一定反映以非英語為母語的人的語言模式。
結構化上下文
用戶在與虛擬助理交互時,通常會使用存儲在設備中的信息,如筆記、聯系人和列表。然而,助手通常無法訪問此上下文,這可能導致在處理用戶話語時出現解析錯誤。為了解決這個問題,PRESTO 包括三種類型的結構化上下文、注釋、列表和聯系人,以及用戶話語及其解析。列表、筆記和聯系人由每種語言的母語使用者在數據收集過程中編寫。有了這樣的上下文,研究者可以探索如何使用這些信息來提高解析面向任務的對話模型的性能。
PRESTO 中的每個例子都包括:輸入 —— 用戶的虛擬狀態(上下文)、一個或多個用戶的對話,以及虛擬助理的回應(對話)。輸出 —— 對話中最后一個用戶話語的語義解析(parse)。內容修改場景
用戶在與虛擬助理交談時,修改或糾正自己的話語是很常見的。這些修改發生的原因有很多 —— 助手可能在理解話語方面犯了錯誤,或者用戶在發表話語時改變了他們的想法,例如圖二。其他例子包括取消自己的請求(「不要添加任何東西?!梗┗蛟谕粋€語詞中糾正自己(「添加面包 — 不,不,等等 — 在我的購物清單上添加小麥面包?!梗?。在 PRESTO 的所有例子中,大約有 27% 的例子有某種類型的用戶修改,并且在數據集中有明確的標記。
語言混合使用場景
截至 2022 年,世界上大約有 43% 的人口是雙語的。因此,許多用戶在與虛擬助手交談時都會轉換語言。在建立 PRESTO 的過程中,研究者要求雙語數據貢獻者對語言混合使用的語料進行注釋,這些語料約占數據集中所有語料的 14%。
來自 PRESTO 的印地語 - 英語、西班牙語 - 英語和德語 - 英語編碼混合語料的例子。非流暢的對話語序場景
由于人們和虛擬助手的對話中存在很多口語表達,類似重復的短語或填充詞這樣的斷續語在用戶的話語中是無處不在的。像 DISFL-QA 這樣的數據集注意到現有的 NLP 文獻中存在這樣的場景,開始致力于跨域這種鴻溝。在本文的工作中,研究者考慮了六種語言下的對話。其中,英語、日語和法語中帶有填充詞或重復的語料的例子。
主要發現研究者對上述每一種場景都進行了有針對性的實驗,他們使用 PRESTO 數據集訓練出一些基于 mT5 的模型,并使用介于預測解析和人工注釋解析之間的一種精確匹配方法來對模型進行評估。下面展示了對內容修改場景、非流程的對話語序場景和語言混合使用場景這三種場景中,在不同的訓練數據數量下的性能結果。
隨著訓練數據量的增加,對各種語言場景和完整測試集進行 K-shot 的結果。可以發現,對目標場景進行零樣本學習得到的性能較差,這說明在數據集中使用目標場景中設計的文本來提高性能是有必要的。模型在非流程的對話語序場景和語言混合使用場景下的表現比用戶判讀要好得多(精確匹配準確度相差 40 多分)。
結論
在該工作中,作者介紹了 PRESTO,一個用于解析面向對話任務的多語言數據集。該數據集涵蓋了用戶與虛擬助理的日常對話中的各種真實痛點,這些痛點是當前 NLP 社區中現有數據集所缺乏的。
PRESTO 包括大約 50 萬個由英語、法語、德語、印地語、日語和西班牙語六種語言的母語使用者貢獻的話語。研究者創建了專門的測試集來評估每一種場景 —— 內容修改場景、非流程的對話語序場景和語言混合使用場景以及結構化的上下文。實驗的結果表明,當目標場景不包含在訓練集中時,零樣本的表現較差,這表明需要使用此類語句來提高性能。
同時研究者注意到,內容修改場景、非流程的對話語序場景更容易通過增加更多的數據來完成建模,而語言混合使用場景下即使有更多的樣本,也依然難以建模。
隨著這個數據集的發布,研究者預期能帶來新一輪的探索熱潮,他們希望研究界能在用戶每天日常聊天場景下進行研究,并且能取得進展。
THE END
轉載請聯系本公眾號獲得授權
投稿或尋求報道:content@jiqizhixin.com
責任編輯:hnmd003
相關閱讀
-
谷歌 Pixel 平板通過相關認證,更多產品信息曝光-全球要聞
繼此前谷歌方面已經確認,后續將推出旗下首款平板電腦產品PixelTablet后,陸續被曝光的產品端相關信息也...
2023-04-07 -
ColorOS 13.1 斬獲 Q1 季度系統流暢榜首,安卓性能業內巔峰!:快看
4月6日,魯大師發布了2023年Q1季度報告,其中ColorOS系統以216 15分的成績榮獲Q1季度手機系統流暢度排...
2023-04-07
相關閱讀
-
面向現實世界場景,多語言大數據集 PRESTO 來了
機器之心報道機器之心編輯部PRESTO–一個多語言數據集,用于解析現實的面向任務的對話。虛擬助理正日益...
-
今日快看!低至 15 萬元,最便宜的特斯拉要來了?馬斯克“降價打擊”,專家預判銷量:將遠超 model 3
進入2023年以來,外界關于特斯拉將推出更便宜全新車型的關注熱情持續攀升。日前,有消息稱,特斯拉計劃...
-
部分用戶余額寶頁面顯示亂碼 支付寶:正在修復中
據報道,今日晚間八點左右,不少網友反映其支付寶余額寶界面顯示亂
-
觀天下!警方通報網傳中電科加班事件調查結果:陳某龍故意散布謠言已被行政拘留
據德陽市公安局經開區分局發文,2023年4月5日,接上級公安機關指令
-
谷歌 Pixel 平板通過相關認證,更多產品信息曝光-全球要聞
繼此前谷歌方面已經確認,后續將推出旗下首款平板電腦產品PixelTablet后,陸續被曝光的產品端相關信息也...
-
王文濤、陳敏爾、張工會見空客 CEO!空客昨日簽下 200 億美元大單
據商務部官網,4月7日,商務部部長王文濤會見空中客車公司首席執行官傅里。王文濤介紹了中國式現代化的...
-
32 位應用已死,對安卓手機意味著什么?
圖片來源@視覺中國文|雷科技leitech關注智能手機領域的讀者,或許都有洞察到這樣一個變化趨勢。從某個時...
-
小熊電器:營收創新高,靚麗業績背后仍存諸多“隱患” 全球新消息
4月6日晚間,由檀健次代言的小熊電器(002959 SZ)發布2022年年報,2022年公司實現營業收入41 18億元...
-
微信官宣:發視頻號,可以賺錢了 !-當前簡訊
據微信公開課公眾號4月7日消息,3月28日,微信公開課PRO預告了視頻號即將上線創作分成計劃?,F在,它來...
-
當前資訊!年薪百萬元!這四大專業人才,太香了
每年的四月是校園春招的高峰期,以往,生化環材因為就業環境不佳被戲稱為大學專業里的四大天坑。生化環...
-
高壓之下如何破題?華僑城A選擇主動求變
中國商品房歷史上,或許沒有哪一年如2022年一般曲折,一些開發商倒在了黎明前夜,極少數開發商成為“黑...
-
綠動資本張國津:ESG成中國企業“走出去”,與大型國際機構合作的必要條件
中國ESG發展邁入加速期。據《中國上市公司ESG發展報告(2022)》,截至2022年上半年末,上市超過半年的滬...
-
天天簡訊:9年“卷”成特斯拉四大高管之一!朱曉彤再獲晉升,知情人士稱其每天6點開工
在特斯拉任職9年后,43歲的朱曉彤正式躋身全球管理層。當地時間4月6日,特斯拉遞交給美國證券交易委員會...
-
招尚盈家兩全保險能提供哪些保障?有什么優勢?:時快訊
這款產品的保障責任很簡單,僅能提供身故 全殘保障以及滿期保險金。被保險人在保障期限身故 全殘,保...
-
健康險是什么保險?有必要買嗎?
健康險是人身保險的其中一項,屬于保障人們健康的保險產品,主要包含有醫療險、疾病險、護理險等等,其...
-
熱門:平安保險盛世金越尊享怎么樣?適合哪些人投保?
平安保險盛世金越尊享的整體表現還是很不錯的。主要優勢在于投保條件寬松,選擇靈活;保單權益豐富實用...
-
張建鋒卸任阿里巴巴華東公司職務,周靖人接任
天眼查App顯示,近日,阿里巴巴華東有限公司發生工商變更,張建鋒卸
-
周鴻祎:360全網數字安全大腦將結合GPT能力抵御網絡攻擊
據北京商報報道,財聯社4月7日電,360創始人周鴻祎表示,360很快會
-
ColorOS 13.1 斬獲 Q1 季度系統流暢榜首,安卓性能業內巔峰!:快看
4月6日,魯大師發布了2023年Q1季度報告,其中ColorOS系統以216 15分的成績榮獲Q1季度手機系統流暢度排...
-
這種經典應用,要被小米率先消滅了?
關注智能手機領域的讀者,或許都有洞察到這樣一個變化趨勢。從某個時間點開始,安卓系統的應用適配出現...
-
年金保險適合什么人買?投保流程是怎樣的?:全球微頭條
1、保障型保險已配置好的人群 年金保險側重理財功能,相對保障功能較弱,因為更適合已經配置好保障型保...
-
全球快報:100萬定期壽險一年交多少錢?在哪里買靠譜?
大約為300~1000元左右。 實際上,100萬的定期壽險具體一年交多少錢,主要還是取決于產品本身。因為不同...
-
小孩買什么保險最好最劃算?給小孩買保險時要注意什么?_天天熱頭條
重疾險和醫療險都屬于健康險,能夠提升疾病風險的抵御能力,在孩子罹患重疾或是產生大額醫療支出的時候...
-
泰康尊享世家增額版值得購買嗎?有什么缺點?_快訊
泰康尊享世家增額版的優勢比較明顯,不僅保單權益較為豐富,還能搭配萬能賬戶,而且回本速度比較快,該...
-
焦點快播:萬能賬戶的錢可以全部領出來嗎?怎么取出來?
部分萬能賬戶保險在取錢是會有限額規定,不能全額取出,例如有些產品會規定每個保單年度內,從萬能賬戶...
-
前途汽車渡劫:全系車型暫停接單,工廠生產成謎,相關方稱百萬工程款仍未還
4月7日,前途汽車微信小程序已無法正常顯示,對此,其工作人員向時代財經表示,“小程序出現故障”,其...
-
世界視點!正邦科技:3月銷售生豬收入環比上升5.73%,同比下降44.42%
正邦科技公告,3月銷售生豬48 72萬頭(其中仔豬24 66萬頭,商品豬24 06萬頭),環比下降27 71%,同比...
-
虎頭局全國大量門店暫停營業,公司表示正在努力恢復中
據一財,4月6日、4月7日這兩日,記者分別走訪了位于廣州的虎頭局渣打餅行樂峰廣場店、麗影廣場店、時尚...
-
A股體育第一股轉投預制菜,貴人鳥為何淡出人們視野?:天天熱資訊
2014年貴人鳥橫空出世登陸上交所,成為晉江系品牌中第一個吃到運動鞋服紅利的,巔峰時期的市值突破400億...
-
秦PLUS EV 2023款冠軍版上市,12.98萬元起售
比亞迪秦PLUSEV2023款冠軍版正式上市,新車共推出6款車型,官方指導價為12 98-17 68萬元。
精彩推薦
閱讀排行
精彩推送
- 神奇的元宇宙,居然讓茅臺都翻車!
- 改變的開始,旗艦血統的驍龍 7+...
- 西屋動感單車,讓更多人感受到運...
- 機動車損失險保費怎么算?10萬的...
- 金佑人生終身壽險分紅型a款2017...
- 重疾險保額50萬一年交多少錢?購...
- 最資訊丨企業年金個人賬戶查詢有...
- 一年存一萬存五萬的保險是什么?...
- 青島銀行業績持續穩健增長,努力...
- 密子君帶貨廠家曾因食品問題被罰
- 特斯拉員工被曝私下分享車主隱私...
- 消息稱SHEIN正在推進第三方平臺...
- 侯毅:上市僅僅是一個過程,夢想...
- 全球快資訊丨迪卡儂專業跑步品牌...
- 山姆會員店經營過期食品被罰6萬
- 世界熱門:茶飲第一股虧損四億,...
- 第一次踏入音頻領域,戴森就想顛...
- 2023 年健康與健身應用市場洞察...
- 100萬讓杭州美食“翻身”?網友...
- 戴森干濕全能洗地吸塵器全球首發...
- 當前訊息:中融新大獲中國礦大研...
- 全球通訊!對話阿里云通義千問:...
- 完美員工入職300余家企業騙走5千多萬
- 上汽集團3月整車批售35.2萬輛,...
- 熱資訊!2023款廣汽本田型格上市...
- 【天天聚看點】簡單實用 福特E-...
- 上海車展亮相 北京奔馳EQE SUV正式下線
- 外觀不變配置升級 新款馬自達3...
- 【快播報】聚合科技獲得3000萬A輪融資
- 趙王酒業侵權吳京成老賴