首頁 > 新聞 > IT資訊 > 正文

        前沿資訊!北大攜字節跳動推出古籍數字化平臺,搭建免費開放的“智能圖書館”

        2022-10-11 19:41:30來源:中國經濟網  


        (資料圖)

        10月11日,由“北京大學—字節跳動數字人文開放實驗室”研發的古籍數字化平臺“識典古籍”測試版正式上線。目前,該平臺涵蓋390部經典古籍,主要來自《四部叢刊》,共計3000多萬字,即日起向公眾免費開放。未來三年,“識典古籍”將陸續完成一萬種古籍的智能化整理工作,基本覆蓋儒家、道家和佛學的核心典籍目錄,屆時將全部免費開放。

        “識典古籍”項目負責人現場講解

        據了解,上述實驗室系今年3月北京大學與字節跳動合作成立,將人工智能技術應用于古籍資源的智能化整理?!白R典古籍”平臺上線,即是雙方合作的最新進展。

        當前,中國的古籍數字化還處于初級階段,面臨技術難度高、資金缺口大、人才緊張等難點。相關資料顯示,現存的20多萬種古籍中,只有8萬種完成影像數字化掃描,近4萬種完成文本數字化。據專家統計,從1949年到2019年,國內共修復整理出版古籍近3.8萬種,要將現存古籍全部修復整理出來,可能需要300年時間;若利用人工智能技術輔助修復整理,大概二三十年就能完成。

        活動相關海報

        據“識典古籍”項目負責人介紹,該平臺當前主要使用了三種技術,包括文字識別、自動標點和命名實體識別。文字識別技術,是對古籍的影印版文字進行單個切分,再進行文字識別和順序識別。自動標點技術,是通過序列標注的方式對古籍自動進行標點劃分。命名實體識別技術,則是通過序列標注識別文本中的人名、地名、書籍、時間、官職等信息。據悉,目前行業內OCR識別準確率平均為93%至94%,“識典古籍”的準確率為96%至97%。

        與其他古籍數字化平臺相比,“識典古籍”具有自身的特點,頁面簡潔,瀏覽流暢,提供影印底本作為參照,還具備主題詞檢索和繁簡體轉換功能,便于專業研究人員、廣大古籍愛好者使用。同時,“識典古籍”書目將持續更新,后續將上線手機移動版。

        “識典古籍”網頁截圖

        未來,“識典古籍”將向全社會開放古籍閱讀檢索研究能力,還將實現全自動整理校對,更高效地實現存量古籍全部數字化。同時,平臺也鼓勵擁有文獻的學者自行上傳文獻,用戶甚至可參與再創作和再闡釋,助力古籍文化傳承和研究。

        一年多來,字節跳動在古籍修復和活化上也有所進展。此前,字節跳動資助國家圖書館定向修復的珍貴古籍104冊件,現已完成50多冊件,包括一批稀有的樣式雷圖檔。在活化方面,抖音平臺推出“尋找古籍守護人”計劃,旨在激勵創作者通過音樂、說書、繪畫、復原美食等形式,普及古籍知識、演繹古籍內容,讓古籍鮮活起來。

        關鍵詞: 字節跳動

        責任編輯:hnmd003

        相關閱讀

        相關閱讀

        推薦閱讀

        亚洲中文字幕无码av| 亚洲日韩一区精品射精| 亚洲午夜在线一区| 中文字幕亚洲乱码熟女一区二区 | 国产偷国产偷亚洲高清日韩| 亚洲AV无码专区在线电影成人| 亚洲人成网站色7799| 亚洲中文字幕乱码AV波多JI| 亚洲AV成人一区二区三区在线看| 亚洲成aⅴ人片在线影院八| 亚洲网址在线观看| 亚洲神级电影国语版| 亚洲国产亚洲片在线观看播放| 亚洲最大视频网站| 亚洲一级视频在线观看| 激情亚洲一区国产精品| 精品国产成人亚洲午夜福利| 亚洲av永久无码精品天堂久久| 久久精品亚洲AV久久久无码| 亚洲乱码在线观看| 亚洲精品无码中文久久字幕| 久久亚洲精品11p| 亚洲成a人无码av波多野按摩| 亚洲精品综合久久| 伊人久久大香线蕉亚洲| 亚洲av最新在线网址| 婷婷久久久亚洲欧洲日产国码AV| 久久亚洲AV成人出白浆无码国产| 亚洲精品在线免费看| 亚洲成a人片在线看| 亚洲精品9999久久久久无码 | 亚洲日韩欧洲乱码AV夜夜摸 | 亚洲av永久无码精品秋霞电影影院| 亚洲国产精品无码成人片久久| 亚洲av中文无码乱人伦在线咪咕| 亚洲人成电影福利在线播放 | 亚洲国产理论片在线播放| 亚洲天堂2016| 色天使色婷婷在线影院亚洲| 亚洲精品NV久久久久久久久久| 亚洲情XO亚洲色XO无码|