加強數字中文建設 賦能經濟社會發展

近日,教育部、國家語委、中央網信辦共同印發《關於加強數字中文建設 推進語言文字信息化發展的意見》(以下簡稱《意見》),提出全面推進語言文字信息化發展,以加強數字中文建設為重點,以集成化、智能化、國際化為導向,加強政策引導,優化要素配置,促進協同創新,強化技術賦能,著力提升語言文字服務數字教育、數字科技、數字文化、數字經濟、數字社會建設的實際能力。
語言文字“日學而不察、日用而不覺”,廣泛存在於社會生產各個方面。隨著人工智能時代的到來,語言文字所承擔的角色發生深刻轉變。它們不再局限於傳統的“靜態符號”,不再僅僅停留在紙面上供人閱讀、書寫,而是逐步進化為充滿活力與價值的“動態數字資產”,被廣泛存儲、傳輸、處理和應用,成為數字世界中不可或缺的構成要素。在此背景下,語言文字信息處理技術的創新與突破,將廣泛賦能內容創作、文化傳播、信息服務、商業運營等多個領域,有力服務教育發展、助力科技創新、賦能文化傳承、推動產業升級、促進社會進步。
數字中文建設是語言文字事業現代化轉型的歷史機遇。當前,我國已建成世界最大規模語言資源庫和中國語言資源知識圖譜,涵蓋了海量的文本、語音、詞匯等語言數據,為語言文字的分析、處理和應用提供了堅實支撐﹔發布100多項國家通用語言文字和民族語言文字信息化規范標准,為語言文字的數字化處理提供了統一的規范和依據﹔建設覆蓋190多個國家和地區的全球中文學習平台,利用先進的智能語音識別、語義分析等技術,為全球漢語學習者提供個性化、智能化的語言學習服務,有效提高學習效率﹔高水平開展普通話水平測試,建設智慧考場,制發電子証書9000多萬份,不僅提升了普通話測試的科學性和公正性,也為語言文字的社會應用提供了有力支持。
數字中文建設將有力推動教育信息化。通過大語言模型的研發應用,帶動教育教學的革新。在信息化教學場景中,教師可利用大語言模型進行個性化教學,滿足不同學生需求,優化教學效果。通過模型分析學生學習數據,也可為教師提供精准教學建議,提升教學質量。借助國家智慧教育公共服務平台和地方智慧教育平台,廣泛推廣共享語言文字信息化建設成果,使得更多學校和教師能夠獲取並運用先進的語言文字教學資源,在整體提高全民語言文化素養水平的同時,推動教育資源均衡發展,為偏遠地區學校獲取優質教學資源拓寬渠道,提升教學質量、促進教育公平。
《意見》明確提出,“到2027年,國家數字中文建設行動取得重要成效,語言文字數據要素價值有效釋放”“基本建成國家語言文字大數據中心,初步建成國家關鍵語料庫和國家戰略語言資源信息庫”。據報道,2015年以來,中國語言資源保護工程對漢語方言和少數民族語言1800多個田野調查點開展調查,范圍涵蓋近130種語言和地方方言。今年還將啟動國家關鍵領域語料庫建設計劃,在關鍵學科、重點行業、戰略區域、民生期待和社會急需領域分批建設規范、安全、優質的國家關鍵語料庫。目前,教育部、國家語委已經支持建設了30余項關鍵領域的語料庫。相信隨著大數據和深度學習技術的發展,語言自動標注技術將更好反哺基礎數據加工和標注,大大提高基礎數據和深度信息的制作和標注效率。
數字時代,語言文字作為文化載體和戰略資源,將完成向數據要素的重要轉型。未來,從鼓勵和支持各類社會化語言學習和傳播平台的發展,到推動中國語言資源博物館和地方語言資源博物館的數字化建設,再到加強古籍數字化整理關鍵技術研究,數字中文建設將大有可為。
(作者:楊媛媛,系渤海大學文學院副教授)
分享讓更多人看到
- 評論
- 關注