藏文古籍文獻(xiàn)是珍貴的文化遺產(chǎn),是藏族文化的重要載體。促進(jìn)藏文古籍文獻(xiàn)數(shù)字化,用現(xiàn)代技術(shù)賦能文化發(fā)展,有利于創(chuàng)新我國藏文文獻(xiàn)資源保護(hù)、開發(fā)和利用模式,實(shí)現(xiàn)把寶貴的藏族優(yōu)秀傳統(tǒng)文化保護(hù)好、傳承好、發(fā)展好的目標(biāo)。
近日,第七屆北京國際藏學(xué)研討會在北京舉行,西藏大學(xué)信息科學(xué)技術(shù)學(xué)院擁措教授在會上表示,運(yùn)用數(shù)字化技術(shù)保護(hù)藏文古籍文獻(xiàn),推動文化繁榮,我們要做出力所能及的貢獻(xiàn)。
圖為擁措教授在第七屆北京國際藏學(xué)研討會上接受采訪 攝影:陳浩力
加大數(shù)字化保護(hù)力度構(gòu)建新時(shí)代新格局
“從利用現(xiàn)代化手段對古籍進(jìn)行保護(hù)的角度來說,藏文古籍文獻(xiàn)的保護(hù)工作過去主要面臨兩大困難:一是之前的藏文古籍文獻(xiàn)數(shù)字化程度低,由于古籍版式多樣、圖文混排、結(jié)構(gòu)緊密等現(xiàn)象,導(dǎo)致識別難度高,所以藏文古籍全文數(shù)據(jù)庫的建設(shè)也就更為復(fù)雜;二是對研究人員相對要求高,既要懂語言文字和數(shù)字化技術(shù),又要了解藏文古籍文獻(xiàn),所以早期從事藏文古籍?dāng)?shù)字化研究的人員相對較少,研究力量薄弱。”擁措介紹道。
目前在多方努力下,這兩大難題逐漸得到緩解。國家出臺了很多針對古籍保護(hù)的文件,從2007年國務(wù)院辦公廳印發(fā)《關(guān)于進(jìn)一步加強(qiáng)古籍保護(hù)工作的意見》,到2022年中共中央辦公廳和國務(wù)院辦公廳印發(fā)《關(guān)于推進(jìn)新時(shí)代古籍工作的意見》,明確提出了要推進(jìn)古籍?dāng)?shù)字化,顯示了政策層面的重視。西藏自治區(qū)也積極響應(yīng),不斷加大西藏古籍普查、修復(fù)、數(shù)字化、隊(duì)伍建設(shè)等方面的工作力度。“在我們學(xué)校、學(xué)院的各級領(lǐng)導(dǎo)精心指導(dǎo)下,越來越多的老師和學(xué)生不斷投身到藏文古籍?dāng)?shù)字化保護(hù)這一領(lǐng)域,研究隊(duì)伍也不斷壯大。”
相信隨著5G時(shí)代的到來,人工智能、大數(shù)據(jù)等技術(shù)發(fā)展,通過加強(qiáng)數(shù)據(jù)庫建設(shè),在藏文古籍文獻(xiàn)數(shù)字化轉(zhuǎn)化和知識挖掘這兩個(gè)方面,將會形成性能更好的藏文古籍識別模型和更為全面的藏文古籍?dāng)?shù)據(jù)庫和知識庫,推動研發(fā)成果實(shí)現(xiàn)更廣泛的應(yīng)用。
黨的十八大以來,黨中央站在實(shí)現(xiàn)中華民族偉大復(fù)興的戰(zhàn)略高度,對傳承和弘揚(yáng)中華優(yōu)秀傳統(tǒng)文化作出一系列重大決策部署。從藏文古籍文獻(xiàn)的資源庫建設(shè),到后續(xù)的文字識別、知識挖掘等智能信息處理,再到數(shù)據(jù)的開發(fā)和共享,這一系列舉措創(chuàng)新了我國藏文文獻(xiàn)資源開發(fā)和利用模式,推動了藏文古籍文獻(xiàn)的創(chuàng)造化轉(zhuǎn)化和創(chuàng)新性傳承,擔(dān)負(fù)起把寶貴的文化遺產(chǎn)保護(hù)好、傳承好、發(fā)展好的使命,為新時(shí)代實(shí)現(xiàn)中華民族偉大復(fù)興提供精神力量。
圖為國家重點(diǎn)研發(fā)計(jì)劃重點(diǎn)專項(xiàng)《藏文文獻(xiàn)資源數(shù)字化技術(shù)集成與應(yīng)用示范》標(biāo)志性成果之一“藏文古籍版面分析和文字識別系統(tǒng)”受訪者供圖
信息技術(shù)水平提高研究成果日益增多
在談到目前藏文古籍文獻(xiàn)方面智能處理技術(shù)的研究進(jìn)展時(shí),擁措談到在2017年至2022年期間,西藏大學(xué)聯(lián)合國內(nèi)十幾家單位,牽頭承擔(dān)了科技部的一個(gè)國家重點(diǎn)研發(fā)計(jì)劃重點(diǎn)專項(xiàng)——藏文文獻(xiàn)資源數(shù)字化技術(shù)集成與應(yīng)用示范,該項(xiàng)目首席科學(xué)家和項(xiàng)目負(fù)責(zé)人是西藏大學(xué)尼瑪扎西教授。該項(xiàng)目成果獲得了2022年度西藏自治區(qū)科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)。目前研發(fā)成果已經(jīng)在西藏各大圖書館、布達(dá)拉宮古籍?dāng)?shù)字化保護(hù)中得到了廣泛推廣和積極應(yīng)用,為他們提供了很好的技術(shù)支撐。
“在此基礎(chǔ)上,西藏大學(xué)還承擔(dān)了西藏自治區(qū)科技廳的有關(guān)圖文識別項(xiàng)目,通過利用前沿的人工智能算法,對多場景多字體識別技術(shù)做了更進(jìn)一步的研究,包括古籍和其他場景下的多字體文字識別技術(shù)。”擁措表示,他們的研究并不局限在文字識別的智能處理上,更進(jìn)一步拓展至后續(xù)的知識挖掘和利用。
在擁措老師所帶領(lǐng)的研究生中,很多學(xué)生針對藏醫(yī)藥方面的古籍文獻(xiàn)智能信息處理展開研究,在文字識別的基礎(chǔ)上,進(jìn)行知識圖譜構(gòu)建關(guān)鍵技術(shù)的研究,包括藏醫(yī)藥領(lǐng)域?qū)嶓w識別和關(guān)系抽取、智能問答系統(tǒng)等。譬如說針對《四部醫(yī)典》藏醫(yī)經(jīng)典著作,可以用自然語言處理技術(shù),抽取實(shí)體和關(guān)系信息,進(jìn)行知識圖譜的構(gòu)建和知識推理,這些研究對藏醫(yī)藥領(lǐng)域來說有著重要的應(yīng)用價(jià)值和意義。
圖為擁措教授正在指導(dǎo)藏文古籍智能處理方向的研究生受訪者供圖
抓住研究關(guān)鍵節(jié)點(diǎn)學(xué)界業(yè)界深度融合
藏文古籍文獻(xiàn)研究的關(guān)鍵在于讓學(xué)術(shù)研究和應(yīng)用實(shí)踐相結(jié)合,一方面要推動研究向縱深方向發(fā)展,同時(shí)要密切關(guān)注在實(shí)際應(yīng)用中的反饋,推動二者形成一種正向循環(huán)。
從學(xué)術(shù)研究上看,實(shí)現(xiàn)藏文古籍文獻(xiàn)智能處理需要跨越多個(gè)領(lǐng)域,所以跨學(xué)科的合作尤為重要。“我們團(tuán)隊(duì)自身是計(jì)算機(jī)專業(yè),需要跨越語言文學(xué)這一學(xué)科,同時(shí)面向的研究領(lǐng)域又是藏醫(yī)藥學(xué),所以需要大家深入合作才能開展研究。我們希望探索出一種更高效的合作模式,能夠讓來自不同領(lǐng)域的研究學(xué)者獲得他們所需要的知識,又能夠讓他們形成合力,發(fā)揮出1+1+1>3的效果。”
從應(yīng)用實(shí)踐上來看,目前針對藏文古籍文獻(xiàn)的智能處理技術(shù)仍處于發(fā)展過程中。“一些技術(shù)產(chǎn)品可能還不是那么的完善,所以我們希望將研發(fā)成果推廣出去,業(yè)界進(jìn)行實(shí)際操作時(shí),能夠給我們提出一些意見和建議,通過這些反饋,我們再去改進(jìn)模型和算法,使其更契合實(shí)際需求,從而為后續(xù)開展更深層次的知識挖掘研究打下扎實(shí)的基礎(chǔ),讓藏文古籍文獻(xiàn)數(shù)字化服務(wù)的覆蓋面更寬、惠及面更廣。”
對于在數(shù)字化時(shí)代的發(fā)展展望,擁措認(rèn)為,隨著社交網(wǎng)絡(luò)的逐漸成熟,各類語種的文本出現(xiàn)在社交網(wǎng)絡(luò)上,如果藏文古籍文獻(xiàn)在數(shù)字化過程中建立起來的數(shù)據(jù)庫和知識庫,能夠開放共享給廣大學(xué)者或是公眾,那么將會有更多人通過微信、微博以及各種短視頻等社交媒體平臺,接觸、了解、參與到古籍文化的傳播中來,必將有助于研究成果的廣泛推廣和藏族優(yōu)秀文化的傳承,推動西藏和國家文化事業(yè)的發(fā)展和繁榮。
(文章來源:中國西藏網(wǎng);記者:張萌萌 陳浩力 李絲雨)
版權(quán)所有 中國藏學(xué)研究中心。 保留所有權(quán)利。 京ICP備06045333號-1
京公網(wǎng)安備 11010502035580號