時(shí)政要聞
中國的漢文字非常了不起,,中華民族的形成和發(fā)展離不開漢文字的維系,。
——習(xí)近平
河南日報(bào)客戶端記者 謝建曉 楊之甜
“一片甲骨驚天下”,,代代學(xué)人焚膏繼晷。1899年,,沉睡地下3000多年的甲骨被發(fā)現(xiàn),隱藏的中華智慧和文明密碼被一一破譯,。
12月26日,,記者來到安陽師范學(xué)院甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室。工作人員登錄“殷契文淵”網(wǎng)站,,在字形庫中選擇甲骨字“人”字形,,所有包含該字形的402個(gè)甲骨片信息就全部顯示出來。
安陽師范學(xué)院計(jì)算機(jī)與信息工程學(xué)院院長,、甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室主任劉永革介紹,,“殷契文淵”是目前最大的甲骨文數(shù)據(jù)庫,從開放的第一天起,,平臺就為全世界用戶提供免費(fèi)服務(wù),。它不僅服務(wù)全球的甲骨文、考古,、歷史,、文字方面的研究專家,還吸引了古文字愛好者、中小學(xué)語文教師,、書法愛好者等使用,。
為什么要專門建立甲骨文數(shù)據(jù)庫?甲骨文“撞上”現(xiàn)代科技,,又會發(fā)生什么,?
劉永革(右)和研究員在甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室工作。河南日報(bào)客戶端記者 楊之甜 攝
2000年,,計(jì)算機(jī)軟件碩士劉永革到安陽師范學(xué)院任教,,兩位研究甲骨文的老師建議他開展甲骨文信息化研究�,!耙活^是中國古老文明中的甲骨文,,另一頭是先進(jìn)的計(jì)算機(jī)技術(shù)、人工智能,�,!眲⒂栏锾寡裕�(dāng)時(shí)覺得這個(gè)課題簡直是兩個(gè)極端,。
“釋讀甲骨文本就是世界難題,,此外,還有一個(gè)難題擺在面前——甲骨文沒法輸入到電腦里,�,!眲⒂栏镎f,這是他最初想要解決的問題,。
“甲骨文和漢字不一樣,,好多字我們不認(rèn)識,使用拼音輸入法不行,,而且還有一些字像畫一樣,,不能用部首輸入,也不能拆分,。此前甲骨文輸入法采用編碼輸入方式,,記憶負(fù)擔(dān)較重,學(xué)習(xí)成本較高,�,!眲⒂栏镎f。
因此,,研發(fā)甲骨文輸入法,,建立一個(gè)基本字庫,讓任何人都可以輕松輸入,,至關(guān)重要,。
“用計(jì)算機(jī)技術(shù)研究甲骨文的編碼,、字庫、輸入法,、數(shù)據(jù)庫建設(shè),,為專家提供一些工具,輔助甲骨文研究,,這是我們建立甲骨文數(shù)據(jù)庫的初衷,。”劉永革說,。
可只有技術(shù)優(yōu)勢顯然不夠,。為了學(xué)習(xí)最新的甲骨文研究成果,每當(dāng)有甲骨文或古文字研究專家到安陽,,劉永革和團(tuán)隊(duì)成員一定想方設(shè)法當(dāng)面請教;當(dāng)?shù)�,、外地召開的甲骨文學(xué)術(shù)研究會議,,時(shí)間再緊他們也要參加……隨著了解越來越深入,劉永革發(fā)現(xiàn),,甲骨文作為中華民族最古老的文字,,因晦澀難懂和研究資料較少,與現(xiàn)代技術(shù)不兼容,,研究效率低下,。
如何共享甲骨文的研究信息,讓全人類資源互通,、群力群策一起研究呢,?劉永革他們決定利用自己的專業(yè),讓甲骨文這一“冷門”絕學(xué)“熱”起來,。
于是,,一個(gè)匯集甲骨文信息的“殷契文淵”項(xiàng)目悄然啟動。劉永革帶領(lǐng)團(tuán)隊(duì)30多名老師和50多名學(xué)生,,對甲骨研究的權(quán)威資料逐條,、逐頁進(jìn)行掃描、裁切,、編號,,尋找釋文。
2019年,,團(tuán)隊(duì)用8年時(shí)間精心打造的全球首個(gè)免費(fèi)甲骨文數(shù)據(jù)庫“殷契文淵”驚艷亮相,。該平臺建設(shè)的甲骨文字庫包含單字5086個(gè)、字形6234個(gè),,甲骨文研究文獻(xiàn)3萬多篇,,支持多種甲骨文輸入檢索方式。
“此前甲骨文資料很難查到,即使甲骨文專家也不可能擁有全部資料,,‘殷契文淵’項(xiàng)目建成后解決了這個(gè)問題,。”甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室副主任高峰說,。
甲骨文“人”字,。
據(jù)介紹,平臺接下來將繼續(xù)補(bǔ)充基礎(chǔ)數(shù)據(jù),,同時(shí)采用人工智能技術(shù)進(jìn)行數(shù)據(jù)分析,,包括甲骨文識別與字形分析、甲骨文語言計(jì)算,、甲骨文知識圖譜,、計(jì)算機(jī)自動綴合甲骨文系統(tǒng)等,有可能成為海內(nèi)外最詳贍,、最完備的甲骨文大數(shù)據(jù)平臺,。
與此同時(shí),安陽師范學(xué)院還積極整合校內(nèi)資源,,集合文學(xué),、歷史、計(jì)算機(jī),、體育等專業(yè)優(yōu)勢,,形成了一支跨專業(yè)、多學(xué)科聯(lián)合攻關(guān)的學(xué)術(shù)團(tuán)隊(duì)——甲骨文信息化處理團(tuán)隊(duì),。憑借已經(jīng)建成的甲骨文數(shù)據(jù)庫優(yōu)勢,,該團(tuán)隊(duì)開始嘗試?yán)谜Z言學(xué)、數(shù)學(xué),、計(jì)算機(jī)科學(xué),、信息技術(shù)對甲骨文進(jìn)行語義、語法處理和知識挖掘,。
“利用人工智能技術(shù)破譯甲骨文,,讓科技賦能甲骨文研究,揭開一片片甲骨背后的文明密碼,,講好甲骨文的故事,。”劉永革說,,他們要將甲骨文研究帶入新的智能化時(shí)代,。
![]() |
![]() |
![]() |
![]() |
焦作網(wǎng)免責(zé)聲明: | |||||||
|
中國的漢文字非常了不起,,中華民族的形成和發(fā)展離不開漢文字的維系。
——習(xí)近平
河南日報(bào)客戶端記者 謝建曉 楊之甜
“一片甲骨驚天下”,,代代學(xué)人焚膏繼晷,。1899年,沉睡地下3000多年的甲骨被發(fā)現(xiàn),,隱藏的中華智慧和文明密碼被一一破譯,。
12月26日,記者來到安陽師范學(xué)院甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室,。工作人員登錄“殷契文淵”網(wǎng)站,,在字形庫中選擇甲骨字“人”字形,所有包含該字形的402個(gè)甲骨片信息就全部顯示出來,。
安陽師范學(xué)院計(jì)算機(jī)與信息工程學(xué)院院長,、甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室主任劉永革介紹,“殷契文淵”是目前最大的甲骨文數(shù)據(jù)庫,,從開放的第一天起,,平臺就為全世界用戶提供免費(fèi)服務(wù)。它不僅服務(wù)全球的甲骨文,、考古,、歷史、文字方面的研究專家,,還吸引了古文字愛好者,、中小學(xué)語文教師、書法愛好者等使用,。
為什么要專門建立甲骨文數(shù)據(jù)庫,?甲骨文“撞上”現(xiàn)代科技,又會發(fā)生什么,?
劉永革(右)和研究員在甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室工作,。河南日報(bào)客戶端記者 楊之甜 攝
2000年,計(jì)算機(jī)軟件碩士劉永革到安陽師范學(xué)院任教,,兩位研究甲骨文的老師建議他開展甲骨文信息化研究,�,!耙活^是中國古老文明中的甲骨文,另一頭是先進(jìn)的計(jì)算機(jī)技術(shù),、人工智能,。”劉永革坦言,,當(dāng)時(shí)覺得這個(gè)課題簡直是兩個(gè)極端,。
“釋讀甲骨文本就是世界難題,此外,,還有一個(gè)難題擺在面前——甲骨文沒法輸入到電腦里,。”劉永革說,,這是他最初想要解決的問題,。
“甲骨文和漢字不一樣,好多字我們不認(rèn)識,,使用拼音輸入法不行,,而且還有一些字像畫一樣,不能用部首輸入,,也不能拆分,。此前甲骨文輸入法采用編碼輸入方式,記憶負(fù)擔(dān)較重,,學(xué)習(xí)成本較高,。”劉永革說,。
因此,研發(fā)甲骨文輸入法,,建立一個(gè)基本字庫,,讓任何人都可以輕松輸入,至關(guān)重要,。
“用計(jì)算機(jī)技術(shù)研究甲骨文的編碼,、字庫、輸入法,、數(shù)據(jù)庫建設(shè),,為專家提供一些工具,輔助甲骨文研究,,這是我們建立甲骨文數(shù)據(jù)庫的初衷,。”劉永革說,。
可只有技術(shù)優(yōu)勢顯然不夠,。為了學(xué)習(xí)最新的甲骨文研究成果,,每當(dāng)有甲骨文或古文字研究專家到安陽,劉永革和團(tuán)隊(duì)成員一定想方設(shè)法當(dāng)面請教,;當(dāng)?shù)�,、外地召開的甲骨文學(xué)術(shù)研究會議,時(shí)間再緊他們也要參加……隨著了解越來越深入,,劉永革發(fā)現(xiàn),,甲骨文作為中華民族最古老的文字,因晦澀難懂和研究資料較少,,與現(xiàn)代技術(shù)不兼容,,研究效率低下。
如何共享甲骨文的研究信息,,讓全人類資源互通,、群力群策一起研究呢?劉永革他們決定利用自己的專業(yè),,讓甲骨文這一“冷門”絕學(xué)“熱”起來,。
于是,一個(gè)匯集甲骨文信息的“殷契文淵”項(xiàng)目悄然啟動,。劉永革帶領(lǐng)團(tuán)隊(duì)30多名老師和50多名學(xué)生,,對甲骨研究的權(quán)威資料逐條、逐頁進(jìn)行掃描,、裁切,、編號,尋找釋文,。
2019年,,團(tuán)隊(duì)用8年時(shí)間精心打造的全球首個(gè)免費(fèi)甲骨文數(shù)據(jù)庫“殷契文淵”驚艷亮相。該平臺建設(shè)的甲骨文字庫包含單字5086個(gè),、字形6234個(gè),,甲骨文研究文獻(xiàn)3萬多篇,支持多種甲骨文輸入檢索方式,。
“此前甲骨文資料很難查到,,即使甲骨文專家也不可能擁有全部資料,‘殷契文淵’項(xiàng)目建成后解決了這個(gè)問題,�,!奔坠俏男畔⑻幚斫逃恐攸c(diǎn)實(shí)驗(yàn)室副主任高峰說。
甲骨文“人”字,。
據(jù)介紹,,平臺接下來將繼續(xù)補(bǔ)充基礎(chǔ)數(shù)據(jù),同時(shí)采用人工智能技術(shù)進(jìn)行數(shù)據(jù)分析,,包括甲骨文識別與字形分析,、甲骨文語言計(jì)算,、甲骨文知識圖譜、計(jì)算機(jī)自動綴合甲骨文系統(tǒng)等,,有可能成為海內(nèi)外最詳贍,、最完備的甲骨文大數(shù)據(jù)平臺。
與此同時(shí),,安陽師范學(xué)院還積極整合校內(nèi)資源,,集合文學(xué)、歷史,、計(jì)算機(jī),、體育等專業(yè)優(yōu)勢,形成了一支跨專業(yè),、多學(xué)科聯(lián)合攻關(guān)的學(xué)術(shù)團(tuán)隊(duì)——甲骨文信息化處理團(tuán)隊(duì),。憑借已經(jīng)建成的甲骨文數(shù)據(jù)庫優(yōu)勢,該團(tuán)隊(duì)開始嘗試?yán)谜Z言學(xué),、數(shù)學(xué),、計(jì)算機(jī)科學(xué)、信息技術(shù)對甲骨文進(jìn)行語義,、語法處理和知識挖掘,。
“利用人工智能技術(shù)破譯甲骨文,讓科技賦能甲骨文研究,,揭開一片片甲骨背后的文明密碼,,講好甲骨文的故事�,!眲⒂栏镎f,,他們要將甲骨文研究帶入新的智能化時(shí)代。
![]() |
|
![]() |
焦作網(wǎng)免責(zé)聲明: | |||||||
|
|
|