彝族文化博大精深,源遠流長,光輝燦爛,是中華民族優(yōu)秀傳統(tǒng)文化的重要組成部分。彝族文化自發(fā)端至今,已歷經(jīng)8000年文明的滌蕩,在這漫長的8000年歷史演進中,無論是在天文、歷法、文字、還是哲學、藝術、生活技藝等諸多方面,彝族都有非常獨特的創(chuàng)造。其中,古彝文更是傳承數(shù)千年,是世界上最古老的文字之一。
2022年12月21日,合合信息與上海大學社會學院正式簽署校企合作協(xié)議,雙方將合力完成以國家珍貴古籍《西南彝志》為中心的貴州古彝文圖像識別及數(shù)字化校對項目(簡稱“古彝文數(shù)字化項目”)。

據(jù)了解,此次上海大學攜手合合信息推進的古彝文數(shù)字化項目更側重于對原生態(tài)彝文識別的攻堅克難,項目將根據(jù)上海大學古彝文研究員設計的四字節(jié)編碼系統(tǒng),引入合合信息智能文字識別技術,對異體字、變體字、誤用字和混用字等進行標注、識別、比對,并由此建立起精確的彝文古籍電子數(shù)據(jù)庫,在古彝文研究領域?qū)儆谑讋?chuàng)。
根據(jù)《滇川黔桂彝文字集》,目前記錄在冊的古彝文多達87046個,翻譯難度可見一斑。與此同時,合合信息智能技術平臺事業(yè)部副總經(jīng)理郭豐俊表示,彝文古籍時常出現(xiàn)加字、替字、整句倒置、文字方向不統(tǒng)一等現(xiàn)象,更是給文字定位造成挑戰(zhàn),再加上古彝文從未經(jīng)過統(tǒng)一,異體字、變體字眾多,因此合合信息將基于“AI+OCR”融合下的智能文字識別技術,解決古彝文識別的版式檢測、圖像處理和文字識別等難題。
此前,合合信息用AI技術對甲骨文、西周鐘鼎文進行精準識別,受到了包括央視、人民日報、新華社在內(nèi)的上百家主流媒體的關注。對于都屬于以刻畫符號表意的文字,甲骨文和古彝文這兩種文字的識別方式有相通之處。此次古彝文數(shù)字化項目的開啟,必將成為合合信息智能文字識別技術賦能文字保護及文化傳承的重要里程碑,也將是古彝文“傳統(tǒng)的新生命周期”的開始。
(新媒體責編:wa12)
聲明:
1、凡本網(wǎng)注明“人民交通雜志”/人民交通網(wǎng),所有自采新聞(含圖片),如需授權轉載應在授權范圍內(nèi)使用,并注明來源。
2、部分內(nèi)容轉自其他媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3、如因作品內(nèi)容、版權和其他問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。電話:010-67683008
人民交通24小時值班手機:17801261553 商務合作:010-67683008轉602 E-mail:zzs@rmjtzz.com
Copyright 人民交通雜志 All Rights Reserved 版權所有 復制必究 百度統(tǒng)計 地址:北京市豐臺區(qū)南三環(huán)東路6號A座四層
增值電信業(yè)務經(jīng)營許可證號:京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務所 李大偉
京公網(wǎng)安備 11010602130064號 京ICP備18014261號-2 廣播電視節(jié)目制作經(jīng)營許可證:(京)字第16597號