一項由中國科研人員自主開(kāi)發(fā)的編碼技術(shù),將使包括許多生僻字在內的所有漢字都能通過(guò)計算機處理。利用這項四字節編碼核心技術(shù),不僅可以解決古籍出版中的問(wèn)題,還可以解決戶(hù)籍、銀行、海關(guān)、民航等行業(yè)遇到的姓名、地名生僻字問(wèn)題。
這項技術(shù)由北京時(shí)代瀚堂科技有限公司自主開(kāi)發(fā),可錄入、顯示、編輯、檢索、查詢(xún)和管理71500多個(gè)漢字,而傳統的二字節編碼技術(shù)只能處理27500多個(gè)漢字。
過(guò)去,《說(shuō)文解字》等傳統文化典籍,只能依靠影印出版,不僅費時(shí)費力,而且不符合現代人的閱讀習慣。古籍研究者在遇到生僻字與計算機有機結合時(shí),叫苦連天,因為這不僅意味著(zhù)工作量大大增加,還可能造成工作漏洞。如今,采用四字節編碼技術(shù),用計算機錄入和處理方式出版的《說(shuō)文解字》,極大地方便了出版者和讀者。
基于四字節編碼技術(shù),北京時(shí)代瀚堂科技有限公司開(kāi)發(fā)了“龍語(yǔ)瀚堂”典籍數據庫,包括字書(shū)類(lèi)數據庫、殷周金文庫、音韻庫、中國簡(jiǎn)帛庫、甲骨文庫等13類(lèi)子庫的數百萬(wàn)條數據記錄。應用這一數據庫,社會(huì )科學(xué)文獻出版社已出版了我國最早的字書(shū)《說(shuō)文解字》,雙方還將繼續合作出版《康熙字典》。目前,“龍語(yǔ)瀚堂”典籍數據庫已在清華、北大等百余所大學(xué)的中文系、歷史系、考古系以及國內外一些漢學(xué)研究機構廣泛試用。
(來(lái)源:人民日報;作者:武衛政、譚 超)