|
规模超过50个四库全书
语言文字研究界流传着一个笑话:上世纪80年代初,一个埃及代表团访华时问中国有多少古籍,文化部一位官员语塞,说“浩如烟海”。对方嘲笑说你们连10亿人口都查得出来怎么查不出古籍数目。其后,中国成立了全国高等院校古籍整理研究工作委员会,但迄今仍未调查出中国古籍的准确数目。首都师范大学文学院教授冯蒸认为,《康熙字典》修订版和瀚堂图书数据库技术有望加速古籍整理的进程。
冯蒸是《康熙字典》修订版的审音人,过去他研究的古籍“也可以在网上看到,但是是扫描上去的,必须转变格式才能打印出文字版”,“以前下载的全是黑圈儿,这次不用造字了。”中国古籍包括经史子集四大部分,“经”又包括易、书、诗、礼、小学等10类,“小学是经部中最专门和最难的”,而王宏源“有上百部小学类古书的数据库,比如《说文解字》、《尔雅》、《广韵》、《集韵》等,别人做不了他这个工作。”
“让普通人像用《现代汉语大词典》那样用上《康熙字典》”,是谢寿光的梦想。支撑他的乐观预期的是这个修订版的几大优点:将原版竖排改为横排;对原有的反切音进行了现代汉语注音;加入标点,解决现代人不懂句读的阅读障碍;输入简体字,就能准确检索到该字的古字,并且对应出现原书的影印;原书影像采用DJVU或PDF压缩格式,可逐页上下浏览;全部7万字符无造字。
部分参与了《康熙字典》修订版校对的瀚堂公司员工张亚静也说,“以前很少接触这些繁体字和生僻字,现在不像以前见了繁体字就发怵。”王宏源要求公司的研发人员:必须让不懂电脑的人也能够使用《康熙字典》的数据库光盘。
王宏源目前已主持完成数字化的古代和现代字书超过100种,传世典籍完成数字化存真性、资料性整理的图书有1500种,共3万卷典籍,约600万个条目,近10亿汉字。规划中,王宏源要整理的典籍约25万种,对照图书影像两亿页,500亿文字,规模超过50个四库全书,将形成约10亿个条目,约占人类典籍信息的20%。
而在谢寿光看来,《康熙字典》修订版及数据库至少还可以应用于户籍管理和机场、股票或期货交易市场的管理。为换发第二代居民身份证,公安部2006年升级的GB13000新字库含汉字增至32252 个,仍远不及《康熙字典》修订版57557字的收字量,谢寿光希望公安部能采用《康熙字典》修订版及数据库,他和冯蒸都认为“取名是公民的基本权利”。
商业模式比什么都重要
在“《康熙字典》修订版发布暨古籍数字化研讨会”上,与会者大都肯定了《康熙字典》修订版的价值,也对其赢利模式格外关注。
四通汉字打字机发明人王缉志建议,“和微软、百度、Google等合作”,只要用户通过这些平台有偿使用了《康熙字典》修订版及数据库,社科文献出版社就可从中分成。“现在的中学教师用不用《康熙字典》?更需要的是社区图书馆和个人,应该由国家埋单”,清华大学教授李楯建议,出版社主动把《康熙字典》修订版寄往全球收藏中文书籍最多的前10家图书馆。
传统文化的传播和网络的结合是大势所趋,但“网上已有资料的学术性差、不够规范”,中华书局副总编辑顾青更关注《康熙字典》修订的一些细节问题。中华书局隶属的中国出版集团公司近年也在推动数字化工程,该局承担的国家项目“古籍数字资源库”已经实施了七八年。在他看来,绝大多数出版社目前都面临着转制成文化企业的生存压力,更需要国家在古籍数字化方面加大投入。
谢寿光不像李楯那样忧虑《康熙字典》修订版及数据库的海外销售,因为该社有90%的图书被海外客户采购过。他认为,国家汉办下属的全球各地的孔子学院都是《康熙字典》修订版及数据库的目标客户,而且它还适合作为国礼赠送给参加北京奥运的各国友人。
2005年,谢寿光在《说文解字》现代版上投入近50万元,3年来累计销售1万套,“没任何赢利”;而这次《康熙字典》修订版投入了130多万元,“还不包括营销成本”,但“皮书”系列的成功让他信心满怀。
|