第一台电子计算机ENIAC问世于1946年,其后,计算机技术的发展日新月异。目前,电脑应用已渗入到了人类生活的各个方面,它促进了信息的处理、传输、交流与共享。作为信息时代基础技术的电脑,其作用决不仅仅是一种工具,应将它视为一种工作方式,一种文化(计算机文化),一项社会技术。
汉学研究的最大困难,在于资料检索的不易。由于文献的浩瀚与分散,传统治学方法显得较为低效,有价值的学术观点的形成,往往需要长时间的阅读积累,为寻找某条材料,有时不得不翻检大量典籍。人谓大海捞针,文史工作者当自知冷暖。
然而,人文与科技确实存在着某种乖离趋向,调和二者之间的矛盾,一直是西方国家内政的重要课题。国内人文与科技之间的鸿沟则远较西方为甚。有鉴于此,汉学界已越来越意识到电脑应用的重大意义,国家古籍整理出版规划小组鼎力支持这一崭新事业。港台等地为先行者,在这一方面已作了不少有益工作。
书学文献研究与传统汉学研究有其相似之处,电脑技术的应用,无疑具有十分诱人的魅力。笔者不揣浅陋,就书学研究中电脑应用的一些较现实课题略作阐发。
(一)书学文献的储存与检索
中国书学文献较集中的专论,宋以前归于经部小学类,其后,陈振孙改归子部杂艺类,后世多从陈例。此外则散见于金石谱录、地方史志、传记题跋、诗赋笔记、轶闻野史之中。至若与书法有关的背景文献,则更其庞杂。近现代单独整理出版者,只可九牛一毛,对于专业理论研究,殊不敷用。索引工具类书籍,亦只《四库全书总目》、《直斋书录解题》、《书画书录解题》等数种可资使用。比较容易地查阅、检索或披览古代书学理论,减少爬梳文献的辛苦,是现代理论研究者最迫切的愿望。
电脑在资料的储存、检索、索引编制等方面,较传统工作方法有着无可比拟的优越性。就文献的汇编储存而论,目前最先进的储存方式已发展到光盘储存。与20世纪70—80年代之前的磁介质储存相比,光盘具有海量浓缩,多媒体融合,检索迅速,永不失真等优点。例如,一张普通只读光盘(CD—ROM),直径不过12cm,厚度1.2mm,一般可容纳700MB数据,相当于30万页A4单面打印纸、约3亿文字资料。
当然,广义的书学文献,就信息学观点看,应当包括各类介质、载体的记录,不能只着眼于通常所说的纸本印刷品。故而,电脑处理的对象将扩展到甲骨刻辞、陶书印玺、简牍帛书、商彝周鼎、秦刻汉碑、宋椠元刊及历代墨迹。
多媒体技术可较好完成这种处理。所谓多媒体技术,是一种把文字、数字、图形、静态图像、活动图像、声音诸信息的媒体集合在一起,并由计算机综合控制的新技术。多媒体技术因其信息交互式采集、编辑、展示和输出等卓越功能,近年来异军突起,方兴未艾。显然,处理非动态的古代书学文献,多媒体技术更其游刃有余。
由此,传世书学文献的储存,大致可分为两个层次:其一为文本储存;其二为图像储存。以法国的第一部光盘艺术字典为例,它即涵盖了上述两层次:这部多媒体光盘辑录,收列了近两万名艺术家的30000幅作品及各式文件,其交流目录则容纳了近十万幅画作,终端访问所提供的文本信息包括作品名称、尺寸、材质、技术特征、完成日期、取得途径等等。
解决了文献的储存,另一个相关连的问题便是信息检索。计算机信息检索在经历了传统信息检索、全文本检索(Full Text Retrieval)之后,多媒体技术业已提供了最为有效的超文本(Hy Pertext)检索。这种信息组织方式,能将不定长的基本信息单元存放于结点上,基本信息单元可以是单字、句子、章节、视频、音频信号等,结点以链路相联系,链路呈网状层次结构,具有联想,非线性特征,故而允许用户以其认可的任何有意义方式,直接快速检索到所需信息。这种径捷触及媒体数据源的新颖检索方式,在一定程度上有类于人的思维。
书学文献的多媒体处理,只要具备条件检索、模糊检索、多项自动检索、主题词索引自动生成、任意交叉、扩大、限定资料范围、类别统计排序、显示、输出等通用功能,便足以作“辨章学术,考镜源流”之用了。
从目前研究成果看,上海博物馆已完成了《商周青铜器铭文选》索引系统、《中国碑刻》信息系统两软件,其用户界面良好,实用效果颇佳。香港中文大学则正在建设《简牍帛书文献》电脑资料库(Data-base),其中“居延汉简”、“敦煌汉简”、“银雀山汉简”共计50万字的二期工程已告完成。
《商周青铜器铭文选》索引系统的多层次资料库较值借鉴,其结构如下:
A、青铜器编目库——记载器型、时代、出土地点等。
B、图像库——包括器物图像及铭文拓片图像。
C、文本库——以权威研究结论进行文本隶定登录。
这种多层次资料库,使历史文化遗产的文物价值与文献价值同时保留下来,可适用于多方面的研究。几乎可以肯定地说,书学文献的电脑处理,将完全改变传世书学文献载体不一的局限:文字、拓片与实物的合一,将使三者构成一个有机整体,为研究者提供极大的便利。
当然,古代书学文献的电脑处理仍存在某些困难,其中最棘手的就是汉字字库问题。中国汉字包括正体、异体、通假、古体等大约有十万左右,而电脑的GB字库仅6763个,容量最大的ISO10646字符集,所收录的中、日、韩三国汉字亦不过20902个。但从理论上说,全汉字字库的建立并非天方夜谭。目前,由裘锡圭先生主持研制的“全汉字信息处理系统”,可望在不久的将来解决此一“瓶颈”问题。
不言而喻,书学文献的电脑处理,完全可以延伸到当代。对书法专业刊物、教育、出版、展览、新闻等作有选择的编辑,我们将拥有一部年鉴式的“活”的当代书法史。
基于上述认识,兹拟就“多媒体书学信息系统”总体设计方案。
A、开发系统的环境
1.硬件配置
586以上主机,彩色扫描仪、视频编码卡、动态视频压缩卡、触摸屏、鼠标、声霸卡、麦克风、音箱等。
2.软件环境
MS—DOS3. 3以上操作系统。开发过程中需要汉字系统、文字处理软件、图像处理软件、动画软件,Windows环境及一套具体的多媒体开发软件。
以上基础配置,随着PC机和多媒体设备开发软件价格的不断下降,总投入不超过10万元。
B、开发系统的体系结构
(a)系统结构采用模块设计。共五大模块,每一大模块包含若干子模块。
(b)子模块结构及功能设计:
该模块使终端用户输入查询要求,利用系统提供的功能,获取信息以及演播多媒体书学信息。
该模块主要是为格式化和非格式化书学信息提供多种有效的查询方法,多样的演播模式,有效控制声音、文字、图像的同步完成,定期对系统进行维护。
该模块为各种书学信息的操作提供方法和手段。完成实时创建、增加、删除、动态修改及全屏幕编辑。
该模块主要完成数据库(DB)选型,研究各类媒体书学信息的表达方式和储存模式,把处理的书学信息对象定义为可标识的实体模型。不同媒体的书学信息组成不同的数据库,每一类数据库对应于一种媒体的存取操作,并通过该模块进行统一管理。
该模块通过多种成熟的图像处理软件、多媒体数据编辑工具制作系统的音像、图片、文字,实现多媒体数据录入。
C、开发系统的方法
可根据系统的特点及实际要求灵活采用。目前较流行的方法有:
1.SDLC(Structured Design Life Cycle)即结构化开发生命周期法。它预先定义用户的需求和任务,整个计算机管理信息系统的开发过程,从初始到结束以若干阶段,按各阶段之任务和目标逐步完成。
2.PM(Protype Methed)即原型法。它可以很快建立系统原型供用户使用,随着用户和开发人员对系统理解的不断深化,渐次晋级改进更新,直到满足使用要求。
3.OOD(Object Oriented Design)即面向对象的设计。其特点是信息处理的模块化,模块因其高内聚、松耦合之长而具较好之独立性,亦易于理解,易于修改。
(二)书学文献的电子出版
电子出版,大大改变了信息传播方式。它以数字代码方式将图文声像信息储存于磁、光介质上,通过计算机阅读。这种出版物的媒体形态包括软磁盘、只读光盘、集成电路卡等。就目前风行的态势看,越来越多的图书正进入光盘。
1995年以来,电子出版物数量突飞猛进,到21世纪,预计可达全部出版物的25%。电子出版前途无量,因此有人预言它最终将取代传统的印刷书籍。
书法文献的电子出版,还刚刚起步。可选择重点类别,尤其是实用性强,消费市场广阔的专题制作电子版。达识者,终将为天下先。
据悉,百卷本《中国书法全集》的主编刘正成先生,有向海外推出《全集》豪华版、精华版之意向。从战略意义上讲,若以“光盘全集”作首选,将更富挑战性,它将远远胜过“淳化阁帖”、“三希堂法贴”等皇家制作,方驾古贤,社会效益须作划时代观。
全套百卷的《全集》印刷品,将重达百余公斤,即以目前市价计,总价格亦在万元左右。无论公藏、私藏,投资不菲。“光盘全集”储存密度高、不遗漏、不失真,且几无运输负担,与印刷品相较,成本大为降低,加之港台、海外消费市场的广阔,经济效益未可低估。
当然,全集的电子版制作完全可以作进一步开发:全文本、超文本检索的多媒体光盘是最理想的形式。此外,增加剪辑、缩放、输出等功能,印刷品《全集》何可比肩?
推而广之,资料时效性极强的现代名家专集(林散之、于右任、谢无量、沙孟海……)的电子版制作,理应具有相当市场前景。
与电子图书类似的电子报刊,也是出版业的新宠。它不像一般报纸、杂志那样直接送到读者手中,而是由订户通过电脑阅读。随着通讯网络的日趋完善,书法专业刊物亦有加入网络的准备。多媒体技术的应用,将使该类报刊的新闻取得身临其境的效果。另外,订户可以实时地通过电脑将反馈意见传给记者、编辑,开创更为灵活的编读交流。
(三)电脑书法
电脑绘画,给电脑书法以极大启迪。国内电脑书法已处于实验阶段。电脑创作软件取代了传统的笔、墨、纸、砚。该类软件还具备剪辑、移动、删除、比例复制、放缩功能。
从电脑绘画的实践看,最为活跃的流派之一——电脑波普派(POPULAR)对电脑书法较有参考价值。波普派强调现实作品与物品的自由粘贴及任意组合。作者将一系列画面用扫描仪输入电脑储存,在灵感激发下,将信息库中图像调出“组合拼装”而产生作品。
书法中的“集字”与此暗合。“集字”始于唐代,长安弘福寺僧怀仁,集王羲之书《圣教序》碑,总字数不过数千,费时却达多年。如果借助于电脑,先将王羲之传世书法作字典化输入处理,通过自动检索集字,再辅以二期制作(缩放、选择、拷贝),怀仁积年之勤苦,数天之内即可告罄,且能保证不“下真迹一等”。对于这种集字,当然有必要增益部首解析,拼合以及刻拓——墨迹双向转换等功能。
电脑集字尤其适用于书法教学,传统教学枯燥乏味的临摹练习,将变得妙趣横生。
作为书法创作前期的辅助训练,这种集字也不无裨益。电脑集字可以扩大到风格相近的一类书家群中进行。如宋四家行书风格具内在共通性,当创作内容确定之后,集四家书于一帧,以获取参考效果,不失为一种选择。米芾早年作书不避“集古字”之讥,其后终获大成,足可为鉴。对于幅面相对较小的篆刻创作,电脑模拟生成,亦非常适用。
确实应该指出,以电脑程序来表达艺术家的思维是极为困难的,较高层次的“创造性”更值得怀疑。但在技法训练上,电脑肯定能为我们做更多事情。虽然书法界对电脑书法臧否不一,但聊备一格的宽容,当不是过分的要求吧?
如果说上述三方面的应用主要着眼于书法研究及电脑技术之现状,展望未来,与网络化(Net work)有关的信息高速公路,亦颇值关注。网络技术,实现了资源的共享,大大拓展了计算机用户的信息拥有量和计算机处理能力。迄今为止,世界上规模最大的网络—Internet,已覆盖了200多个国家和地区,连接了数十万个局域网络,网上运行的计算机主机超过数千万台。Internet已成为全球信息高速公路的标志和代名词。其最为通用的功能有:
1.电子邮件(E—mail):它是一种利用计算机和通讯网络系统传递信息的通讯方式。电子邮件与其他计算机文件类似,同样具有储存、检索、编辑、打印、拷贝功能。
2.网络新闻(USENET):参与网络新闻交流的所有结点统称为USENET。可提供计算机会议(Computer Conference)服务。网络新闻使用与电子邮件相同的信息格式,其“电子公告牌”功能尤为出色。
3.远程登录(TEINET):允许用户与远程计算机上运行的程序交互,可以执行远程计算机上的任何应用程序,很容易实现软件和研究成果的共享。
4.文件传输服务(FTP):在Internet网络上,FTP占流通量的极大一部分。任何计算机程序在需要进行文件传输时都能激活FTP,这意味着文件传输的自动化。
5.信息浏览服务(GOPHER):该服务是一种交互式,菜单驱动的浏览器,非常直观而易于使用。
6.高级浏览服务(3W:Word Wide Web):允许用户任意检索远程计算机上的文本、音频、视频文件,并且引入了超文本、超媒体概念。
7.自动搜索工具:包括标题自动搜索(Archie)和内容自动搜索(WALS)。
1994年8月,中国正式加入Internet(所谓CHINANWT),以此来满足国家科研、教育、经济、政府等部门与国际信息交换的需要。
十年来,国内书法网站的建设,正如雨后春笋,方兴未艾,这些网站的水平与实力虽然良莠不齐,但其积极意义确实不容低估。信息查询、资源共享、促进交流,计算机技术的发展,为书法研究展示了极其广阔的前景。
参考文献:
1 《多媒体信息系统的设计》,海天出版社,1995年。
2 《管理信息系统概念、结构与研究》(美)G·B戴维斯,1995年,哈工大出版社。
3 《Internet与办公自动化》,《办公室业务》1996年第5期。
4 《汉学研究通讯》,(台湾)国立中央图书馆,总第54期。
5 《古籍整理出版情况简报》,中华书局,1995年8期(总第297期)。
6 《档案管理》1996年2,4,5,6期。