数据最直接的来源是Web服务器。每当站点被访问一次。Weblog就在日志数据库中增加相应记录。Web分析工具可以通过分析和处理日志文件生成有意义的信息。Web服务器还可存储其它的Web使用信息,如Cookie和用户提交的信息等。Cookie是由服务器产生的,用于记录用户的访问路径。查询数据是用户在查询自己需要信息时在服务器端产生的记录。
服务器同时也保存文件的有关信息,例如文件的创建者、修改时间等注册用户的用户信息存储在顾客资料数据库中。内容包括企业目标受众的姓名、年龄,对于信息的看法,顾客的个人偏好等。
2.用户分析工具的设计。
(1)数据预处理模块。对Web日志文件及Web数据库/数据仓库中的数据进行数据预处理。从Web Server数据库中抽取相关数据,进行二义性分析,消除不一致性。确定浏览页面、用户、用户期间(Sessions)和用户访问序列等,将用户访问网站留下的原始日志整理成事务数据库,以供数据挖掘阶段使用。
(2)客户行为分析工具的系统框图。客户行为分析工具是对用户进入电子网站后,在接受各类信息中,反复查验相关数据和信息,最终产生用户信息“接受和消费”的行为过程的综合、分析系统。这个系统是建立在对用户行为抽样、统计基础上的宏观分析系统,可以对用户的信息行为状况、发展、趋势做出全面的判断、掌握。
(3)数据挖掘模块。数据挖掘模块是由挖掘综合器支持的数据分析系统。挖掘综合器是一个挖掘驱动引擎,是一个规则集合,能够根据不同的挖掘要求到Web数据挖掘算法库中选择最有效的挖掘够根据不同的挖掘要求到Web数据挖掘算法库中选择最有效的挖掘算法或几种算法的序列组合,并且使用该方法去执行挖掘任务。随着应用的深入,可以不断融入新的规则。Web数据挖掘算法库是一个数据挖掘分析方法的综合性算法库。它以插件的方式来组织各种挖掘算法,使各种方法可以方便地插入,实现了可扩展性和易选择性。并且可以通过参数来实现算法的选择。
常用的数据挖掘技术在客户行为分析中的主要应用有:关联分析用于了解顾客的购买习惯和偏好,决定市场商品的摆放和产品的捆绑销售策略;序列模式是用某时间点发现的产品购买或其它行为模式来预测将来购买产品或服务类别的概率;聚类用于市场细分,将顾客按其行为或特征模式的相似性划分为若干细分市场以采取有针对性的营销策略;分类用于预测哪些人会对邮寄广告和产品目录、赠券等促销手段有反应,还可用于顾客定级、破产预测等。
(4)方法驱动模块。利用挖掘出来的有益信息,去进行相应的工作,其中页面访问情况用来指导网站页面的重新设计和修改。分相应的商品广告等发送给客户,根据客户的爱好等来定制个性化Web界面。企业则利用相应的信息确定顾客消费的生命周期,针对不同的产品制定相应的营销策略;确定各个细分市场,为顾客的独特需求设计“个性化”的产品。
3.客户行为分析工具的具体内容。
(1)浏览页面的确定。浏览页面是一个用户请求的页面,一个页面中包括几个框架、图片和脚本。由于服务器记录的是下传到客户端的一个个文件流,在确定提取浏览页面时,通常结合网站的拓扑结构,将图片.gif,.jpeg,.jpg文件过滤掉。
(2)用户的确定。用户是指通过一个浏览器访问一个或几个服务器的个体。在实际使用中确定一个用户很难,一个用户可以通过几个代理或机器访问服务器。有时候可以把服务器日志、代理和参照页面日志结合起来确定一个用户。
(3)用户访问序列的确定。就是用户请求的一系列页面。一般服务器日志是以访问用户的IP地址为辅键、访问时间为主键排列的,因此。找出统一IP按时间访问的页面序列,就构成了用户访问序列。
(4)用户会期(Session)的确定。一次访问中用户访问的所有页面,最简单的方法是按时间的长度确定。
(5)完善访问路径。由于存在着客户端的缓存,用户浏览页面时很可能使用到浏览器的后退功能,要根据用户访问路径的前后页面送行推理.将其中疏漏的页面补在路径里。另外,执行CGI程序时,由于其传递的参数不同,最后的输出结果不同。必要时还要结合参数确定显示的页面内容。
(四)用户行为分析及信息挖掘模型的意义
数据挖掘的强大能力运用于客户行为分析,可以发现顾客和访问者的爱好、生活模式等,可以帮助公司怎样来争取新顾客,向谁推销产品,怎样使产品适销对路,怎样给产品定价,怎样吸引单个顾客.怎样优化Web站点等。数据挖掘客户行为分析工具的发展方向是:用户可以定制和指定产品和服务,交换信息,可以用来对web上的商业模式建模,预测、了解影响销售的各种因素,以便迅速调整他们的市场、价格、存货等。在网络社会中,用户成为信息产品发展的“决定人”,网上销售商必须很好地考虑到顾客的需要和利益。在竞争激烈的网络经济中,作为电子商务成功的一个重要因素,数据挖掘必将成为一种关键技术。
三、知识经济时代图书馆读者群分析及其服务
(一)知识经济时代图书馆读者群分析
知识经济对图书馆职能、工作内容、管理手段和服务方式等方面的影响势必会使图书馆的读者群发生重大变化。
1.读者以获取知识信息为目的成为发展趋势。
(1)图书馆的社会教育职能将更加突出。知识经济时代,现代化技术高度发达,知识高度密集,知识更新加快,知识物化(为产品)时间更短,竞争更加激烈,文盲、科盲将无法从事生产劳动,将无法生存,即便是受过高等教育,即使是专家、学者,也会产生很大的危机感。只有不断地汲取新知,才能赶上时代的步伐。为此,在图书馆学习知识,学习文化,学习科学技术的读者将会大大增多,那些只为消遣娱乐看杂志的读者将会大大减少,图书馆的社会教育职能大大提高。
(2)图书馆为适应信息时代的各种需求,在文献设置方面要作结构性的调整。图书馆文献设置结构、比例必须发生根本性的变化,科学技术类用书、工作实践性用书、岗位技能性用书、高科技、新技术图书,不仅要求数量增加而且要求及时快捷。
2.集体用户将会迅速增加,图书馆的科技服务职能将处于主导地位。知识经济时代,知识和信息将影响所有企事业单位的工作和效益,而图书馆这一专门的知识信息收集、加工、传递部门,为社会的各类企事业单位提供着必需的知识和信息保障。
在过去,由于经济发展不平衡,有些地方的图书馆经费紧张,文献资源缺乏,服务工作开展不到位,所以集体用户就很少。虽然各个市级、县级图书馆大多都设有科技部,开展科技服务,但收效甚微。加之,有些经济效益不好,更无法进行高新科技改造。在农村,高新技术推广更是困难,还没有把先进的知识和技术当作农业发展的推动力。随着社会的发展,知识经济时代的到来,上述状况必然会发生巨大变化。城乡集体用户将成为图书馆庞大的读者群。
3.“网民”已经成为新兴的读者群。从古代的藏书楼发展到近现代“藏”、“用”兼之的图书馆;到以计算机、通讯网络为设备,电子出版物为信息源,提供全方位信息服务的全新意义的数字图书馆,社会的进步促使着图书馆的演变。可以想象,不远的将来,全国各地的图书馆,都把自己的馆藏图书信息以数字方式存储于一定载体,通过计算机和网络快速传递,上网服务,提供给分散在各地的用户利用,凡个人与单位只要拥有计算机并与网络连接,就能在任何地方、任何时候充分自由地查询、检索,并不受期限、数量与馆际界限的限制,更不分什么上下班。这种网民会占图书馆读者群很大的比例,而且随着时代发展,比例越来越大。
(二)知识经济时代图书馆的服务
1.知识经济时代,图书馆的服务范围更广,项目更多,层次更深化,方式更灵活。
(1)将馆藏信息实现数字化管理。知识经济时代,图书馆的传统服务仍然是存在的。纸制品出版物仍然会存在,数量会更大,质量要求也会更高,众多的用户依然会将其作为首选。随着社会的发展,人民生活的提高,读者对图书馆的服务、服务环境的环境会有更高的要求;读者对知识信息的需要层次会更高,图书馆的工作人员对知识信息就要进行更深层次的加工处理和提供,要把传统阵地服务提高到与时代相适应的水平。
(2)扩大电子出版物的采购。电子出版物的增多,通讯网络的开通,网上读书的“网民”大量出现,图书馆的网上服务就成为和阵地服务并存的两条战线。图书馆就要将馆藏信息实现数字化管理,扩大电子出版物的采购和利用,保证计算机设备、网络通讯技术的先进性能和网络畅通。这正是衡量知识经济时代图书馆服务质量的主要标准之一。
2.产业化效益服务与公益性事业并存,建立服务型的图书馆。
图书馆作为公益性事业由来已久,而且将来也仍然会作为公益性事业为全民提供免费服务。面对知识经济对劳动者的高素质要求,就更要做好公益性的免费服务。
(1)知识经济时代,社会的发展将以信息价值的生产为中心,信息知识将成为比物质和能源更为重要的战略资源。
(2)适应社会信息化的要求,逐步实现图书馆的有偿服务。图书馆必须利用先进技术设备,如缩微复印技术、声像技术、计算机设备、通讯设备、电子出版物、多媒体技术等,而这些都需要很大的投资和服务过程中的损耗,特别是对信息资源的深加工和精处理而形成的信息产品,对用户和读者来说,都应该收费,这是图书馆的有偿服务。在信息产业化的进程中,这种有偿服务的量会越来越大,这同样会成为衡量一个图书馆产业化程度的标准。
3.社会化图书馆,以及社会化图书馆服务将成为发展趋势。
(1)知识经济时代,企业单位对图书馆科技服务的要求将是非常迫切的,各企业单位为了生存和发展,就会依赖于知识信息,就会主动接受和寻求图书馆的科技服务,这也正是知识信息升值、高新科技转换成生产力的大好时机,图书馆的科技服务就会大有作为。
(2)我国是一个农业大国。进入知识经济时代,农村这个广阔天地就会成为图书馆进行科技服务的主要战场。由于历史、地域的原因,广大农村相对落后,科技水平低下,相应地发展潜力也大,图书馆就应该将科技服务的重点放在农村,以知识信息、科学技术扶持乡镇企业,扶持科技示范户、专业户。使他们发展起来,要用知识信息去提高农民的科技文化素质,要用高新技术去增加衣业产品的科技含量,进而全面推进农村经济的增长。
四、提高信息用户满意度的措施
图书馆只满足于一般文献信息检索的被动式服务很难使用户满意。为适应信息用户需求发生的变化,提高服务的深度和广度,扩大服务的规模,使用户的信息满意度日益提高,应在以下几方面采取有效措施。
(一)树立精品意识。加强信息资源建设
图书馆信息资源建设对用户的满意度有决定性作用。为了增加广大用户对图书馆的满意度,把有限的经费用好,就必须在收集文献信息资源过程中树立精品意识,实施精品战略。在信息资源建设过程中,要有计划地、超前地采购精品文献资料,避免盲目购进和重复购进。采购的文献资料既要及时又要有超前性和高品位,并要及时剔旧,让信息资源不断得到扩充,始终保持着生机。
图书馆的精品意识,主要体现在所藏信息资源的质量上:
1.信息资源建设是否系统、完整,有重点、有特色。
2.在应该收集的最新文献资料中,重要的、有价值的收藏的广度与深度。
3.信息资源是否做到既丰富又精练,要加大网络资源建设和电子出版物的收藏力度。
(二)培养精湛技能.提高信息服务水平
图书馆用户的另一期望是图书馆馆员的高水平服务。馆员的高水平主要是指能清楚地解释文献资料的组织方式,能妥当地解答咨询,能迅速准确地检索、筛选、提供用户所需文献信息,能结合实际提出创新建议供用户参考等等。
1.馆员必须具备精湛的专业工作技能。在全面掌握传统服务方法的基础上,必须掌握现代化设备的操作技术,了解各种网络知识。要有广博的学科知识和知识评介能力,转变传统的馆员角色,努力使自己成为“信息导航员”。
2.图书馆馆员是信息资源开发的主体因素。信息资源开发得如何主要靠馆员的工作能力,靠馆员不断提供类型多样、应用方便、标准实用的实时动态信息源。只有信息资源丰富、馆员服务水平高,用户的满意程度才会提高,图书馆与用户的距离才会拉近。
(三)深入调查研究。掌握信息用户需求
现在,用户的信息需求同社会发展现实日益紧密并走向趋同,管理决策系统对信息有了更新更高的要求。信息的服务对象已不局限于某一阶层,而是全社会中的各行各业,.社会大众成为最大的潜在的信息用户群。为此,必须改变服务方式,深入到城乡、企业、社区、学校、科研等社会市场,调查信息用户的需求动态及变化规律,掌握不同用户的不同需求目的,研究相应的科研课题,判断确定某些用户需求信息的价值,形成满足用户需求的信息产品,实现社会价值和经济价值。
(四)丰富服务手段。完善信息服务体系
1.图书馆信息资源的开发利用方法多种多样,有咨询开发法、信息集合开发法、信息反馈开发法、整体序化开发法、知识系统开发法等。
2.开发手段分为手工开发法、机器开发法。如今,传统的手工开发法已不能满足用户对信息广、快、精、准的要求,必须利用机器开发法来丰富服务手段。机器开发法是利用计算机技术、光学技术、声像技术、多媒体技术、通讯技术等,使信息资源缩微化、视听化、网络化。在信息源查询、信息检索、信息阅览、信息提供等方面,根据用户的不同需求性质,使用不同的技术设备开展工作。
3.利用计算机进行信息检索。计算机进行信息检索,检索途径多、速度快、准确率高,能实现即“点”即得的高速信息检索。
4.利用通讯网络技术。通讯网络技术可将某一地区范围内各图书馆的所有馆藏文献连接成一个整体网络,用户可检索到网络内所有信息资源。