首页 > 理工 > 计算机

网络信息分类组织标准化研究与构想

【关键词:计算机网络】 
1 网络信息分类组织面临的问题

分类组织方式是网络信息资源组织的一种重要方式。目前,大多数提供网络信息服务的搜索引擎或门户网站都采用自编的分类体系进行信息组织。这些分类体系虽然充分考虑了用户的需求和网络信息的特点,突出了个性,方便了使用,但这些体系仍然存在许多有待改进的问题。

1.1 学科大类设置不全,知识体系不完整

以中文雅虎(Yahoo)为例,它将网络信息分为14个宽泛的类目,每个大类又分出若干二级类,二级类目下细分出三级类目,可根据需要细分出四、五级类目。可以说,Yahoo采取的是一种逐层扩充的方法,以使知识的覆盖面越来越全。但是,从Yahoo分类每年都发生的明显变化和迅速增长的网络信息资源我们可以看到,仅仅设置这14个大类是难以涵盖人类社会生产生活的各个方面的。又如搜狐(sohu),将网络信息分为18个大类,网易(WWW.163.com)将网络信息分为19个大类,都有类似情况。总之,由于各种原因,现在的网站分类设置还不完善。知识覆盖不全,体系过于简单。几乎所有的中文搜索引擎的分类体系都存在着知识残缺不全、体系设计不完整的通病。

1.2 类目划分标准不够合理

信息资源在同一层次下划分的标准不够统一,有时出现两个或两个以上划分标准的现象。具体来讲,同一层次类目在选择上存在的问题有:一方面,网站为了突出当今的热门和主流信息,将一些下级类目提升到大类中,如大多数中文网站把“电脑网络”或“计算机与网络技术”与“科学技术”并列为大类;又如网易将“体育竞技”和“少儿乐园”放在大类中。另一方面,子类的设置的标准问题,如Yahoo的“科学”这一大类下设有“电脑与信息技术”、“活动”、“教育”、“科普”、“酷站”、“能源”、“字典”、“组织”等等的二级类目。此外,在大类的展开中常出现整体不包含局部的违反逻辑规则的现象。

1.3 各网站采用的分类标准不同,各行其是,导致了用户在使用时无所适从

以网络信息资源为基础建立类目体系,虽有较好的实用性,但类目划分的规律性不强,从而造成了各搜索引擎的分类不一致,体系也不太严密、科学,类名不规范,各个搜索引擎设立分类目录时力图突出的是自己的特色。

如新浪设立了“少儿搜索”大类,搜狐把“公司企业”单独列为一个大类,这就使得用户在使用时必须对某个搜索引擎的类目比较熟悉,否则当人工的分类有时与某些用户的习惯不一致时,会造成这些用户无法在正常的路径中找到资料。

1.4 类目名称设置不够规范合理,不能全面反映类目的内容,给用户查找易造成误解

类名有时不能确切地概括类目的内涵,有时只有象征意义。此外,由于类目的下位类范围较宽,上位类有时很难有效限定其含义,再加上网络自编分类体系一般不使用注释揭示类目内涵,容易使一些类目的含义和范围难以确定。

设置好类目名称关键是选好类日用词。很多网络分类体系中采用一些含义模糊的语词,而且没有注释,这就使用户很难判断该类目的外延。如“网易”的“另类科学”,“搜狐”的“生活情趣”等类名,如果没有注释,根本就无法明白该类的内容包括什么。

1.5 类目排列缺乏逻辑性

目前,中文网站总的来讲类目排列比较随意,外延常常有交叉重叠。几乎所有的中文搜索引擎的分类体系都存在着类目排列混乱的通病。如新浪、网易、搜狐、中华网在线等,都把“文学”与“艺术”、“电脑网络”与“科学技术”、“经济”与“文化”及“政治”等原本密切的大类,却人为地分割开来。又如网易对“文学”大类之下15个二级类目的排列,逻辑性不是很强。再如新浪对”文学”大类之下30个二级类目的排列,即便是按类目的使用频率或访问量序列排列,也使人感到排列次序不规律,不易查找。

1.6 从事网络信息分类组织的人员都大多是非专业的分类人员,缺乏专业知识

随着网络信息资源的迅速增长以及信息需求的不断加大,网站业务量也快速攀升,而建立一个优秀的中文搜索引擎是一项庞大复杂的系统工程,在技术、设备、人力、财力的投入上都有比较高的要求。因此,许多网站扩大了工作人员的招收数量和范围,与此同时,许多网站却忽视了引进有信息处理专业知识的人才,因此造成了许多诸如以上提到的网络信息分类组织方面的问题。

面对海量网络信息,其分类体系的诸多弊端为用户充分利用网络信息、开发共享网络资源带来严重困难。因此,构建规范合理的网络信息分类体系,实现网络信息分类组织标准化已是大势所趋。

2 国内有关学者的研究观点

从1998年开始,国内对网络信息分类组织的研究此起彼伏。其中,有许多学者表达了网络信息组织“标准化”的思想。如黄如花在文献1中指出要“信息描述标准化”;又如郑福根在文献2中认为网络信息组织的原则之一就是“标准化原则”;再如张林龙在文献3中指出“建立统一的网络信息分类标准成为网络信息分类组织的迫切需要”等等。此外,从近几年的研究成果来看,要编制一部适用于网络信息分类组织的分类法已具备了一定的理论基础,此说法可从刘延章、余义芳在文献4中对1998年~2002年这5年间160余篇有关网络信息分类组织研究的一些结果中略见一二。下面是文献4中的部分观点:

(1)关于网络信息、网络信息用户、网络信息技术环境特点方面的研究成果极大地提高了我们对网络信息分类检索工具的标引对象、使用对象、所处环境的认识,为编制高质量的网络信息分类法打下了认识基础。

(2)关于网络信息分类法与传统文献分类法方面的比较研究为我们借鉴二者各自的特点、编表的理论、方法和技术提供了便利,从而为编制高质量的网络信息分类法打下了理论基础。

(3)关于传统分类法应用于网络信息分类组织方面的研究虽然有助于传统分类法特别是《中图法》自身的调整和改造,使之适应于网络信息分类组织的需要,但也为更好地编制网络信息分类法打下了方法基础。

(4)关于现代技术应用于网络信息分类组织方面的研究为编制高质量的网络信息分类法奠定了坚实的技术基础。

(5)关于中文网络信息分类体系的特点、问题及其改进方面的研究对于编制高质量的网络信息分类法具有现实的借鉴意义。

(6)关于统一的中文网络信息分类法编制方面的研究对编制高质量的网络信息分类法奠定了扎实的基础。

从上述研究结果可以看出,我国编制一部高质量的网络信息分类法具备了一定的理论研究基础和技术实现条件,为实现网络信息分类组织标准化提供了强有力的保障。

3 对网络信息组织标准化的构想

通过以上分析,要实现网络信息组织标准化,编制一部适于网络信息组织的《分类法》是非常紧迫,也是切实可行的。但网络环境下的信息分类体系与传统文献分类体系相比存在着许多差异:①网络分类是以事物为中心,而不是以学科为中心列类;②网络信息分类是以网络资源为分类的基本对象,类目收录对象的范围更广;③采用了更多的信息技术;④直接采用语词进行信息标引;⑤传统分类是以线性方式展开类目,而网络分类是以网状方式进行超文本链接;⑥更新速度快。因此,编制网络信息分类法应考虑以下两大方面。

3.1 宏观构想

编制网络信息分类法,实现网络信息组织标准化,应体现以下主要原则:

(1)科学性原则。网络信息分类法应结合网络信息资源的特点,在充分揭示各学科之间内在联系和相互关系的基础上,将学科分类与事物分类相结合,构建一套科学合理的网络分类体系。

(2)继承性原则。网络信息分类法应吸收传统分类法的精华,吸收目前各中文网站分类体系的优点,结合现代信息技术来共同建造。对传统的东西不能全盘抛弃,也不能全盘吸收,应在吸收借鉴的基础上有所创新,有所发展。

(3)动态性原则。由于互联网是一个多元、开放的信息系统,因此,网络信息资源具有范围广、数量大、动态性强的特点。这就要求网络信息分类也要随着互联网内容的变化及时调整,使各种类型的网络信息资源都能在分类法中找到自己的位置。

(4)实用性原则。网络信息分类法应考虑网络环境下用户需求的特点。在类目的设置上,既要体现分类体系的相对稳定性,又要方便用户快速查询。类目数量控制在20~25个,类目层次展开至3~4级为宜。

(5)多维性原则。传统分类法以线性方式揭示文献信息内容,而网络信息分类法要尽可能全面而深入地揭示网络信息的内容和形式,多层次、多途径、全方位、多角度地进行信息揭示和描述,用超文本链接技术,变线性方式为网状方式,构建新型网络信息分类体系。

(6)开放性原则。网络信息分类体系具有相对的稳定性,但网络信息资源的开放性和动态性决定了网络分类体系也要随时增添新的内容。同时,不断吸收新思想、新技术,进一步满足和适应社会以及科技发展的需要。

3.2 微观构想

根据上述对网络信息分类法宏观构想原则,结合传统分类法和现有网络信息分类体系的研究成果,笔者针对网络信息资源中的一类资源——综合性网站的框架构建了5大板块,对其中内容相对稳定的休闲娱乐、社会科学、自然科学和综合信息四大板快设计了22个一级类目。该分类体系以主题为主要聚类标准,充分体现网络信息组织分类——主题一体化思想。具体如下:

一级类目

热门追踪板块:考研 聊天室 游戏 同学录 人物 明星 下载专区 招聘 彩票 动漫 flash......

休闲娱乐板块:新闻与媒体 娱乐与休闲 体育与健康 旅游与交通 生活与服务

社会科学板块:社会文化 哲学与宗教 政治与法律 军事与战争 经济与金融 教育与就业 人文与艺术 历史与地理

自然科学板块:自然科学 医疗与卫生 农业科学 计算机与网络 工程技术 环境科学

综合信息板块:国家与地区 参考资料 综合网站

上述各板块中,热门追踪板块内容不固定,根据网上热点话题的变化而变化,其余四个板块的内容相对稳定,即休闲娱乐板块包括5个一级类目;社会科学板块包括8个一级类目;自然科学板块包括6个一级类目;综合信息板块包括3个一级类目。

Internet是一个开放、动态的网络体系,对其分类体系的构建,实现网络信息分类组织标准化是一个逐步完善的过程。本文所探讨的分类体系也需要进一步细化和发展,相信经过不断的努力和实践,实现网络信息分类组织标准化的这一天不会太晚。

【参考文献】

1 黄如花.网络信息组织的发展趋势.中国图书馆学报,2003(4)

2 郑福根.网络信息组织的理论与方法探讨.现代情报,2004(6)

3 张林龙.网络环境下的信息组织.情报杂志,2003(10)

4 刘延章,余义芳.近五年来网络信息分类组织研究的现状及其展望.情报学报,2004(4)

5 王知津,肖洪.网络信息组织对传统信息组织的借鉴.图书馆工作与研究,2003(4)

6 陈树年.搜索引擎及网络信息资源的分类组织.图书情报工作,2000(4)

7 董琳.网络信息分类组织的发展趋势与标准化.图书情报知识,2004(4)

8 王本欣.网络信息资源组织研究.图书馆学研究,2004(5).

9 宋剑祥.从国外分类法看《中图法》对网络信息资源的组织.图书与情报,2004(2)

10 宋蓓玲.浅析构建网络信息分类体系.情报业务研究,2004(8)

11 张文波.浅述网络信息资源组织.现代情报,2004(7)

12 王艳.从YAHOO!分类系统探索网络信息组织的发展.图书馆学刊,2003(6)
更多 >>
热门分类
推荐文章