14网络环境下的信息计量研究

上传人:dja****22 文档编号:243133889 上传时间:2024-09-16 格式:PPT 页数:32 大小:750KB
返回 下载 相关 举报
14网络环境下的信息计量研究_第1页
第1页 / 共32页
14网络环境下的信息计量研究_第2页
第2页 / 共32页
14网络环境下的信息计量研究_第3页
第3页 / 共32页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,信息计量学,1,信息计量学,第十四章 网络环境下的信息计量研究,第一节 网络信息计量学概述,20,世纪,60,年代以来, 在图书馆学、文献学、科学学和情报学领域相继出现了,3,个类似的术语,:Bibliometrics,、,Scientometrics,、,Informetrics,,,分别代表着三 个十分相似的定量性的分支学科, 即文献计量学、科学计量学和信息计量学,(,情报计量学,),。,随着信息科学和信息技术的迅速发展以及互联网的普及应用, 信息资源由早期的实物化、纸质化阶段进入到电子化、数字化和网络化阶段, 网络信息交流活动迅速激增, 原有的信息计量指标已不再适用于测度评估网络信息资源了, 其结果就是导致了信息计量学进一步发展成为“互联网上的信息计量分析”,(Webometrics),。,网络信息计量学的诞生, 本质上说, 乃是科学计量学、文献计量学、情报计量学和技术计量学在新的信息网络时代经过革命改造的结果。,一、网络信息计量学的产生与发展,2,信息计量学,第十四章 网络环境下的信息计量研究,网络信息计量学,第一节 网络信息计量学概述,第二节 网络数据的获取与处理,第三节 网络信息计量学的应用,3,信息计量学,一、网络信息计量学的产生与发展,1990 年Paisley 提出将信息计量方法应用于,电子通信领域,,,他明确指出电子信息将成为文献计量学研究的主流,。,1996,年,,Mckiernan,根据引文含义,提出了,“,sitation,”,的,概念,用以研究网页之间的引用关系。,1997 年Almind等人在,“,Journal of Documentation”上发表的文章万维网上的情报计量学: 网络计量方法门径( Imformation Analysis on the,WWW,:,Methodological Approaches to,“Webometrics”),,,首先提出了网络,信息,计量学一词,,,开创了网络,信息,计量学研究的先河。,1997,年,网络电子期刊,Cybermetrics,创刊。,在每隔两年召开的国际文献计量学、信息计量学及科学计量学研讨会上,,,从1997 年开始加入了网络计量学这个论题议程,。,第一节 网络信息计量学概述,第十四章 网络环境下的信息计量研究,4,信息计量学,一、网络信息计量学的产生与发展,网络信息计量学,是采用数学、统计学等各种定量方法, 对网上信息的组织、存贮、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以便揭示其数量特征和内在规律的一门新兴分支学科。,它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科,也是信息计量学的一个新的发展方向和重要的研究领域。,第十四章 网络环境下的信息计量研究,第一节 网络信息计量学概述,5,信息计量学,二、网络信息计量学的,研究对象,和研究内容,网络最基本的信息单元“比特”,,包括数字信息或文字信息,集文字、图像和声音为一体的多媒体信息,以字节为单位的信息量和流量的计量分析等;,网上文献信息及其相关特征信息的计量问题。,如网上电子期刊、论文、图书、报告等各种类型的文献,既涉及网上一次文献,又包括二次、三次文献的计量问题;对网上文献著者分布规律、分散规律、文献增长规律、老化规律、引文分析规律的分析与研究。,网络结构单元的信息计量问题,,网络结构单元包括站点、布告栏、聊天室、讨论组、电子邮件等,对以上网络结构单元的信息计量研究可以从宏观上揭示网络文献的特征和规律,帮助人们更好地管理和利用网络信息资源。,第十四章 网络环境下的信息计量研究,第一节 网络信息计量学概述,6,信息计量学,二、网络信息计量学的研究对象和,研究内容,1网络信息计量学的基本问题研究,2网络信息计量学的理论问题研究,3网络信息计量学的方法问题研究,4网络信息计量学的技术问题研究,5网络信息计量学的应用问题研究,6网络信息资源计量管理对策问题研究,第十四章 网络环境下的信息计量研究,第一节 网络信息计量学概述,7,信息计量学,三、网络信息计量学的基本概念,第十四章 网络环境下的信息计量研究,第一节 网络信息计量学概述,(一)链接术语,施链与被链:,如果网站A的网页链接了网站B的网页,即网站A是施链网站,而网站B为被链网站。,外部链接:,又叫站外链接、链入、入链、external link、inbound link。指外部网站或网页指向某网站资源的链接。,站内链接:,又叫内部链接、自链、内链、自引、self-link、inlink,某网站内部一种资源指向其内部另一种资源的链接。,出链:,又叫链出、outlink,某网站指向其他网站资源的链接。,8,信息计量学,三、网络信息计量学的基本概念,第十四章 网络环境下的信息计量研究,第一节 网络信息计量学概述,(一)链接术语,链接耦合:,如果网站A和网站B同时指向某一网站,则称网站A和网站B之间存在着链接耦合,链接相同站点的次数称为链接耦合数。,共链:,如果网站A和网站B共同被其他网站链接,则称网站A和网站B共链。A与B共同被链的网站数,称为共链强度。,9,信息计量学,三、网络信息计量学的基本概念,第十四章 网络环境下的信息计量研究,第一节 网络信息计量学概述,链接术语,出链、链出、outlink:,指向其他网站资源的链接,站内链接,被链网站,施链网站,10,信息计量学,三、网络信息计量学的基本概念,第十四章 网络环境下的信息计量研究,第一节 网络信息计量学概述,(二)网络影响因子(web impact factors,WIF),网络影响因子,指的是在某个特定的时间,某个网站(或某个国家的网站)被其他网站和其自身所链接的网页数目的逻辑和除以该网站(或该国家的网站)的所有网页数。,11,信息计量学,三、网络信息计量学的基本概念,第十四章 网络环境下的信息计量研究,第一节 网络信息计量学概述,(二)网络影响因子(web impact factors,WIF),外部网络影响因子:,评价网站影响力,内部网络影响因子,12,信息计量学,一、网络数据的获取,第十四章 网络环境下的信息计量研究,第二节 网络数据的获取与处理,(一)网络信息计量工具,搜索引擎:,条件:,(1)数据库的覆盖范围是否足够大, 这样才能保证结果的准确性。(2)数据库必须经常更新, 因为网络上每天都有成千上万的新网页产生和旧网页消失。(3)能够检索特定网站的全部网页。(4)能够检索网站页链接的所有网页。(5)能够很好地支持布尔逻辑运算。(6)性能稳定,即在一个数据更新期内, 用具有相同含义的检索表达式进行检索所得到的结果应该一样。,常用工具:,AltaVista,、AlltheWeb,优点:,适用于大范围Web网的搜索。,缺点:,覆盖范围有限,且存在国家和地区的偏见;算法属于商业机密,限制了在科学研究中的使用;结果是不可靠和波动的。,13,14,信息计量学,一、网络数据的获取,第十四章 网络环境下的信息计量研究,第二节 网络数据的获取与处理,(一)网络信息计量工具,自主开发的网络爬行器,优点:,检索算法更科学,能更准确有效地计算网站的总网页数及链接数。,缺点:,不适合大面积Web网的搜索。,15,信息计量学,一、网络数据的获取,第十四章 网络环境下的信息计量研究,第二节 网络数据的获取与处理,(二)其他数据收集方法,Web,日志文件数据库,Cookie,网上数据调查方法,用户注册信息,离线数据收集方法,16,信息计量学,二、网络信息研究方法,第十四章 网络环境下的信息计量研究,第二节 网络数据的获取与处理,(一)网络链接分析,链接分析,(link analysis),就是对网页之间的链接进行量化研究。,链接分析法,就是运用网络数据库、数学分析软件等工具,利用数学和情报学方法,对网络链接自身属性、链接对象、链接网络等各种对象进行分析,以便揭示其数量特征和内在规律,并用以解决各方面问题的一种研究方法。,链接分析的思想基于两个基本假设:,假设1:从网页A指向网页B的链接是网页A对网页B的推荐或认可。,假设2:如果一个链接将网页A和网页B连接起来,说明网页A和网页B可能有共同的主题。,17,信息计量学,二、网络信息研究方法,第十四章 网络环境下的信息计量研究,第二节 网络数据的获取与处理,(二)数据挖掘法,数据挖掘,是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的以及最终可理解的模式的过程。,在网络信息计量学中,可以使用数据挖掘方法,对一个站点的各种特征进行深度研究,,也可以利用链接挖掘技术代替自然语言对网络资源进行描述,帮助,实现网络信息资源的自动标引,。,18,信息计量学,二、网络信息研究方法,第十四章 网络环境下的信息计量研究,第二节 网络数据的获取与处理,(三)可视化方法,可视化方法,是从图形的角度,运用网络绘图和信息技术来研究网页超级链接的拓扑结构,描述整个网络的结构。,运用图形进行分析的方法,可以使人们更好地理解网络的复杂结构。,19,信息计量学,二、网络信息研究方法,第十四章 网络环境下的信息计量研究,第二节 网络信息计量学的获取与处理,(三)可视化方法,可视化方法,是从图形的角度,运用网络绘图和信息技术来研究网页超级链接的拓扑结构,描述整个网络的结构。,运用图形进行分析的方法,可以使人们更好地理解网络的复杂结构。,20,信息计量学,二、网络信息研究方法,第十四章 网络环境下的信息计量研究,第二节 网络数据的获取与处理,(四)内容分析法,内容分析法,是“,一种对具有明确特性的传播内容进行的客观、系统和定量的描述的研究技术”。,它通过对信息内容“量”的分析,找到能反映信息内容的一定本质性并且易于计数的特征,从而克服定性研究的主观性和不确切性的缺陷,达到对信息“质”的更深刻、更透彻的理解。,(五)统计分析法,聚类分析、相关分析,21,信息计量学,一、网络信息计量学的应用领域,第十四章 网络环境下的信息计量研究,第三节 网络信息计量学的应用,核心网站评选,学术网络分析,世界大学评价,网络引文分析,Web2.0,测度,对搜索引擎进行研究,链接动机,22,信息计量学,大学评价,世界大学评价,2004年起,由西班牙网络计量研究中心主持,指标:,规模size、能见度visibility、学术档案rich files、学术论文scholar,中国大学网络排名,由中国科学评价中心主持,指标:,网页规模、 学术文件数、文档丰富度(包括pdf、ps、doc、ppt、rtf等格式)、被链接数、显示度(由百度搜索到的与大学相关的结果页面数和大学词条浏览数按比例合并计算),结果,:,北京大学清华大学 浙江大学 山东大学 上海交通大学,厦门大学 复旦大学武汉大学 华东师范大学 南京大学,东南大学 西安交通大学 中国人民大学华中科技大学 北京师范大学,南开大学 吉林大学 华中师范大学 武汉理工大学 兰州大学,23,信息计量学,二、网络信息计量研究的局限性,第十四章 网络环境下的信息计量研究,第三节 网络信息计量学的应用,网络计量学缺乏有效的理论依据,网络数据可再现性差,网络计量研究缺乏完善、有效的工具,网络信息计量研究方法还不成熟,24,信息计量学,一、核心网站的评选,网络信息计量的热点问题,核心网站:由某种评价指标体系确定的、满足用户需求的、并符合少量的资源具有较大的产出原则的若干个网站。,评选方法,基于超文本链接的核心网站评价,(,单指标,评价方法,),;,基于,多指标,的综合评价方法:,定性评价,:网站的权威性、准确性、客观性、时效性、主题覆盖度;,定量评价,:网站被访量、网站被链量、网站的权威作者数、网站被文献引用量、重要搜索引擎被索度等。,25,信息计量学,一、核心网站的评选,网络信息计量的热点问题,综合评价法评选核心网站的步骤:,相关网站初始集的采集,(,利用合适的搜索引擎,),;,构建评价体系,(,针对不同的指标,对网站进行分组,),;,确定核心网站选取比例,(,直接确定、布拉德福定律、其它,),;,核心网站的可靠性检验,(,检验评价指标的可靠性、核心网站的质量,),。,26,信息计量学,二、网络影响因子,网络信息计量的热点问题,1.WIF的计算,27,信息计量学,二、网络影响因子,网络信息计量的热点问题,1.WIF的计算,分子的改进:,链接指标:总链接数、外部链接数、内部链接数、来自不同类型链源的链接数,计量单位:网页、网站、目录、域名,分母的改进:,链接指标:网页总数、非网络数据,28,信息计量学,二、网络影响因子,网络信息计量的热点问题,2.WIF的应用对象,基础应用-网络评价,深度扩展-网域评价,广度扩展-机构评价,29,信息计量学,二、网络影响因子,网络信息计量的热点问题,3.WIF的科学价值,网站、机构、国家的评价,探索网络的结构模式,利用,WIF,的研究结果,测定网络爬虫的重点爬行领域,改进搜索引擎的结果排序,有助于改进网站组织结构、网页结构等,30,信息计量学,二、网络影响因子,网络信息计量的热点问题,4.WIF研究的主要障碍,缺乏可靠的数据收集方法,缺乏具有普遍意义的研究成果,缺乏深入的链接机理研究,31,信息计量学,二、网络影响因子,网络信息计量的热点问题,5.WIF研究的重点,链接权重的问题,语言因素的影响,WIF,含义的解读,适用范围的问题,32,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!