Citespace信息可视化软件应用

上传人:guoc****ang 文档编号:242872209 上传时间:2024-09-10 格式:PPT 页数:43 大小:2.63MB
返回 下载 相关 举报
Citespace信息可视化软件应用_第1页
第1页 / 共43页
Citespace信息可视化软件应用_第2页
第2页 / 共43页
Citespace信息可视化软件应用_第3页
第3页 / 共43页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,文献信息分析,(,Citespace,信息可视化软件应用,),研究生信息素养教育,一、科学知识图谱基本方法,1.1,引文分析理论与方法,利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用现象进行分析,揭示其数量特征和内在规律的一种文献计量分析方法。,邱均平,文献计量学,1.2,共被引分析理论与方法,文献共被引分析是计量文献之间关系的一种方法。即,2,篇文献共同被,1,篇文献引用,这,2,篇文献就构成共引关系。共被引频率定义为这,2,篇文献一起被引用频次。,马沙科娃、斯莫尔(苏联、美国科学记录学家),1,、从分析被引文献类型、语种入手,,来研究科学文献体系的特征结构及分布、利用等规律。,2,、从分析被引文献网络及其变化,,来研究学科间关系、联系特征、发展变化现状、发展趋势。,1.3,多元统计分析方法,对若干相关的随机变量观测值的分析,包括:因子分析、多维尺度分析和聚类分析。这些方法将在关系矩阵上运算。如某领域文献群组的共被引矩阵。,埃格赫,信息计量学导论,1.4,词频分析方法,是计量学中传统方法。在文献中,不同词汇的使用与出现频率是有一定规律的。按词频高低进行统计以供分析。,齐普夫,齐普夫第一定律,在任何文章中,词的出现频率都服从一规律:文章中每个词出现词频次统计后按照高频次词在前、低频次词在后的递减顺序排列,并用自然数给这些词标上等级序号,形成,f,r=C,定量形式(,f=,频次,r=,序号,C=,常数)。,1.5,社会网络分析方法,将社会结构界定为一个网络,网络由成员之间的联系进行连接,社会网络分析更多地聚焦于成员之间的联系而非个体特征,并把共同体视为,“,个人的共同体,”,,即视为人们在日常生活中所建立、维护并应用的个人关系的网络。,Wetherell,等,1.6,应用,Paper-citation graph of the FourNetSciResearcher network in HistCite,图情领域信息素养研究核心关键词聚类树状图,多维尺度分析,通过低维(,2,维)空间反映作者(文献)间的联系,利用平面距离来反映作者(文献)间的相似程度。,在科学知识图谱中,聚集高相似性的作者(文献),,,形成科学共同体(学科前沿)。,Kleinbergs burst detection algorithm (Kleinberg, 2002) identifies sudden increases in the usage frequency of words.,国内图情领域信息素养研究核心关键词共现网络知识图谱,CiteSpace,是什么?,Citespace,是一款应用于科学文献中识别并显示科学发展新趋势和新动态的软件。,Chaomei Chen,二、,CiteSpace,简介,1,、通过引文网络分析,找出学科领域演化的关键路径,2,、找出学科领域演化的关键点文献(知识拐点),3,、分析学科前沿热点,4,、探测学科知识基础,研究前沿,(,Research Fronts,):,在,CiteSpace,中,采用一种,“突发词检测”,算法来确定研究前沿中的概念,基本原理就是统计相关领域论文的标题和摘要中词汇频率,根据这些词汇的增长率来确定哪些是研究前沿的热点词汇。,根据这些术语在同一篇文章中共同出现的情况进行聚类分析后,可以得到“研究前沿术语的共现网络”。因此,研究前沿系指临时形成的某个研究课题及其基础研究问题的概念组合,也是正在兴起或突然涌现的理论趋势和新主题,代表一个研究领域的思想现状。,13,研究前沿的知识基础,(,Intellective Base,):,含有研究前沿的术语词汇的文章的引文,实际上它们反映的是研究前沿中的概念在科学文献中的吸收利用知识的情况。,对这些引文也可以通过它们同时被其他论文引用的情况进行聚类分析,这就是同被引聚类分析(,co-citation cluster analysis,),最后形成了一组被研究前沿所引用的科学出版物的演进网络,即“知识基础文章的同被引网络”。,CiteSpace,就是利用三个网络(“研究前沿术语的共现”,“知识基础文章的同被引”和“研究前沿术语引用知识基础文章”)随着时间演变的情况来寻找研究热点及趋势,并以可视化的方式展示出来。,15,一、,快速掌握,CiteSpace,1.1,相关术语了解,1.2,如何获取,CiteSpace,及安装,1.3,数据准备,1.4,开始使用,1.5,产生的网络类型,1.6,微调配置,1.7,交互操作,Cite Space信息可视化软件应用,前提及准备,操作及优化,三、,CiteSpace,应用,Glossary,术语,Nodes,节点,-,在绘图软件中,节点即曲线中的控制点、交叉点,网络连接的端点。,Centrality,节点中心度,-,是指其所在网络中通过该点的任意最短路径的条数,是网络中节点在整体网络中所起连接作用大小的度量。中心度大的节点 相对地容易成为网络中的,关键节点,。,17,Betweenness centrality,中间中心性,-,用来进行中心性测度的指标,指网络中经过某点并连接这两点的最短路径占这两点之间最短路径线总数之比。中间中心性高的点往往位于连接两个不同聚类的路径上。,Burst terms,突现词,-,通过考察词频,将某段时间内其中频次变化率高的词从大量的主题词中探测出来。,18,Citation tree-rings,引文年环,-,代表着某篇文章的引文历史。引文年轮的颜色代表相应的引文时间。一个年轮厚度和与相应时间分区内引文数量成正比。,Citation half-life,引文半衰期。,衡量期刊老化速度快慢的一种指标,指某一期刊论文在某年被引用的全部次数中,较新的一半被引论文发表的时间跨度。,Citation,引用。,Co-citation,共引。,Cluster view,聚类视图。,Co-authors,合作者。,19,20,MeSH terms,医学主题词,美国国家医学图书馆编制的权威性主题词表。,Pathfinder network scaling,路径网络简化,-,一种网络简化算法。,Minimal spanning trees,最小生成树,-,一种网络简化算法。,Pivotal points,(,Turning points,)关键点(转折点),-,网络中中间中心性大于或等于,0.1,的节点,CiteSpace,图谱中用紫色的节点表示网络中的关键节点。,21,Thresholds,阈值,-,用户在引文数量、共被引频次和共被引系数三个层次上,按前中后三个时区分别设定阈值,其余的由线性内插值来决定。,Time-zone view,时区视图。,Time slicing,时间分割,-,设定整个时间跨度和单个时间分区长度。,22,1.2,如何获取,CiteSpace,及安装,The CiteSpace,网站,http:/cluster.cis.drexel.edu/cchen/citespace,23,1.3,数据准备,可用数据主要来源于,Web of Science,。,CiteSpace,也可以直接处理从,Pubmed,下载的文献记录。另外也支持,CNKI,、,NSF,、,Derwent,、,Scopus,数据格式,部分需转换。,Scopus,是全世界最大的摘要和引文数据库,涵盖了,15000,种科学、技术及医学方面的期刊。,Scopus,不仅为用户提供了其收录文章的引文信息,还直接从简单明了的界面整合了网络和专利检索。直接链接到全文、图书馆资源及其它应用程序如参考文献管理软件,.,24,Search in Web of Science,Make a general search in Web of Science,Mark all search results,Save the records, including Cited References, in field tagged format.,(注!一定要包含引用文献),Name your files as,download*.txt,(格式要求),E.g. downloadScience1999a.txt, download2004.txt,Save all data files in a folder on your computer.,25,26,27,download*.txt,CiteSpace,中使用的文献信息字段,28,A: Authors,B: Title, Descriptors, Abstract,C: Cited References,D: Times Cited,E: Year of Publication,详见后面图释!,29,AU,Galea, S,Ahern, J,Resnick, H,Kilpatrick, D,Bucuvalas, M,Gold, J,Vlahov, D,TI Psychological sequelae of the,September 11,terrorist attacks,in New York City.,SO NEW ENGLAND JOURNAL OF MEDICINE,LA English,DT Article,ID,POSTTRAUMATIC-STRESS-DISORDER,; NATIONAL COMORBIDITY SURVEY;,MAJOR DEPRESSION; NATURAL DISASTER; SOCIAL SUPPORT;,OKLAHOMA-,CITY,; PREVALENCE; PSYCHOPATHOLOGY; SURVIVORS; SYMPTOMS,AB Background: The scope of the,terrorist attacks,of September,11, 2001, was unprecedented in the United States. We assessed the prevalence and correlates of acute,post-traumatic stress disorder,(PTSD) and depression among residents of Manhattan five to eight weeks after the attacks. Methods: We used random-digit dialing to contact a representative sample of adults living south of 110th Street in Manhattan. Participants were asked about demographic characteristics, exposure to the events of September 11, and psychological symptoms after the attacks.,co-authorship,A,B,B,B,co-occurring burst terms,30,CR 2001, NY TIMES 1226, B2,*AM PSYCH ASS, 1994, DIAGN STAT MAN MENT,*DEP HLTH HUMAN SE, 1999, MENT HLTH REP SURG G,*US BUR CENS, 2000, STF3A DEP COMM BUR C,BLAZER DG, 1994, AM J PSYCHIAT, V151, P979,EATON L, 2001, NY TIMES 1116, A1,FOTHERGILL A, 1999, DISASTERS, V23, P156,FULLERTON CS, 1999, AVIAT SPACE ENVIR MD, V70, P902,GINEXI EM, 2000, AM J COMMUN PSYCHOL, V28, P495,GOENJIAN AK, 2001, AM J PSYCHIAT, V158, P788,GREEN BL, 1990, J APPL SOC PSYCHOL, V20, P1033,HANSON RF, 1995, J CONSULT CLIN PSYCH, V63, P987,HARVEY AG, 1999, J CONSULT CLIN PSYCH, V67, P985,KAWACHI I, 2001, J URBAN HEALTH, V78, P458,KESSLER RC, 1995, ARCH GEN PSYCHIAT, V52, P1048,KILPATRICK DG, 1987, CRIME DELINQUENCY, V33, P479,MADAKASIRA S, 1987, J NERV MENT DIS, V175, P286,MAZURE CM, 2000, AM J PSYCHIAT, V157, P896,NORTH CS, 1999, JAMA-J AM MED ASSOC, V282, P755,ORTEGA AN, 2000, AM J PSYCHIAT, V157, P615,POLE N, 2001, J NERV MENT DIS, V189, P442,RESNICK H, 1999,J ANXIETY DISORD, V13, P359,RESNICK HS, 1993, J CONSULT CLIN PSYCH, V61, P984,ROTHBAUM BO, 1992,J TRAUMA STRESS, V5, P455,RUBONIS AV, 1991, PSYCHOL BULL, V109, P384,document co-citation,author co-citation,journal co-citation,C,31,NR 32,TC,179,PU MASSACHUSETTS MEDICAL SOC/NEJM,PI WALTHAM,PA WALTHAM WOODS CENTER, 860 WINTER ST, WALTHAM, MA 02451-1413 USA,SN 0028-4793,J9 N ENGL J MED,JI N. Engl. J. Med.,PD MAR 28,PY,2002,VL 346,IS 13,BP 982,EP 987,PG 6,SC Medicine, General & Internal,GA 534UY,UT ISI:000174608600006,ER,E,D,1.4,使用,CiteSpace,Project home,:选填一个空文件夹,Data directory,:选填数据夹,1.4,使用,CiteSpace,34,年段内引文数,阈值调谐数,年段内聚类点,年段内连线数,选择聚类词来源,选择聚类词型,选择聚类点类型,阈值调谐,调整聚类节点与研究等关系连线,剪切连线,1,、寻径,2,、最小生成树,3,、修剪切片网,4,、修剪合并网,选择可视图显示形式,选择导入数据年代,选择数据切分年代,1.5,选择可视化网络,35,Author Co-Citation Analysis (ACA),共被引作者分析,Document Co-Citation Analysis (DCA),共被引文献分析,Journal Co-Citation Analysis (JCA),共被引来源刊分析,Co-Authors,合著者,Co-Terms,共现词,1.6,微调设置,36,nodes,项由,3,位阈值控制产生,其余的由线性内插值来决定,1.7,交互操作,年代色标,图谱大小调谐,图谱背景色,寻找聚类,寻找最佳聚类,用标题词标记聚类,用主题词标记聚类,用摘要词标记聚类,类,保存图谱,/,图像,按词频显示聚类高引频文献,二,.,使用,Citespace,的一般步骤,确定一个研究领域 ,收集尽可能多的该领域的词汇。保证接下来的分析能覆盖该领域所有主要的组成部分。,数据收集及加载。从数据库上检索符合要求的数据,下载到本地,创建,New Project,。,根据词汇在文章标题 、文摘 、表述中出现的频率的增长率来确定哪些是前沿热点词汇。并提取研究前沿术语。,38,时间切片。用户确定总的时间段的范围和分割后每一个时间片的长度 。,阈值选择(选择合适的引文数量、共被引频次和共被引系数)。,选择算法精简和合并网络。,展示。生成标准的聚类视图和时间序列视图。,39,可视化检测。,Citespace,让用户可以通过几种方法与这个可视化系统进行交互。用户可以根据运算法则通过控制各种参数来控制可视化属性和标签的展示 。,确认关键点。确定的关键点的意义可以通过询问该领域的专家来确认。这些专家可以是处于关键点的文章的作者, 或者是文章中引用过关键点处的文章的作者 。,40,三,.,实例操作,(1),41,实例操作,(2),我们特别建议你亲自动手、同你的朋友、同事一起来亲手绘制一张你自己领域的科学知识图谱。你或许会格外喜欢图谱生成的过程、你也许对解读生成的图谱所含意蕴更充满乐趣。你将高兴地看到这些图谱会如何改变你看世界的方式。,陈超美,Chaomei Chen,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!