资源描述
*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第九章 信息处理与分析,第一节 文献检索策略与案例分析,1,一、文献检索策略概述,二、文献检索效果评价,三、文献检索策略构建案例分析,2,一、文献检索策略概述,(一)检索策略的定义,(二)常用的检索策略类型,3,(一)检索策略的定义,广义的检索策略,指为实现检索目标而制定的全盘计划和方案,是对整个检索过程的科学规划和指导。,具体而言就是在明确检索目的、分析课题特征的基础上,选择合适的数据库和检索系统,拟定检索方案,确定检索词,构建检索提问式,执行检索并调整检索式,直至获得较满意的检索结果的全过程。,4,检索策略的制定流程,满意,用户,检索课题,检索目的分析,1.侧重检全,2.侧重检准,3.检全检准平衡,课题内容特征分析,1.所属学科,2.主要概念面,3.各概念面的分支概念,课题形式特征分析,1.检索年限,2.文献类型,3.文献语种等,选择数据库,及检索系统,跨库检索系统,核心检索系统,全文数据库,侧重查全,适用各种情况,侧重查准,拟定检索词,编制检索式,浏览并优化检索结果,获取全文,输出检索结果,不满意,5,(一)检索策略的定义,狭义的检索策略,特指检索过程中构建检索式的环节,包含检索词的确定,运算符的选择,检索字段的设定及限制选项的设置等,6,(二)常用的检索策略类型,积木型(Building Block),把检索课题剖析成若干个不同的概念面,逐个查找各个概念面,在每个概念面检索时尽可能全地列举同义词、近义词和相关词,用“OR”连接,构成针对每个概念面的检索式,即多个子检索式,最后根据课题要求,选用合适的布尔算符把所有子检索式连接起来,构成一个总的检索式,这种策略类似把各个积木块拼成完整图案,因此称为积木型检索策略,7,(二)常用的检索策略类型,引文珠形增长(Citation Pearl-Growing),首先检索课题中较为核心的、最专指的概念面,以便至少检出一篇命中文献或相关信息,浏览检出文献,从中选出新的相关检索词,补充到检索式中,重新检索出更多的命中文献,然后再重复进行浏览选词再检索的过程,直到获得理想的最终检索结果为止,这种策略最具交互性,检索词更具针对性,检索式在变化中完善,不足是检索费时较多,8,(二)常用的检索策略类型,逐次分馏(Successive Fractions),先用较宽泛的检索式,确定一个范围较广的命中文献初始集,然后逐步利用各种检索限制或限定措施,逐渐提高校索式的专指度,缩小命中文献集,直到得到数量适宜、用户满意的命中文献集为止,这种策略有利于平衡检索的全面性和准确性,如能较好地掌握检索限制和限定的尺度,可取得相当好的检索效果,9,(二)常用的检索策略类型,最专指面优先(Most Specific Facet First),首先从课题中最专指的一个概念面入手检索,得到初步检索结果后再决定是否要加入其他概念面,这些其他概念面只有在要提高查准率时才需输入,各概念面在检索式中是逻辑“与”的关系,如果觉得命中文献太少,通常不需要再把其他概念面加到检索式中去,这种策略比较灵活,检索用时也相对较少,10,(二)常用的检索策略类型,最低登录量面优先,(Lowest Posting Facet First),登录量是指一个索引词在标引中的使用次数,用户在索引词表界面查询课题中每个概念面对应的检索词的登录量,用登录量最少的概念面为入口开始检索,如命中文献相当少,则完成检索。如结果较多,再选择登录量较低的概念加入到检索式中,逻辑关系为“与”,这种策略与最专指面优先策略极为相似,不同的是在计算机检索中,很容易明确哪个概念组面的登录最小,11,二、文献检索效果评价,(一)查全率,(二)查准率,(三)查全率与查准率的关系,(四)影响查全率和查准率的因素,12,数据库检索结果距阵,用户,数据库,相关文献,非相关文献,总计,检出文献数,a(命中),b(噪音),a+b,未检出文献数,c(漏检),d(合理拒绝),c+d,合计,a+c,b+d,a+b+c+d,13,(一)查全率,查全率(Recall Ratio,简称R),是检索系统中检出的相关文献数量(a)与检索系统中相关文献总量(a+c)的比率,即:,14,(二)查准率,查准率(Precision Ratio,简称P),是检索系统检出的相关文献数量(a)与检出的文献总量(a+b)的比率,即:,15,(三)查全率与查准率的关系,查全率与查准率之间为互逆的关系,通常采取措施提高查全率时会降低查准率,反之,采取措施提高查准率时则会降低查全率,在检索中很难实现查准率和查全率均逼近100%,在检索中要根据课题的实际需求,确定以查准为主还是以查全为主,或是寻求查准与查全之间的平衡。,16,(四)影响查全率和查准率的因素,提高检全度的方法,将检索词限定到文摘、全部字段等,使用截词符。如:transplant*,使用同义词。如:(lung cancer or lung carcinoma),查全同义单词的不同拼写方式,如:fibre or fiber,查全缩写与全称,如:“ang 1 7”OR“angiotensin 1 7”,变词组检索为邻近检索,如:“acute pancreatitis”改为 acute adj2 pancreatitis,17,(四)影响查全率和查准率的因素,提高检准度的方法,将检索词限定到标题、关键词字段,设定在数据库的某个或若干个子集中检索,例:core clinical journals子集(Medline),Clinical Medicine大类(Elsevier),变and检索为邻近算符:near,adj,例:acute and pancreatitis 改为:,acute adj2 pancreatitis(OVID),使用词组精确匹配运算符“”,例:“renal failure”,18,(四)影响查全率和查准率的因素,寻求查准和查全平衡的方法,使用规范主题词表选词检索,没有对应规范主题词的概念,首先使用上级概念对应的规范词检索,再结合自由词检索,例:肾盂肿瘤放射学诊断,主题词:kidney neoplasms,副主题词:放射学诊断对应的副主题词,结合自由词:kidney pelvis,没有词表的数据库:调整检索字段和运算符,19,三、文献检索策略构建案例分析,【案例1】有读者要撰写“国内外舌根肿瘤手术治疗新进展”的综述,需查阅相关文献。,【案例2】有读者要申报关于“血管紧张素1-7对心肌作用”的科研项目,需了解国外是否有相关研究,对课题的新颖度作出评价。,【案例3】有读者在配制中成药过程中,要使用龙涎香,他想了解国内外有关“龙涎香在配制中成药中应用研究”的文献。,【案例4】有读者在撰写“双酚A对生殖系统毒性研究”的论文,要查找国内外相关论文作为参考。,20,【案例1】有读者要撰写“国内外舌根肿瘤手术治疗新进展”的综述,需查阅相关文献。,检索目的:,撰写综述,作文献普查,侧重查全。,课题内容特征:,所属学科:口腔疾病中的舌肿瘤。,包含概念面:“舌根肿瘤”、“手术治疗”,,均无分支概念。,21,【案例1】有读者要撰写“国内外舌根肿瘤手术治疗新进展”的综述,需查阅相关文献。,课题形式特征,检索年限最近五年。,文献类型:期刊、会议文献。,文献语种:中外文各种语种。,选择数据库及检索系统,CBM,万方中国学术会议论文全文数据库,OVID-MEDLINE,ISI-ISTP,22,【案例1】有读者要撰写“国内外舌根肿瘤手术治疗新进展”的综述,需查阅相关文献。,拟定检索词和检索式,CBM:舌肿瘤/外科学 and 舌根,万方会议论文:积木型策略,全部字段=(舌根肿瘤 或 舌根部肿瘤 或 舌根癌)and 全部字段=(手术 或 外科),OVID-MEDLINE:,tongue neoplasms/surgery and tongue adj3 base,ISI-ISTP:,积木型策略,Topic=(tongue same base same cancer)or(tongue same base same carcinoma)and(surgery or operation*),23,【案例2】申报“血管紧张素1-7对心肌作用”的科研项目,了解国外研究情况,判断新颖性。,检索目的:新颖性评价,侧重查全,课题内容特征:,所属学科:神经肽类物质对人体脏器的作用,包含概念面:“血管紧张素1-7”、“心血管系统”,分支概念:“心肌”有分支概念“心肌细胞”、“乳头肌”、“心成肌细胞”,24,【案例2】申报“血管紧张素1-7对心肌作用”的科研项目,了解国外研究情况,判断新颖性。,课题形式特征,检索年限:全部年份,文献类型:期刊、会议文献,文献语种:外文各种语种,选择数据库及检索系统,OVID-MEDLINE,ISI-ISTP,25,【案例2】申报“血管紧张素1-7对心肌作用”的科研项目,了解国外研究情况,判断新颖性。,拟定检索词和检索式,OVID-MEDLINE:引文珠增长型,1950-present:,exp myocardium/and(“angiotensin-(1-7)”or“angiotensin1-7”or“ang-(1-7)”or“ang1-7”),In-Process&Other Non-Indexed Citations:,最专指面优先,“angiotensin-(1-7)”or“angiotensin1-7”or“ang-(1-7)”or“ang1-7”,26,【案例2】申报“血管紧张素1-7对心肌作用”的科研项目,了解国外研究情况,判断新颖性,拟定检索词和检索式,ISI-ISTP:,积木型,Topic=(angiotensin-(1-7)or angiotensin1-7 or ang-(1-7)or ang1-7)and(myocardi*or cardiac myocyte*or cardiomyocyte*or papillary muscle*or cardiac myoblast*or cardiomyoblast*),27,检索目的:解决实际问题,侧重查准,课题内容特征,所属学科:中草药研究,包含概念面:“龙涎香”、“中成药”,分支概念:“龙涎香”没有分支概念,“中成药”分支概念众多,【案例3】在配制中成药过程中,要使用龙涎香,需了解国内外有关“龙涎香在配制中成药中应用研究”的文献。,28,【案例3】在配制中成药过程中,要使用龙涎香,需了解国内外有关“龙涎香在配制中成药中应用研究”的文献。,课题形式特征,检索年限:全部年份,文献类型:期刊文献,文献语种:中外文各种语种,选择数据库及检索系统,EMBASE,CBM,29,拟定检索词和检索式,EMBASE:,(ambergris and synthesis).ti,CBM:最低登录量优先,索引检索:龙涎香,【案例3】在配制中成药过程中,要使用龙涎香,需了解国内外有关“龙涎香在配制中成药中应用研究”的文献。,30,检索目的:查准与查全的平衡,注重获取全文,课题内容特征,所属学科:酚类对人体脏器毒性,包含概念面:“双酚A”、“生殖系统”、“毒性”,分支概念:“生殖系统”分支概念众多,“双酚A”别名:“二酚基丙烷”、“2,2-双对羟苯基丙烷”、“2,2-Bis-4-hydroxyphenylpropane”、“BPA”、“4,4-Dihydroxy-2,2-diphenylpropane”、“4,4-Isopropylidenediphenol”,【案例4】撰写“双酚A对生殖系统毒性研究”的论文,要查找国内外相关论文作为参考。,31,【案例4】撰写“双酚A对生殖系统毒性研究”的论文,要查找国内外相关论文作为参考。,课题形式特征,检索年限:最近5年,文献类型:期刊文献,文献语种:中外文各种语种,选择数据库及检索系统,OVID-MEDLINE,中国期刊全文数据库,32,33,匹配主题词,34,phenols 酚类,上位词
展开阅读全文