文献检索原理及中文医学文献数据库检索资料全面版课件

上传人:文**** 文档编号:241448315 上传时间:2024-06-26 格式:PPT 页数:48 大小:1.11MB
返回 下载 相关 举报
文献检索原理及中文医学文献数据库检索资料全面版课件_第1页
第1页 / 共48页
文献检索原理及中文医学文献数据库检索资料全面版课件_第2页
第2页 / 共48页
文献检索原理及中文医学文献数据库检索资料全面版课件_第3页
第3页 / 共48页
点击查看更多>>
资源描述
文献检索原理及中文文献检索原理及中文医学文献数据库检索医学文献数据库检索 文献检索原理及中文医学文献数据库检索 1主要内容主要内容一、文献概述(一)、文献信息数据库的类型(二)、文献数据库检索途径(三)、文本信息检索技术(四)、文本信息检索策略构建主要内容一、文献概述2主要内容主要内容二、文献检索原理(一)、文献检索语言及其种类(文献外表特征检索语言、文献内容特征检索语言)(二)、分类法(中图法)、主题词法(医学主题词表)(三)、医学主题词表是用于“标引”和“检索”的共同语言。主要内容二、文献检索原理3主要内容主要内容三、中文文献数据库检索(一)、中文文全文库(中国医院知识仓库、万方数据资源系统、超星数字图书馆)(二)、中文文摘库(中国生物医学文献数据库CBMdisc、中文生物医学期刊文献数据库CMCC)(三)、中文引文库(中文生物医学期刊文献数据库CMCI)主要内容三、中文文献数据库检索41、文献概述、文献概述、文献信息数据库的类型书目数据库事实数据库数值数据库全文数据库多媒体数据库知识库1、文献概述、文献信息数据库的类型51、文献概述、文献概述、文献数据库检索途径、文献数据库检索途径自由词检索自由词检索主题词检索主题词检索分类检索分类检索著者检索著者检索引文检索引文检索机构检索机构检索刊名检索刊名检索默认检索(又称缺省检索,默认检索(又称缺省检索,CBMdiscCBMdisc的的“缺省缺省”检索是默认检索是默认在中文标题、文摘、主题词、关键词、特征词、刊名这在中文标题、文摘、主题词、关键词、特征词、刊名这6 6个字段中检索)个字段中检索)其他检索途径(专利号检索、国际标准连续出版物编号检索、其他检索途径(专利号检索、国际标准连续出版物编号检索、化学物质登记号检索、分子式检索、特征词检索、记录顺化学物质登记号检索、分子式检索、特征词检索、记录顺序号检索等)序号检索等)1、文献概述、文献数据库检索途径61、文献概述、文献概述、文本信息检索技术、文本信息检索技术布尔检索布尔检索 运算符是:运算符是:ANDAND、OROR、NOTNOT,分别表示,分别表示逻辑与、逻辑或、逻辑非三种逻辑运算关系。执行顺逻辑与、逻辑或、逻辑非三种逻辑运算关系。执行顺序为序为notnot优先运算,优先运算,andand其次,其次,oror最后,可用括号改变最后,可用括号改变运算顺序。运算顺序。例:例:例:例:压压力力力力对对急症急症急症急症护护理的影响理的影响理的影响理的影响 压力压力 AND 急症护理急症护理 急症护理急症护理 NOT 压力压力压力压力 OR 急症护理急症护理1、文献概述、文本信息检索技术 压力 AND 急症护理 急症71、文献概述、文献概述、文本信息检索技术、文本信息检索技术截词检索截词检索a.a.就是把检索词截断,取其中的一部分片断。再加上截词符就是把检索词截断,取其中的一部分片断。再加上截词符号一起输入检索,系统按照词的片段与数据库里的索引词号一起输入检索,系统按照词的片段与数据库里的索引词对比匹配,凡是包含这些词的片断的文献均被检索出来。对比匹配,凡是包含这些词的片断的文献均被检索出来。b.b.截词主要用于检索词的单副数、词性的词尾变化、词根相截词主要用于检索词的单副数、词性的词尾变化、词根相同的一类词,以及同一词的拼法变异等。同的一类词,以及同一词的拼法变异等。c.c.功能是减少检索词的输入量,简化检索步骤,扩大检索范功能是减少检索词的输入量,简化检索步骤,扩大检索范围,提高查全率。围,提高查全率。d.d.截词方式有右(后)截词、左(前)截词、中间截词,后截词方式有右(后)截词、左(前)截词、中间截词,后截词和中间截词使用较多。截词和中间截词使用较多。e.e.常用截词符号(又称通配符),有星号常用截词符号(又称通配符),有星号“*”“*”、问号、问号“?”两种。两种。“*”“*”常用于无限截词(常用于无限截词(*=0*=0n n个字母),个字母),“?”常用于有常用于有限截词(?限截词(?=0=01 1个字母),例如输入个字母),例如输入epidemi*epidemi*,可同时,可同时检出检出epidemicepidemic,epidemical epidemical,epidemiologyepidemiology等;输入等;输入cat?cat?,可检出,可检出catcat和和catscats;输入;输入wom?nwom?n,可以检出,可以检出womanwoman和和womenwomen,等等。但不同的检索系统采用的截词符号及用法,等等。但不同的检索系统采用的截词符号及用法可能有所不同。可能有所不同。1、文献概述、文本信息检索技术81、文献概述、文献概述、文本信息检索策略构建、文本信息检索策略构建1、文献概述、文本信息检索策略构建92、文献检索原理、文献检索原理、文献检索语言及其种类、文献检索语言从表现形式上看,文献检索语言就是文献信息检索系统中的标识系统,能提供多种多样的检索点,如著者名、分类号、主题词、关键词等。2、文献检索原理、文献检索语言及其种类10、文献检索语言的种类1)、文献外表特征检索语言这是依据文献外表特征,如文献题名、著者等作为标识和检索而设计的检索语言,其主要应用有:a.文献题名索引系统,如书名目录b.著者索引系统:如著者索引、专利权人索引c.文献序号索引系统,如专利号索引d.引文索引系统:这是利用科学文献末尾所附应用文献、参考文献目录,揭示科学论文之间印证和被印证关系而编制的索引系统,如 SCI2)、文献内容特征检索语言 描述文献内容特征的检索语言主要有A.分类检索语言B.主题描述语言。2、文献检索原理、文献检索原理、文献检索语言的种类2、文献检索原理112、文献检索原理、文献检索原理、分类检索语言、分类检索语言分类检索语言是将各种知识领域(学科及其研究问题)的分类检索语言是将各种知识领域(学科及其研究问题)的类目按知识分类原理进行系统排列,以代表类目的分类类目按知识分类原理进行系统排列,以代表类目的分类号(如字母符号、数字等)作为文献标识的一类检索语号(如字母符号、数字等)作为文献标识的一类检索语言。言。在分类检索语言中,应用比较普遍的是传统的等级体系图在分类检索语言中,应用比较普遍的是传统的等级体系图书分类法。书分类法。国内外有多种广泛使用的著名等级体系,如我国的中国国内外有多种广泛使用的著名等级体系,如我国的中国图书馆分类法、图书馆分类法、国会图书馆分类法(国会图书馆分类法(Library of Library of Congress Classification,LCCCongress Classification,LCC)、杜威十进位分类法)、杜威十进位分类法(Dewey Decimal Classification and Relative Index,Dewey Decimal Classification and Relative Index,DDCDDC)、)、国立医学图书管分类法(国立医学图书管分类法(NLMCNLMC)等。)等。2、文献检索原理、分类检索语言122、文献检索原理、文献检索原理、主题描述语言主题描述语言是用于表达文献主题内容的词语标识系统,应用较多的是主题法和关键词法。2、文献检索原理、主题描述语言132、文献检索原理、文献检索原理、主题描述语言、主题描述语言2.1.4.1.2.1.4.1.主题词法主题词法主题词,又称叙词主题词,又称叙词主要特点主要特点A A、采用指定的词语、采用指定的词语“主题词主题词”,来专指或网罗相应的概念。,来专指或网罗相应的概念。B B、采用参照系统将某些非主题词指向主题词或者显示相关主题词间、采用参照系统将某些非主题词指向主题词或者显示相关主题词间的词义相关关系。的词义相关关系。C C、采用类似分类的方法编制主题分类索引(范畴表)和等级索引、采用类似分类的方法编制主题分类索引(范畴表)和等级索引(树状结构),采用类似关键词法编制主题词轮排索引,以从多(树状结构),采用类似关键词法编制主题词轮排索引,以从多方面显示词间关系并便于查找主题词。方面显示词间关系并便于查找主题词。D D、以上内容和规则构成一部主题词表,其中的主题词随着科学发展、以上内容和规则构成一部主题词表,其中的主题词随着科学发展及文献中用词变化不断有增删修订定期更新。及文献中用词变化不断有增删修订定期更新。在医学中,最具代表性的主题词法是在医学中,最具代表性的主题词法是 国立医学图书馆(国立医学图书馆(NLMNLM)的)的医学主题词表(医学主题词表(Medical Subject Headings,MeSHMedical Subject Headings,MeSH),也是医),也是医学文检索领域应用最多的主题描述语言。学文检索领域应用最多的主题描述语言。2、文献检索原理、主题描述语言14轮排索引轮排索引轮排索引15树状结构树状结构树状结构162、文献检索原理、文献检索原理、主题描述语言、主题描述语言、关键词法、关键词法是指出现在文献或网页的标题(篇名,章节名)或是指出现在文献或网页的标题(篇名,章节名)或文摘、全文中,能表达文献实质内容的,并且能文摘、全文中,能表达文献实质内容的,并且能被人们作为检索入口的关键性名词术语。被人们作为检索入口的关键性名词术语。最大优点:科学发展新出现的专业名词能及时进入最大优点:科学发展新出现的专业名词能及时进入索引系统。索引系统。缺点:缺点:a.a.用词不规范,造成漏检。用词不规范,造成漏检。b.b.标引过多造成误检增加标引过多造成误检增加c.c.不对文献的实质内容进行分析,检索准确性较差不对文献的实质内容进行分析,检索准确性较差2、文献检索原理、主题描述语言172、文献检索原理、文献检索原理2.2 分类法(中图法),主题词法(医学主题词表),具体内容2、文献检索原理2.2 182、文献检索原理、文献检索原理2.2.1 2.2.1 中图法中图法19811981年国家标准总局转发了年国家标准总局转发了“关于中图法作为关于中图法作为国家实行标准草案的建议国家实行标准草案的建议”,中图法从而成,中图法从而成为我国各类型图书馆应用最广泛的分类法,我国为我国各类型图书馆应用最广泛的分类法,我国绝大多数大学图书馆、学术图书馆、公共图书馆绝大多数大学图书馆、学术图书馆、公共图书馆都使用中图法进行馆藏文献的分类排架和编都使用中图法进行馆藏文献的分类排架和编制分类目录。同时,中图法在我国的图书发制分类目录。同时,中图法在我国的图书发行、数据库的科学论文标引、以及网络网络信息行、数据库的科学论文标引、以及网络网络信息资源组织与检索等多领域也有广泛应用。目前资源组织与检索等多领域也有广泛应用。目前中图法的最新版是中图法的最新版是19991999年出版的第四版。年出版的第四版。2、文献检索原理2.2.1 中图法192、文献检索原理、文献检索原理A 马列主义 毛泽东思想N 自然科学总论B 哲学、宗教O 数理科学和化学C 社会科学总论P 天文学、地理科学D 政治、法律Q 生物科学E 军事R 医药、卫生F 经济S 农业科学G 文化、科学、教育、体育T 工业技术H 语言、文字U 交通运输I 文学V 航空、航天J 艺术X 环境科学、安全科学K 历史、地理Z 综合性图书基本大类基本大类基本大类基本大类 共分为共分为共分为共分为2222个个个个2、文献检索原理A 马列主义 毛泽东思想N 自然科学总论B 202、文献检索原理、文献检索原理 2.2.1.2 医药、卫生大类的二级类目R类分二级类目17个R 医药、卫生 R1 预防医学、卫生学 R2 中国医学 R3 基础医学 R4 临床医学 R5 内科学 R6 外科学 R71 妇产科学 R72 儿科学 R73 肿瘤学 R74 神经病学与精神病学R 75 皮肤病学与性病学 R76 耳鼻咽喉科学 R77 眼科学R 78 口腔科学 R79 外国民族医学 R8 特种医学 R9 药学 2、文献检索原理 2.2.1.2 医药、卫生大类的二级类目212、文献检索原理、文献检索原理2.2.1.3.2.2.1.3.层累标记制层累标记制类目按概念之间的逻辑隶属关系,再往下逐级展开,划分出类目按概念之间的逻辑隶属关系,再往下逐级展开,划分出更专指、更具体的类目。如更专指、更具体的类目。如“静脉静脉”,它的上级类目从上,它的上级类目从上至下依次是:至下依次是:R R医药卫生医药卫生R3R3基础医学基础医学R32R32人体形态学人体形态学R322R322人体解剖学人体解剖学心脏血管系心脏血管系血管血管动脉动脉静脉静脉2、文献检索原理2.2.1.3.层累标记制222、文献检索原理、文献检索原理2.2.1.3.2.2.1.3.层累标记制层累标记制中图法的分类号采用字母与阿拉伯数字相结合中图法的分类号采用字母与阿拉伯数字相结合的混合制号码,用一个字母标志一个大类,以字的混合制号码,用一个字母标志一个大类,以字母的顺序反应大类的序列,在字母后用数字表示母的顺序反应大类的序列,在字母后用数字表示大类下的类目的划分。大类下的类目的划分。数字的位置,基本上遵从层累制的原则,即尽可能数字的位置,基本上遵从层累制的原则,即尽可能使号码的位数代表类目的等级数。使号码的位数代表类目的等级数。当一分类号的数字超过三位时,为了醒目而加上小当一分类号的数字超过三位时,为了醒目而加上小圆点圆点“.”“.”,并无其它意义。,并无其它意义。2、文献检索原理2.2.1.3.层累标记制232、文献检索原理、文献检索原理2.2.1.4、复分号复分是增强类目的细分化程度,提高类目专指度的分类措施,是图书分类法的重要组成部分。中图法的复分表主要有通用复分表和专类复分表两种,这些复分表的号码不能单独使用,只能加在主分类号后面作为共性区分的标识。中图法通用复分表有8个,如总论、地理、时代、民族复分表。2、文献检索原理2.2.1.4、复分号242、文献检索原理、文献检索原理2.2.1.4 2.2.1.4、复分号、复分号其中总论复分表中的描述图书的外部特征如教材、其中总论复分表中的描述图书的外部特征如教材、工具书等的复分号及其含义举例如下:工具书等的复分号及其含义举例如下:-43 -43 教材教材 -61 -61 名词术语、词典、百科全书(类书)名词术语、词典、百科全书(类书)-44-44 习题、试题及题解习题、试题及题解 -62 -62 手册、名录、指南、一览表、年表手册、名录、指南、一览表、年表 -53-53论文集论文集 -64 -64表解、图解、图册、谱录、数据、公式、地图表解、图解、图册、谱录、数据、公式、地图-532-532会议录会议录 -65 -65 条例、规程、标准条例、规程、标准-6-6 参考工具书参考工具书 -66 -66统计资料统计资料图书分类号举例:图书分类号举例:R28 R28 中药学中药学R28-61 R28-61 中药学辞典中药学辞典R28-64 R28-64 中药学图谱中药学图谱2、文献检索原理2.2.1.4、复分号252、文献检索原理、文献检索原理2.2.1.4 2.2.1.4、复分号、复分号专类复分表专供某些类目的进一步细分之用。例如,专供专类复分表专供某些类目的进一步细分之用。例如,专供R5-R8R5-R8(临床(临床医学各类)的复分表如下:医学各类)的复分表如下:01 01 预防、控制和卫生预防、控制和卫生02 02 病理学、病因学病理学、病因学03 03 微生物学、免疫学微生物学、免疫学04 04 诊断学诊断学05 05 治疗学治疗学059.7 059.7 急症、急救处理急症、急救处理06 06 并发症并发症07 07 预后预后08 08 诊断器械、用具诊断器械、用具09 09 康复康复例如:甲状腺疾病的分类号是例如:甲状腺疾病的分类号是R581R581,甲状腺疾病诊断的分类号是。,甲状腺疾病诊断的分类号是。2、文献检索原理2.2.1.4、复分号262、文献检索原理、文献检索原理2.2.2医学主题词表医学主题词表(Medical Subject Headings)简称MeSH词表,是 国立医学图书馆(NLM)编制的用于对生物医学文献进行标引和检索的权威性术语控制工具。MeSH词表由字顺表和树状结构表两部分组成。2、文献检索原理2.2.2医学主题词表27医学主题词表医学主题词表2.2.2.1.2.2.2.1.字顺表字顺表(1 1)收词数量:到)收词数量:到20042004年为止,该表共收医学主题词年为止,该表共收医学主题词2256822568个,入口词个,入口词2388723887个。个。(2 2)收词种类:字顺表中的词分为)收词种类:字顺表中的词分为4 4种类型,即主题词、款种类型,即主题词、款目词、类目词和副主题词。目词、类目词和副主题词。1 1)主题词)主题词:构成主题词表的主体,由生物医学领域的经过规构成主题词表的主体,由生物医学领域的经过规范化的名词术语所构成。由独立检索意义。例如范化的名词术语所构成。由独立检索意义。例如“心脏心脏”、“脊髓灰质炎脊髓灰质炎”等。等。2 2)款目词:也称入口词,其作用是降自由词引见到主题词。)款目词:也称入口词,其作用是降自由词引见到主题词。例如:弓形足见足畸形、昏睡见睡眠期等。其中例如:弓形足见足畸形、昏睡见睡眠期等。其中“弓形虫弓形虫”和和“昏睡昏睡”都是入口词,都是入口词,“足畸形足畸形”和和“睡眠期睡眠期”都是都是主题词。主题词。医学主题词表2.2.2.1.字顺表283 3)类目词:是为保证分类表体系的完整性而设立的)类目词:是为保证分类表体系的完整性而设立的一类词汇,通常都是学科范围很大的词,它们不一类词汇,通常都是学科范围很大的词,它们不作为主题词使用。例如:肌骨骼畸形(类目词)、作为主题词使用。例如:肌骨骼畸形(类目词)、身体部位(类目词)等等。身体部位(类目词)等等。4 4)副主题词:副主题词对文献主题起限定作用,构)副主题词:副主题词对文献主题起限定作用,构成主题的一些主题的一些通用性概念,本身无独成主题的一些主题的一些通用性概念,本身无独立检索意义。例如青霉素立检索意义。例如青霉素G/G/副作用,在副作用,在MeSHMeSH种种提供了提供了8383个副主题词(个副主题词(20042004年),这些副主题词年),这些副主题词按英文字母顺序排列,同时给予每个词词义解释,按英文字母顺序排列,同时给予每个词词义解释,还限定各个副主题词允许组配的主题词范围,即还限定各个副主题词允许组配的主题词范围,即在副主题词后的括号内标出该词可以组配的主题在副主题词后的括号内标出该词可以组配的主题词的类号。词的类号。3)类目词:是为保证分类表体系的完整性而设立的一类词汇,通常295 5)特征词:用于表达文献的某些特征,起作用在于)特征词:用于表达文献的某些特征,起作用在于检索时对文献集合中有某种特征的文献进行限定检索时对文献集合中有某种特征的文献进行限定或排除。或排除。a.a.对象特征词对象特征词 是指文献研究的对象,例如:人类,是指文献研究的对象,例如:人类,动物等动物等b.b.时间特征词时间特征词 包括年代、时代、朝代等,例如,清、包括年代、时代、朝代等,例如,清、南北朝等南北朝等c.c.位置特征词位置特征词 包括国家、地区等方面包括国家、地区等方面 例如,例如,、中、中国、北京等国、北京等d.d.文献类型特征词文献类型特征词 包括教材、综述等包括教材、综述等5)特征词:用于表达文献的某些特征,起作用在于检索时对文献集302.2.2.2 MeSH2.2.2.2 MeSH词表树状结构表词表树状结构表(1 1)结构:为了显示主题词的学科体系,词表编制)结构:为了显示主题词的学科体系,词表编制者将者将MeSHMeSH字顺表中的所有主题词(包括类目词)字顺表中的所有主题词(包括类目词)按学科属性从分类角度进行划分,编制了树状结按学科属性从分类角度进行划分,编制了树状结构表(也称范畴表)共分出构表(也称范畴表)共分出1515个大类,再细分出个大类,再细分出114114个二级子类目,各子类下又层层划分,逐级展个二级子类目,各子类下又层层划分,逐级展开,最多可达开,最多可达1111级。有的主题词可能同属于两个级。有的主题词可能同属于两个或多个子类目,这种主题词后同时列出多个树状或多个子类目,这种主题词后同时列出多个树状结构号,并分别排在其所归属的类目中。结构号,并分别排在其所归属的类目中。2.2.2.2 MeSH词表树状结构表31(2 2)MeSHMeSH树状结构表作用树状结构表作用1 1)用树状结构号确定主题词在分类表中的位置,是)用树状结构号确定主题词在分类表中的位置,是字顺表和范畴表相互联系的桥梁和媒介,是副主字顺表和范畴表相互联系的桥梁和媒介,是副主题词组配范围的依据。题词组配范围的依据。2 2)是选择专指词(下位词)的依据。便于缩小检索)是选择专指词(下位词)的依据。便于缩小检索范围,提高查准率。同时,也是选择上位词的依范围,提高查准率。同时,也是选择上位词的依据。便于扩展检索,提高查全率。据。便于扩展检索,提高查全率。3 3)通过树状结构号可以了解某主题词的学科属性及)通过树状结构号可以了解某主题词的学科属性及该词于其它词的隶属关系,加深对医学知识的了该词于其它词的隶属关系,加深对医学知识的了解。解。(2)MeSH树状结构表作用32中图法的复分表主要有通用复分表和专类复分表两种,这些复分表的号码不能单独使用,只能加在主分类号后面作为共性区分的标识。由于词表的词量和体积的限制,不可能将文献中的自然语言词汇都收入其中,这就造成了自然语言表达和词表选词之间的矛盾。例如,标引胃溃疡出血,不能用胃溃疡出血,而应该用胃溃疡消化性溃疡出血。不对文献的实质内容进行分析,检索准确性较差当一分类号的数字超过三位时,为了醒目而加上小圆点“.检索是标引的逆过程,是在对课题的实质需求进行分析的基础上,借助主题词表,将自然语言表达的检索需求转换成规范化的主题词,并构建检索提问式。因为出血不是胃溃疡出血最邻近的上位概念。R28-64 中药学图谱便于扩展检索,提高查全率。R28-61 中药学辞典标引是指对每一篇纳入检索系统的文献进行内容分析,对文献给予适当的分类号标识或者主题词标识,前者称为分类标引,后者成为主题标引。数字的位置,基本上遵从层累制的原则,即尽可能使号码的位数代表类目的等级数。世界上第一个疾病分类法是Faar W.(一)、文献信息数据库的类型(一)、中文文全文库(中国医院知识仓库、万方数据资源系统、超星数字图书馆)2.2.3中国中医药学主题词表主表与MeSH词表结构基本相同,共收录正式主题词5806个,入口词1131个,类目词161个,副主题词94个。中图法的复分表主要有通用复分表和专类复分表两种,这些复分33医学主题词表是用于医学主题词表是用于“标引标引”和和“检索检索”的共同语的共同语言。言。标引和检索的关系标引和检索的关系 标引是指对每一篇纳入检索系统的文献进行内容分标引是指对每一篇纳入检索系统的文献进行内容分析,对文献给予适当的分类号标识或者主题词标析,对文献给予适当的分类号标识或者主题词标识,前者称为分类标引,后者成为主题标引。对识,前者称为分类标引,后者成为主题标引。对标引起规范化作用的词表成为分类表和主题词表。标引起规范化作用的词表成为分类表和主题词表。“标引标引”的目的是位的目的是位“检索检索”做准备。做准备。检索是标引的逆过程,是在对课题的实质需求进行检索是标引的逆过程,是在对课题的实质需求进行分析的基础上,借助主题词表,将自然语言表达分析的基础上,借助主题词表,将自然语言表达的检索需求转换成规范化的主题词,并构建检索的检索需求转换成规范化的主题词,并构建检索提问式。提问式。医学主题词表是用于“标引”和“检索”的共同语言。34如下图所示,如下图所示,“主题词表主题词表”是沟通标引和检索的是沟通标引和检索的“桥梁桥梁”,是两者的共同,是两者的共同“语言语言”。它位标引者和。它位标引者和检索者用词一致提供了保障。检索者用词一致提供了保障。如下图所示,“主题词表”是沟通标引和检索的“桥梁”,是两者的35标引质量决定检索系统的质量标引质量主要是指标引的准确性、符合性和一致性。也就是说在进行文献标引时,尽管每篇文献的题目可能不同,只要反应的主题内容相同,经过主题标引后,都能将这些文献归入到相同的主题词下,从而保证了检索系统较高的检索效率。标引质量决定检索系统的质量36医学主题词表应用中的若干问题1.主题分析无论是标引过程还是检索过程,主题分析是初始环节,其正确与否关系重大,因为如果主题分析错了,即便后续的词表转换正确也是徒劳的。医学主题词表应用中的若干问题372.2.概念组配概念组配由于词表的词量和体积的限制,不可能将文献中的自然语言由于词表的词量和体积的限制,不可能将文献中的自然语言词汇都收入其中,这就造成了自然语言表达和词表选词之词汇都收入其中,这就造成了自然语言表达和词表选词之间的矛盾。为此,主题词表允许主题词具备组配能力。即间的矛盾。为此,主题词表允许主题词具备组配能力。即用两个或两个以上主题词组合复合概念最邻近的上位概念。用两个或两个以上主题词组合复合概念最邻近的上位概念。例如,标引胃溃疡出血,不能用溃疡出血,而应该用胃例如,标引胃溃疡出血,不能用溃疡出血,而应该用胃溃疡消化性溃疡出血。因为出血不是胃溃疡出血最邻近溃疡消化性溃疡出血。因为出血不是胃溃疡出血最邻近的上位概念。的上位概念。(1 1)定义:是指能够确认表达复合概念词构成成分的)定义:是指能够确认表达复合概念词构成成分的各个主题词之间的组配,它不着得于字面上是否与自然语言各个主题词之间的组配,它不着得于字面上是否与自然语言的复合词形相符。其主要原则是组配所选的词必须是欲标的复合词形相符。其主要原则是组配所选的词必须是欲标识的复合概念最邻近的上位概念。例如,标引胃溃疡出血,识的复合概念最邻近的上位概念。例如,标引胃溃疡出血,不能用胃溃疡出血,而应该用胃溃疡消化性溃疡出血。不能用胃溃疡出血,而应该用胃溃疡消化性溃疡出血。因为出血不是胃溃疡出血最邻近的上位概念。因为出血不是胃溃疡出血最邻近的上位概念。2.概念组配38(2)概念组配的方法:1)主主组配:即主题词和主题词的组配。例如:病毒性心脏病心肌炎,组配表达的复合概念是病毒性心肌炎。2)主副组配:即主题词和副主题词的组配。为了减少主题词的词量,又不降低其专指性,词表收入了一定量的副主题词,标引时用“/”与主题词分开。例如,肾畸形,可能用肾/畸形。(2)概念组配的方法:39n n(3 3)副主题词的组配原则:)副主题词的组配原则:MeSHMeSH中的副主题并非可能随中的副主题并非可能随意和主题词组配,而是有严格的组配限制。意和主题词组配,而是有严格的组配限制。n n1 1)严格遵守副主题词适用范围:)严格遵守副主题词适用范围:MeSHMeSH给每个副主题词给每个副主题词都下了定义,并明确规定了副主题词允许组配的主题词范都下了定义,并明确规定了副主题词允许组配的主题词范围。围。n n2 2)尽可能选用最专指的副主题词)尽可能选用最专指的副主题词n n3 3)有先组主题词时,不能使用副主题词组配,是指词表)有先组主题词时,不能使用副主题词组配,是指词表己经列出的复合概念词。例如,传染病预防,己是主题词己经列出的复合概念词。例如,传染病预防,己是主题词了,不能再用传染病了,不能再用传染病/预防这样的组配词来表达。预防这样的组配词来表达。n n4 4)同一主题,涉及多方面问题,一般最多允许组配)同一主题,涉及多方面问题,一般最多允许组配3 3个副个副主题词,如果涉及的副主题词超过主题词,如果涉及的副主题词超过3 3个,则仅选择主题词个,则仅选择主题词标引。标引。(3)副主题词的组配原则:MeSH中的副主题并非可能随意和主40n n3.3.词表选词原则词表选词原则n n(1 1)首选专指词:首先选用与文献主题概念完全对应的、最专指的)首选专指词:首先选用与文献主题概念完全对应的、最专指的主题词。主题词。n n(2 2)次选组配词:当某一复合概念无完全对应的主题词时,则选用)次选组配词:当某一复合概念无完全对应的主题词时,则选用主题词与副主题词组配或主题词与主题词组配的方式予以表达。主题词与副主题词组配或主题词与主题词组配的方式予以表达。n n(3 3)选择上位词或近义词:当不能组配进行选词时,可直接用与文)选择上位词或近义词:当不能组配进行选词时,可直接用与文献主题概念临近的上位词或一个近义词。献主题概念临近的上位词或一个近义词。n n(4 4)选择特征词:为了满足检索特定范围文献的检索要求,对于反)选择特征词:为了满足检索特定范围文献的检索要求,对于反映文献非核心概念的其它方面,如研究对象、研究时间、研究地点和映文献非核心概念的其它方面,如研究对象、研究时间、研究地点和文献类型等内容,也是标引时必须选择的内容。文献类型等内容,也是标引时必须选择的内容。n n(5 5)选择自由词:对于无法使用上述方法标引的概念,尤其是反映)选择自由词:对于无法使用上述方法标引的概念,尤其是反映某学科领域最近进展的新概念、新术语,可能直接采用自由词进行标某学科领域最近进展的新概念、新术语,可能直接采用自由词进行标引。引。n n以上以上5 5条选词原则,实际上有一个优先顺序问题,在进行词表转换时,条选词原则,实际上有一个优先顺序问题,在进行词表转换时,应该遵循从一到五的顺序进行选词。应该遵循从一到五的顺序进行选词。3.词表选词原则41例如,标引胃溃疡出血,不能用溃疡出血,而应该用胃溃疡消化性溃疡出血。分类检索语言是将各种知识领域(学科及其研究问题)的类目按知识分类原理进行系统排列,以代表类目的分类号(如字母符号、数字等)作为文献标识的一类检索语言。布尔检索 运算符是:AND、OR、NOT,分别表示逻辑与、逻辑或、逻辑非三种逻辑运算关系。便于扩展检索,提高查全率。例如:弓形足见足畸形、昏睡见睡眠期等。例如:甲状腺疾病的分类号是R581,甲状腺疾病诊断的分类号是。3)类目词:是为保证分类表体系的完整性而设立的一类词汇,通常都是学科范围很大的词,它们不作为主题词使用。、文本信息检索策略构建(18511883)编撰的新死因分类法。便于扩展检索,提高查全率。01 预防、控制和卫生由于词表的词量和体积的限制,不可能将文献中的自然语言词汇都收入其中,这就造成了自然语言表达和词表选词之间的矛盾。1946年世界卫生组织承担了ICD的编撰工作,称为国际疾病、创伤和死因的统计分类法。(18511883)编撰的新死因分类法。例如,标引胃溃疡出血,不能用溃疡出血,而应该用胃溃疡消化性溃疡出血。例如,标引胃溃疡出血,不能用胃溃疡出血,而应该用胃溃疡消化性溃疡出血。(一)、文献信息数据库的类型国际疾病分类法疾病分类就是根据疾病的病因、病理、临床表现和解剖位置等特性,将疾病分门别类,把同类疾病分在一起,并使其成为一个有序的组合。其目的是为了系统地记录、分析、解释和比较来自于不同国家或地区、以及在不同时间段的死亡和疾病数据。例如,标引胃溃疡出血,不能用溃疡出血,而应该用胃溃疡消化42n n国际疾病分类法的全称是国际疾病及相关健康问题统计分类法(The International Statistical Classification of Diseases and Related Health Problems,ICD),它就是一种能够让使用者按照既定标准将疾病单位纳入类目的一种系统。通过这个系统可以将疾病诊断和许多健康问题的词句转换成字母数字编码,从而易于对数据进行贮存、检索和分析。国际疾病分类法的全称是国际疾病及相关健康问题统计分类法43n nICDICD是国际上统一使用的疾病分类法,由世界卫是国际上统一使用的疾病分类法,由世界卫生组织编撰。世界上第一个疾病分类法是生组织编撰。世界上第一个疾病分类法是Faar Faar W.(18071883)W.(18071883)于于18531853年出版的死因标准术语集。年出版的死因标准术语集。而而ICDICD的前身则是的前身则是18931893年由年由Eertillon Eertillon J.(18511883)J.(18511883)编撰的新死因分类法。编撰的新死因分类法。19461946年世年世界卫生组织承担了界卫生组织承担了ICDICD的编撰工作,称为国际的编撰工作,称为国际疾病、创伤和死因的统计分类法。疾病、创伤和死因的统计分类法。19751975年出版年出版了第九版,是使用比较广泛的版本。了第九版,是使用比较广泛的版本。ICDICD目前最目前最新版本是新版本是19931993年年1 1月月1 1日开始使生效的第十版日开始使生效的第十版(ICD-10ICD-10),改称国际疾病及相关健康问题统计改称国际疾病及相关健康问题统计分类法。分类法。ICD是国际上统一使用的疾病分类法,由世界卫生组织编撰。世界44n n学习疾病分类法的意义学习疾病分类法的意义1.1.国际疾病分类是由世界卫生组织倡导,各国用于国际疾病分类是由世界卫生组织倡导,各国用于疾病、操作和死亡原因分类的统一标准化工具。疾病、操作和死亡原因分类的统一标准化工具。推广使用国际疾病分类,有利于疾病与死因统计推广使用国际疾病分类,有利于疾病与死因统计分析标准化以及卫生统计信息国际间的对比和交分析标准化以及卫生统计信息国际间的对比和交流,促进世界卫生保健事业的发展。流,促进世界卫生保健事业的发展。2.2.是提高医学生信息素养的需求是提高医学生信息素养的需求 (汇集了大量的疾(汇集了大量的疾病、损伤、药物及化学物质等术语)病、损伤、药物及化学物质等术语)3.3.是扩展医学视野的需要是扩展医学视野的需要学习疾病分类法的意义45n nICDICD的结构的结构n n第十版分为印刷版和电子版第十版分为印刷版和电子版n n印刷版总共有三卷印刷版总共有三卷n n第一卷为类目表第一卷为类目表n n第二卷为指导手册第二卷为指导手册n n第三卷为字顺索引第三卷为字顺索引n n电子版在电子版在WHOWHO网站发布,网站发布,是:是:ICD的结构46文献检索原理及中文医学文献数据库检索资料全面版课件47文献检索原理及中文医学文献数据库检索资料全面版课件48
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!