powerpoint-演示文稿--网上信息资源及其查询方法解析课件

上传人:58****5 文档编号:243152943 上传时间:2024-09-17 格式:PPT 页数:35 大小:294.50KB
返回 下载 相关 举报
powerpoint-演示文稿--网上信息资源及其查询方法解析课件_第1页
第1页 / 共35页
powerpoint-演示文稿--网上信息资源及其查询方法解析课件_第2页
第2页 / 共35页
powerpoint-演示文稿--网上信息资源及其查询方法解析课件_第3页
第3页 / 共35页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第五章 网上信息资源及其查询方法,INTERNET,三大基本概念和功能组,网上信息检索的工具、搜索方式和搜索技巧,影响检索结果的因素,使用搜索引擎时应注意事项,1,INTERNET,三大基本概念和功能组,1.1,INTERNET,三大基本概念,1),TCP/IP,协议:,传输控制与网际协议,2),DN(,域名)和,IP,地址,3),URL:,全球资源定位器,1),TCP/IP,协议,TCP,是,Transmission Control Protocol (,传输控制协议)的缩写,,IP,是,Internet Protocol (,网际协议)的缩写支持,WWW,功能的,HTTP(Hypertext Transport Protocol ,,超文本传输协议), 该协议容许文字、图画、声音等同时传输,支持,E-mail,功能 的,SMTP(Simple Mail Transfer Protocol,简单邮件传输协议)和,POP(Post Office Protocol,邮局协议),支持,FTP,功能的,FTP(File Transfer Protocol,文件传输协议),2),DN(,域名):,Domain Name,结构:由2到5段字符构成,中间用. 隔开, 形如,host.inst.,fild,.stat,stat ,国别代码,au(,澳大利亚),ca (,加拿大),cn,(,中国),fr,(,法国),it (,意大利) ,,uk,(,英国),美国因创建,Internet,优先而无此码,fild,网络分类代码,ac(,学术网)、,com(,商用网)、,edu,(,教育网)、,gov,(,政府网)、,mil(,军事网)、,net(,公共网)、,org(,社团网)七类,,1997年秋季起,Internet,管理机构决定未来将增设,arts(,文艺机构)、,firm(,公司企业)、,info(,信息服务机构)、,nom(,个人专用)、,rec,(,娱乐专用)、,store(,商店专用)、,web(,万维网专用)七类代码;,inst ,单位或子网代码, 一般是其英文缩写;,sdau,(,山东农业大学),host,是主机或服务器代码。,如我校的,WWW,服务器的,DN,为,www.,sdau,.,edu,.,cn,FTP,服务器的,DN,则为,ftp.,sdau,.,edu,.,cn,2),IP,地址,结构:一般为四段数字,中间用,.,隔开,202.194.143.1,3)URL (Uniform Resource Locator),定义文件在,Internet,上的位置, 无论其位于哪台主机、哪个子目录,只要给出文件的,URL,地址,就能在,nternet,信息海洋中准确无误地定位该文件,就象是一个全球定位器。,URL,的一般语法格式为:,protocol:/,hostdn,(,hostip,),:port/path/file,1.2,Internet,功能组,功能群 基础协议,URL,形式 主要搜索工具,(1),WWW HTTP http:/.,Web Search Engine Browser,(2) FTP FTP ftp:/.,FTP Search Engine(Archie),Browser;Ws_ftp,(3) Email SMTP/POP mailto:.,Whitepage,Search Engine,Browser;Eudora,(4) Usenet NNTP news:.,Usenet Search Engine,Browser;,WinVN,(5) Telnet TELNET telnet:/.,Gopher(Veronica &,Jughead,)etc Browser;,Netterm,2 网上信息检索的工具、搜索方式 和搜索技巧,6.2.1工具:搜索引擎(,Search Engine ),:Internet,上具有查询功能的网页的统称,如:,Web Search Engine(,万维网搜索引擎),FTP Search Engine(,文件搜索引擎),Email/,WhitePage,Search Engine(,电子函件/白页搜索引擎),YellowPage,Search Engine(,黄页搜索引擎),Usenet Search Engine(,新闻论坛搜索引擎),Meta-Search Engine(,元搜索引擎)等类型,中文搜索引擎,百度,http,:,www,baidu,com,搜狐,http,:,www,sohu,com,搜索客,http,:,www,cseek,com,悠游,http,:,www,goyoyo,com,cn,新浪,http,:,www,sina,com,cn,网易,http,:,www,yeah,net,中文搜索引擎,常青藤,http,:,www,tonghua,com,cn,若比邻,http,:,www,robot,com,cn,北极星,http,:,www,beijixin,com,cn,网典,http,:,www,cnnavigate,com,天网,http,:,e,pku,edw,cn,雅虎中文,http,:,cn,yahoo,com,西文搜索引擎,http,:,www,google,com,http,:,www,infoseek,com,http,:,www,excite,com,http,:,www,yahoo,com,http,:,www,1ycos,com,http,:,www,altavista,com,http,:,www,metacrawler,com,http,:,www,profusion,com,6. 2搜索引擎的搜索方式,简单搜索,(,Simple Search,,简记作,SS):,指输入一个单词(关键词)或两个单词以上的词组(短语),提交搜索引擎查询,这是最基本的搜索方式。大多数搜索引擎都约定把词组或短语放在引号“”内。,高级搜索,(,Advanced Search,,简记作,AS):,指用布尔逻辑组配方式查询,也叫定制搜索。也包括多词语句提问的任意查询。不同搜索引擎对语句中词与词之间的关系的处理方式不同。,目录搜索,(,Catalog Search,,简记作,CS):,指按搜索引擎提供的分类目录逐级查询,用户一般不需要输入查询词,而是按照查询系统所给的几种分类项目,选择类别进行搜索,因而也叫分类搜索(,Classified Search)。,6. 3搜索引擎的检索技巧,5种常见的数据库检索功能:布尔逻辑检索、字符串检索、截词检索、字段检索,限制检索和位置检索,特有的检索功能:自然语言检索 、概念检索 、加减(+一)号检索 、区分大小写的检索 、检索结果的相关性排序,1)布尔逻辑检索,(1)逻辑运算符:,逻辑与:空格、+、,and,计算机 病毒、计算机+病毒、计算机,and,病毒,逻辑或:|、,or,计算机,or,电脑、计算机|电脑,逻辑非:,not、-,彩票,not,山东、彩票,-,山东,(2)注意事项,:,A,受支持的程度不同:,完全支持,如,Excite,、,Infoseek,等均支持,AND,、,OR,、,NOT,全部三种运算;,部分支持,,如,Yahoo,只支持,AND,、,OR,两种运算;,只在其“高级检索”模式中 “完全支持”,而在“简单检索”模式中是“部分支持”,如,HotBot,、,Lycos,。,(,2)注意事项,:,B,提供运算的方式不同:大部分仍采用常规的命令驱动方式,也有一部分是采用菜单驱动方式,即用菜单选项代替布尔运算符进行逻辑运算,如,HotBot,、,Lycos,中均提供了两个菜单选项“,All the words,”,和“,Any,o,f the words,”,代表,AND,和,OR,运算。,2)字符串检索(短语检索 ),定义:将一个字符串(通常用双引号括起)当作一个独立的运算单元,进行严格匹配,以提高检索的精度和准确度。,逻辑运算符:“”,几乎所有的搜索引擎都支持字符串检索,3)截词检索,逻辑运算符:*,在搜索引擎中,目前只提供右截法,4)字段检索和限制检索,在搜索引擎中字段检索一律表现为前缀限制的形式,如属于主题字段限制的有:“,Title:”、“Subject:”,“Keyword:”、“Summary:”,等;属于非主题字段限制的有:“,Image:”、“text:”,等。,作为一种网络检索工具,搜索引擎还提供了许多新的、带有典型网络检索特征的字段限制类型,如主机名限制(,host:)、,超链限制(,anchor:)、,域名限制(,domain:)、URL,限制 (,url:)、,网址限制(,site:)、E-mail,限制(,from:),等。,5)位置检索,目前只有,AltaVista,提供临近位置运算,(,near,运算,),6)自然语言检索,定义:直接采用自然语言中的字、词甚至整个句子作提问式进行检索,如可用,“,What is the weather in Boston,”,7)概念检索,在用某一检索词进行检索时,能同时对该词的同义、近义、广义和狭义词进行检索,以达扩大检索范围、避免漏检的目的。这类似于一般数据库检索中的“扩展检索”功能。,目前,只有,Excite,能提供此功能。,8)加减(+一)号检索,作用相当于,ANDNOT,运算,几乎所有的搜索引擎都支持该功能,9)区分大小写的检索,又称大小写敏感检索,这主要是针对检索词中含有人名、地名等专有名词而言的。,如在区分大小写的情况下,,Rock Hudson,能被当作人名看待,而,rock,hudson,则被当作两个普通词看待,从而影响了检索结果的准确性。,目前,,AltaVista,和,Infoseek,提供有此项功能。,10)检索结果的相关性排序,检索结果通常是根据相关程度按从大到小的顺序降序排列,几乎所有的搜索引擎都提供了“对检索结果按其相关性大小排序”的功能,3影响检索结果相关性的因素,(1) 检索词的个数:检索出的记录中含有的检索词个数越多,相关性越大。,(2) 检索词在数据库记录中出现的位置:检索出的记录中含有的检索词出现在题名字段的,比出现在其他(如正文或,URL),字段的相关性更大。,(3) 检索词所属的类目级别:检索出的记录中含有的检索词所属的类目级别越高,相关性越大。,(4) 检索词的权值:检索出的记录中含有的检索词权值比重越大,相关性越大(词的专指度越高,权值越大)。,4使用搜索引擎应注意的事项,最重要的技巧是关键词的选择,(1) 查询要求应具体明确,能使用下位词时,就不要使用上位词。,(2) 不要使用常用词,即不要使用太泛的词。,(3) 调整查询。如果查询返回太多的结果,就要使检索词更具体。如果查询没有产生足够多的结果,就要使它更一般。不要认为第一次选择的关键字是最好的。,(4) 使用单词的词尾变化。例如,如果要查找有关,running,的,Web,页,则可使用“,run”、“runs”,和“,running”,等。,(5) 使用同义词。如果用户正在使用的搜索引擎是支持关键词组配的搜索工具,一定要使用“,OR”,将各个同义词配合起来。,(6) 尽可能多使用字符串检索。如果用户想准确地匹配一个短语或标题,一定要用引号将它括起来,即进行字符串检索。例如,如果想在,Internet,上查找“,information retrieval”,,在搜索表单中应键人“,information retrieval”。,(7),熟悉正在使用的搜索工具。掌握一些搜索工具有很特殊的功能,使得查找相关内容更加容易。,(8) 任何信息搜索工具都有其局限性。当用户使用某种工具的搜索效果不理想时,换一种工具再试。一些工具在查询某类信息时的搜索领域宽于查询另一类信息的搜索领域,也可以考虑使用元搜索引擎或专业搜索引擎进行检索。,(9) 当获得的搜索结果十分有价值时,将它作为一个,HTML,文本存储在本地计算机中,以便再次使用。,(10) 查找专业性较强的信息时,应优先考虑使用专业搜索引擎。国内目前就有多种专业搜索引擎,如公路交通信息搜索引擎、医学搜索引擎、水产搜索引擎、暖通空调搜索引擎等。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!