因特网信息的查找课件

上传人:文**** 文档编号:242543993 上传时间:2024-08-27 格式:PPT 页数:34 大小:432.06KB
返回 下载 相关 举报
因特网信息的查找课件_第1页
第1页 / 共34页
因特网信息的查找课件_第2页
第2页 / 共34页
因特网信息的查找课件_第3页
第3页 / 共34页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2.2 因特网信息的查找,2.2 因特网信息的查找,1,知识点回顾:,信息获取的一般过程,定位信息,需求,选择信息的来源,确定信息获取方,法,获取信息,评价,信息,调,整,知识点回顾:信息获取的一般过程定位信息选择信息的来源确定信,2,奇葩作业,脚-鞋袜+草地 =,爸爸+妈妈+我=,枫叶+小溪=,一个喷嚏+一个喷嚏+一个喷嚏 =,奇葩作业脚-鞋袜+草地 =,3,所谓搜索引擎,就是用于在因特网上进行信息查找的网络工具,是一个提供信息“检索”服务的网站。例:,什么是搜索引擎,所谓搜索引擎,就是用于在因特网上进行信息查找的网络工具,是一,4,元搜索,引擎,1995,Yahoo!,1994,Gopher,1993,Archie,1990,第二代搜索,目录搜索,Google,1996,Baidu,1999,第三代搜索,网页搜索,搜索引擎的发展历史,元搜索Yahoo!GopherArchie第二代搜索Goog,5,搜索引擎的起源,Archie,所有搜索引擎的祖先,是1990年由,蒙特利尔,的McGill University三名学生发明的,Archie,(Archie FAQ)。,Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎,。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。,搜索引擎的起源Archie 所有搜索引擎的祖先,是,6,由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(,Gopher FAQ,)搜索工具。,它只支持文本,不支持图像,现在这个工具主要用在国外大型图书馆的信息检索上。,早期的另一个搜索工具,Gopher,由于Archie深受欢迎,受其启发,Nevada Syst,7,1994年4月,斯坦福大学的两名博士生,美籍华人,杨致远,和David Filo共同创办了,Yahoo,)。Yahoo目录开始支持简单的数据库搜索,因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个,可搜索的目录,。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。Yahoo!-几乎成为20世纪90年代的因特网的代名词。,第二代搜索:目录式搜索,Yahoo,!,1994年4月,斯坦福大学的两名博士生,美籍华人,8,1995年,一种新的搜索引擎形式出现了元搜索引擎(,Meta Search Engine,)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。,元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。,好听不好用的,元搜索引擎,1995年,一种新的搜索引擎形式出现了元搜索引擎(Me,9,第三代搜索:,网页搜索,它们都属于网页自动搜索引擎,有的还带有智能分析或搜索功能,第三代搜索:网页搜索它们都属于网页自动搜索引擎,有的还带有智,10,按工作方式划分,按检索内容划分,搜索引擎的分类,全文搜索引擎,目录索引类搜索引擎,元搜索引擎,通用型,垂直型,按工作方式划分 搜索引擎的分类 全文搜索引擎通用型,11,全文搜索引擎,全文搜索引擎,12,什么是关键词,就是您输入搜索框中的文字,也就是您命令搜索引擎寻找的东西。,提炼正确的关键词,无庸至疑,选择正确的关键词是一切的开始。学会从复杂搜索意图中,提练出最具代表性和指示性的关键词,对提高信息查询效率至关重要。,例如:多少级以上的地震会造成破坏?,a)4.5级 b)5级 c)6级,关键词:震级 破坏,什么是关键词提炼正确的关键词例如:多少级以上的地震会造成破坏,13,全文搜索引擎的工作原理,索引生成器,(网页数据库),爬行器,(蜘蛛),查询检索器,(用户查询),因特网,全文搜索引擎的工作原理索引生成器爬行器查询检索器因特网,14,利用能够从互联网上自动收集网页的,Spider,系统程序,,自动,访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。,第一步:从互联网上抓取网页,因特网,利用能够从互联网上自动收集网页的Spider系统程序,自动,15,第二步:建立索引数据库,由分析索引系统程序对收集的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或,重要性),然后用这些相关信息建立网页,索引数据库。,第二步:建立索引数据库 由分析索引系统程序对收集的网页进行分,16,搜索引擎的,Spider,一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页内容的更新情况,增加新的网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样,网页的具体内容和变化情况就会反映到用户查询的结果中。,搜索引擎的Spider一般要定期重新访问所有网页(各搜索引,17,第三步:检索界面的建立,当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。,第三步:检索界面的建立当用户输入关键词搜索后,由搜索系统程序,18,全文搜索引擎的工作原理,全文搜索引擎的工作原理,19,3、链接,2、专题目录,总目录专题目录链接网站,4、网站,目录索引类搜索引擎,3、链接2、专题目录总目录专题目录链接网站4、网,20,类型,举例,目录索引,全文搜索,目录索引类与全文搜索引擎对比,Google、百度、北大天网,优点:检索直接、方便,而且可使用布尔逻辑检索、短语检索等高级功能,缺点:繁多而杂乱,Yahoo、搜狐、新浪,优点:清晰方便地查找到某一大类信息并不严格限于查询关键字,缺点:搜索范围较全文搜索引擎要小许多,尤其是当用户选择类型不当时,可能遗漏某些重要的信息源。,类型举例目录索引,21,元搜索引擎。在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。,百,Google,度,:,元搜索引擎,优点:信息覆盖面更加广泛,缺点:高级检索功能不完善,检索结果没有经过处理,著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有北斗星等。,元搜索引擎。在接受用户查询请求时,同时在其他多个引擎上,22,全文搜索引擎:,google,百度。可以搜索至每个页面。,目录索引类搜索引擎:,典型代表Yahoo,可以不用提供关键词,按照分类也能检索到相应的网站,因此他对网站的检索能力非常强。国内的新浪,网易。,元搜索引擎,:可同时在多个搜索引擎上进行搜索,搜索引擎分类小结,实际上:,由分类搜索和全文搜索各有利弊,当前许多搜索引擎都在朝着二者兼备的方向发展,如谷歌、新浪、搜索、百度都设置了两种搜索方式。,全文搜索引擎:google,百度。可以搜索至每个页面。搜索引,23,全文搜索与关键词搜索实战搜索技巧,导学一:,选择合适的搜索引擎,通过搜索引擎查阅与,风光摄影,有关的,个人主页,。,通过搜索引擎查阅与,风光摄影,有关的,图片,。,思考:全文搜索引擎和目录索引类搜索引擎各自在什么情况下使用。,全文搜索与关键词搜索实战搜索技巧导学一:选择合适的搜索引,24,小结:,全文搜索引擎使用起来相对比较简单,但精确度相对差一些。,目录索引类搜索引擎精确度比较高,但使用起来相对比较麻烦。,此外,还有一些权威网站或者专业的搜索引擎供网上用户查询。,小结:全文搜索引擎使用起来相对比较简单,但精确度,25,全文搜索与关键词搜索实战搜索技巧,导学二:,细化搜索条件,请试着在网上找到余光中乡愁的英语译稿并思考搜索当中,最重要,的是什么?,1.你选用的搜索引擎是,2.你用的搜索关键词是,3.搜索引擎提供了多少网页结果,4.你最终在哪个网站上获得了你想要的正确的译稿,全文搜索与关键词搜索实战搜索技巧导学二:细化搜索条件,26,小结:,提炼出最具代表性和指示性的关键词对提高信息查询效率至关重要,同时,搜索条件越具体,搜索引擎返回的结果越精确,有时输入多个关键词,可以获得更精确的搜索结果。,小结:提炼出最具代表性和指示性的关键词对提高信息,27,全文搜索与关键词搜索实战搜索技巧,导学三:,用好逻辑命令,小明在语文课上学了苏轼写的念奴娇赤壁怀古,他很喜欢这个词牌,想从网上查找词牌名为“念奴娇”的其他宋词,他找到最多的居然是伊能静演唱的一首名为念奴娇的流行歌曲。,请分别使用,“念奴娇 赤壁怀古”、“念奴娇 -赤壁怀古”,等关键词在百度上进行搜索,观察有什么区别?,全文搜索与关键词搜索实战搜索技巧导学三:用好逻辑命令,28,全文搜索与关键词搜索实战搜索技巧,逻辑运算符:,“,与,”运算:and、&、空格、+,两关键词是“并且”的关系。,“,或,”运算:or、|,两关键词是“或者”的关系。,“,非,”运算:not、-,从搜索范围中排除某项内容。,全文搜索与关键词搜索实战搜索技巧逻辑运算符:,29,搜索技巧:逻辑符号的使用,左右两个关键词同时满足,信息技术 and历史信息技术 +历史信息技术 历史,左右两个关键词只有一个满足即可,信息技术 or历史,信息技术 |历史,排除后面的关键词,信息技术 not历史信息技术 历史,信息技术,历史,信息技术,历史,信息技术,历史,逻辑符号的使用,搜索技巧:逻辑符号的使用左右两个关键词同时满足信息技术 an,30,全文搜索与关键词搜索实战搜索技巧,导学四:,强制搜索,加,英文双引号,或,书名号,一般在查询,名言警句,或者,专有名词,时显得格外有用。,补充:请在“,手机,”两边加上,书名号,,观察它和不加书名号有什么区别。,搜索“www的历史”,观察加与不加英文双引号的区别,全文搜索与关键词搜索实战搜索技巧导学四:强制搜索,31,全文搜索与关键词搜索实战搜索技巧,导学五:,适当使用特征词,该技巧用于查找明星的个人资料页。一般来说,明星资料页的网页标题通常是明星的名字。,如:查找成龙的个人资料,就可以用“姓名 身高 intitle:成龙”,全文搜索与关键词搜索实战搜索技巧导学五:适当使用特征词如,32,全文搜索与关键词搜索实战搜索技巧,导学六:,定向搜索,指定网站类型、文件类型、主题类别,如:查看QQ空间,搜索个人简介,类型为word文档,搜索主题为网站策划的网页,Site:,个人简介,Intitle:网站策划,全文搜索与关键词搜索实战搜索技巧导学六:定向搜索如:查看,33,小结,1.搜索引擎的定义及其分类。,2.搜索技巧,小结1.搜索引擎的定义及其分类。,34,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!