资源描述
现代信息查询与利用实践四实践四典型搜索引擎训练典型搜索引擎训练 现代信息查询与利用信息工具与资源实践内容实践内容 实践3.1:搜索引擎高阶利用(实践1学时)(1)通过上机实践掌握Google、Baidu的初高级检索功能和一些特色功能;(2)通过上机实践掌握学术搜索的途径和方法; 现代信息查询与利用一知识点回顾搜索引擎搜索引擎, Search Engine, Search Engine是指通过是指通过网络搜索软件网络搜索软件或网站登陆等方式,将互或网站登陆等方式,将互联网上大量网站的页面收集到本地,联网上大量网站的页面收集到本地,经过加工经过加工处理处理而建库,从而能够对用户提出的各种查询而建库,从而能够对用户提出的各种查询作出响应,作出响应,提供用户所需的信息的一种工具。提供用户所需的信息的一种工具。由由搜索模块,索引模块,检索模块搜索模块,索引模块,检索模块和和用户接口用户接口四个部四个部分组成,分组成, 从检索系统来看它实质是对从检索系统来看它实质是对 WWW WWW 站点资站点资源和其它网络资源进行标引和检索的一类检索系统源和其它网络资源进行标引和检索的一类检索系统机制机制。参见教材参见教材13.2.1现代信息查询与利用一知识点回顾参见教材参见教材13.2.1搜索引擎的原理,可以看做三步:搜索引擎的原理,可以看做三步:从互联网上抓取网页从互联网上抓取网页建立索引数据库建立索引数据库在索在索引数据库中搜索排序。引数据库中搜索排序。 搜索引擎并非直接搜索互联网,也是搜索引擎并非直接搜索互联网,也是搜搜索它的索引数据库索它的索引数据库。 索引数据库的更新速度直接影响搜索引索引数据库的更新速度直接影响搜索引擎是否可以搜索到最新的资料。擎是否可以搜索到最新的资料。现代信息查询与利用常用搜索引擎的搜索技巧比较baidubaidugooglegoogle雅虎雅虎搜狗搜狗搜索技巧搜索技巧?-实践重点实践重点现代信息查询与利用百度的高级检索逻辑与逻辑与双引号双引号逻辑或逻辑或逻辑非逻辑非逻辑与:逻辑与:空格或+, , 如如“计算机计算机 防火墙防火墙”。逻辑或:逻辑或:| | ,如,如“计算机计算机 | | 电脑电脑” 。逻辑非:逻辑非:- -, , 例如例如, ,要搜寻要搜寻“武侠小说武侠小说”, ,但不含但不含“古古龙龙”的资料的资料, ,则可输入则可输入“武侠小说武侠小说 - - 古龙古龙”。百度百度不支持 “通配符通配符”, ,要求所输入的关键词完整、要求所输入的关键词完整、准确准确, ,一字不差一字不差, ,才能得到最准确的资料。才能得到最准确的资料。现代信息查询与利用Google的高级检索逻辑与逻辑与双引号双引号逻辑或逻辑或逻辑非逻辑非46种种语言语言246国家、国家、地区地区参见教材参见教材13.2.2(P280-281)现代信息查询与利用Google的高级检索逻辑与逻辑与双引号双引号逻辑或逻辑或逻辑非逻辑非 GoogleGoogle支持逻辑运算支持逻辑运算:在词前加上一个减号(:在词前加上一个减号(“-”-”, 英文字符),在减号之前留一空格表示排除搜索某个词英文字符),在减号之前留一空格表示排除搜索某个词语;在关键词中间留空格,语;在关键词中间留空格,GoogleGoogle会会在关键词之间自动在关键词之间自动添加添加“ANDAND”; Google Google 不使用不使用“词干法词干法”、不支持、不支持“通配符通配符”( (* *) ) 搜搜索索;不区分英文字母大小写,所有的字母均当做小写处;不区分英文字母大小写,所有的字母均当做小写处理;理;给词语加上双引号可进行短语精确搜索给词语加上双引号可进行短语精确搜索。GoogleGoogle将将连字号、斜线、句点、等号和省略号当作短语连接符。连字号、斜线、句点、等号和省略号当作短语连接符。 GoogleGoogle允许用户直接在键盘上输入汉语拼音来检索允许用户直接在键盘上输入汉语拼音来检索相关相关事物事物 例如:输入例如:输入sichuanfengjingmingshengsichuanfengjingmingsheng,检索结果提示:您是不是要,检索结果提示:您是不是要找:四川风景名胜。用户在输入拼音时,字母中间不能留有空找:四川风景名胜。用户在输入拼音时,字母中间不能留有空 ,否,否则则GoogleGoogle会误认为是英文。会误认为是英文。 参见教材参见教材13.2.2(P280-281)现代信息查询与利用百度(百度(baidubaidu)高级搜索语法高级搜索语法专业文档搜索专业文档搜索“filetype“filetype:”(DOC(DOC、XLSXLS、PPTPPT、PDFPDF、RTFRTF、ALL)ALL) 把搜索范围把搜索范围限定限定在网页标题中在网页标题中intitleintitle把搜索范围把搜索范围限定限定在特定站点中在特定站点中sitesite 把搜索范围把搜索范围限定限定在在urlurl链接中链接中inurlinurl 精确匹配精确匹配双引号和书名号双引号和书名号( (加上书名号的查加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分果中;二是被书名号扩起来的内容,不会被拆分) )要求搜索结果中要求搜索结果中不含特定查询词不含特定查询词减号语法减号语法现代信息查询与利用GoogleGoogle高级检索技术高级检索技术 具有特殊功能的查询字包括具有特殊功能的查询字包括 filetypefiletype、definedefine、sitesite、cache cache 、info info 、linklink,inurlinurl,allinurlallinurl,intitleintitle,allintitleallintitle。FiletypeFiletype用于查找特定的文档,用于查找特定的文档,输入格式为:输入格式为:“关键词关键词 filetype:filetype:* * *”,* * *为文档类型,为文档类型,GoogleGoogle可可以支持以支持1313种非种非HTMLHTML文件的搜索,包括文件的搜索,包括PDFPDF文档、文档、icrosoft Office icrosoft Office (doc, ppt, xls, rtf(doc, ppt, xls, rtf)、)、Shockwave Flash (swf)Shockwave Flash (swf)、PostScript PostScript (ps)(ps)和其它类型文档;和其它类型文档;如输入如输入“冒险岛冒险岛filetype:swf”filetype:swf”即搜索有关冒险岛的即搜索有关冒险岛的FlashFlash文档。文档。DefineDefine用于查看字词或词组的定义用于查看字词或词组的定义,输入格式为:输入格式为:“definedefine词词 ”中间有一个空格,该操作符与您需要中间有一个空格,该操作符与您需要其定义的字词之间不留空格,其定义的字词之间不留空格,如如“definedefine知识经济知识经济”即获得有关知识经济定义的列表。即获得有关知识经济定义的列表。参见教材参见教材13.2.2(P281-282)现代信息查询与利用GoogleGoogle高级检索技术高级检索技术 Site用于表示在某个特定的域或站点中进行搜索,用于表示在某个特定的域或站点中进行搜索, 输入格式为:输入格式为:“关键词关键词site:域或站点域或站点”, site后的冒号为英文字符,后的冒号为英文字符,而且,冒号后不能有空格,而且,冒号后不能有空格, 如输入如输入“留学留学site:”表示搜索中文教育科研网站(表示搜索中文教育科研网站()上有关留学的的页面。)上有关留学的的页面。 Cache在原始网页暂时不可用(比如该网页的服务在原始网页暂时不可用(比如该网页的服务器发生故障)时,用于检索该网页的器发生故障)时,用于检索该网页的cache版本。版本。 输入格式为输入格式为“cache: 网页网页URL”,中间不能有空格,如,中间不能有空格,如“cache:” 显示显示Google主页的主页的cache页面。页面。 参见教材参见教材13.2.2(P281-282)现代信息查询与利用GoogleGoogle高级检索技术高级检索技术 Info表示返回所有可供该特定表示返回所有可供该特定URL使用的信息使用的信息 输入格式为输入格式为“info: 网页网页URL”,中间不能有空格,中间不能有空格, 如如“info:” 将显示与将显示与Google主页相主页相关的信息。关的信息。 link表示将显示所有指向该网址的网页表示将显示所有指向该网址的网页 格式为格式为“link: URL地址地址”。 “link:”后面无空格;后面无空格; 如如“link:”表示搜索表示搜索Google中文中文 参见教材参见教材13.2.2(P281-282)现代信息查询与利用GoogleGoogle高级检索技术高级检索技术 具有特殊功能的查询字包括具有特殊功能的查询字包括 filetypefiletype、definedefine、sitesite、cache cache 、info info 、linklink,inurlinurl,allinurlallinurl,intitleintitle,allintitleallintitle。FiletypeFiletype用于查找特定的文档,用于查找特定的文档,输入格式为:输入格式为:“关键词关键词 filetype:filetype:* * *”,* * *为文档类型,为文档类型,GoogleGoogle可可以支持以支持1313种非种非HTMLHTML文件的搜索,包括文件的搜索,包括PDFPDF文档、文档、icrosoft Office icrosoft Office (doc, ppt, xls, rtf(doc, ppt, xls, rtf)、)、Shockwave Flash (swf)Shockwave Flash (swf)、PostScript PostScript (ps)(ps)和其它类型文档;和其它类型文档;如输入如输入“冒险岛冒险岛filetype:swf”filetype:swf”即搜索有关冒险岛的即搜索有关冒险岛的FlashFlash文档。文档。DefineDefine用于查看字词或词组的定义用于查看字词或词组的定义,输入格式为:输入格式为:“definedefine词词 ”中间有一个空格,该操作符与您需要中间有一个空格,该操作符与您需要其定义的字词之间不留空格,其定义的字词之间不留空格,如如“definedefine知识经济知识经济”即获得有关知识经济定义的列表。即获得有关知识经济定义的列表。 Info表示返回所有可供该特定表示返回所有可供该特定URL使用的信息使用的信息 输入格式为输入格式为“info: 网页网页URL”,中间不能有空格,中间不能有空格, 如如“info:” 将显示与将显示与Google主页相主页相关的信息。关的信息。 link表示将显示所有指向该网址的网页表示将显示所有指向该网址的网页 格式为格式为“link: URL地址地址”。 “link:”后面无空格;后面无空格; 如如“link:”表示搜索表示搜索Google中文中文 inurl表示搜索结果将被限定于那些在表示搜索结果将被限定于那些在URL中包含该字的文中包含该字的文件件 格式为格式为“inurl:关键词关键词”,“inurl:”后面不能有空格。后面不能有空格。 如如“inurl: 发现号发现号”表示返回的网页链接中包含发现号的资料;表示返回的网页链接中包含发现号的资料; 如如“inurl: photo Shuttle Discovery site: ntrs.nasa.gov”表示在美国航表示在美国航空航天宇航局网站上搜索有关发现号航天飞机的照片;空航天宇航局网站上搜索有关发现号航天飞机的照片; “inurl: photo发现号发现号”表示在网页上搜索有关发现号的照片;第一个关表示在网页上搜索有关发现号的照片;第一个关键词多采用资源名称如键词多采用资源名称如mp3、gallary、album、news、photo、image等,用第二个关键词确定具体专题。等,用第二个关键词确定具体专题。 allinurl: 表示搜索结果将被限定于那些在表示搜索结果将被限定于那些在URL中包含所有中包含所有查询字的文件。查询字的文件。 如,如, “allinurl: 布达拉宫布达拉宫 西藏西藏”表示搜索结果为在表示搜索结果为在URL中同时具有中同时具有“布布达拉宫达拉宫”和和“西藏西藏”的文件的文件。 在您的查询中的每个字之前放置在您的查询中的每个字之前放置“inurl:” 等同于在您所等同于在您所有查询字之前加有查询字之前加 “allinurl:”。 参见教材参见教材13.2.2(P281-282)现代信息查询与利用GoogleGoogle高级检索技术高级检索技术 intitle将搜索结果限定于那些在将搜索结果限定于那些在HTML标题中包含标题中包含该字的文件。该字的文件。 输入格式为:输入格式为:“intitle: 关键字关键字关键字关键字”,第二个词也可不输入第二个词也可不输入,“intitle:”和字之间不能有空格。和字之间不能有空格。 如如“intitle:布达拉宫布达拉宫 西藏西藏” 表示搜索结果为在表示搜索结果为在HTML标题中提标题中提及布达拉宫,而在文件中的任何地方(既可以是标题也可以是及布达拉宫,而在文件中的任何地方(既可以是标题也可以是文件的任何其他位置)提及西藏的文件。文件的任何其他位置)提及西藏的文件。 allintitle 表示搜索结果限定在那些其表示搜索结果限定在那些其HTML标题标题中包含所有查询字的文件中,中包含所有查询字的文件中, 如如“ allintitle:布达拉宫布达拉宫 西藏西藏”表示搜索结果为在表示搜索结果为在HTML标题中标题中同时包含同时包含“布达拉宫布达拉宫”和和“西藏西藏”的文件。的文件。 在您的查询中的每个字之前放置在您的查询中的每个字之前放置 “intitle:” 等等同于在您所有查询字之前加同于在您所有查询字之前加 “allintitle:”。 参见教材参见教材13.2.2(P281-282)现代信息查询与利用雅虎(雅虎(yahooyahoo)的搜索技巧)的搜索技巧如何使搜索结果中的如何使搜索结果中的查询词不被拆开查询词不被拆开?在查询词前后加上双引号(中文双引号、英文双引号都可以在查询词前后加上双引号(中文双引号、英文双引号都可以) 如何查找更如何查找更精确的搜索结果精确的搜索结果?使用多个查询词搜索、使用减号、使用双引号:使用多个查询词搜索、使用减号、使用双引号: 如何限定搜索结果的如何限定搜索结果的语言语言? 雅虎搜索支持多达雅虎搜索支持多达3838种世界各地的语言种世界各地的语言英语不好也可以英语不好也可以轻松浏览英文网页轻松浏览英文网页么?么? 当搜索结果的标题右侧出现当搜索结果的标题右侧出现“英译汉英译汉”链接时,点击便可查看翻译链接时,点击便可查看翻译成中文的网页。成中文的网页。现代信息查询与利用雅虎(雅虎(yahooyahoo)的搜索技巧)的搜索技巧现代信息查询与利用搜狗搜狗(sogou)(sogou)的搜索技巧的搜索技巧
展开阅读全文