贵州新华电脑学院互联网应用技术.ppt

上传人:max****ui 文档编号:3270910 上传时间:2019-12-10 格式:PPT 页数:59 大小:2.59MB
返回 下载 相关 举报
贵州新华电脑学院互联网应用技术.ppt_第1页
第1页 / 共59页
贵州新华电脑学院互联网应用技术.ppt_第2页
第2页 / 共59页
贵州新华电脑学院互联网应用技术.ppt_第3页
第3页 / 共59页
点击查看更多>>
资源描述
第5章网络搜索引擎,2,本章目标,了解搜索引擎基本原理熟悉各种搜索引擎掌握谷歌、百度、雅虎等搜索引擎的使用,3,5.1网络搜索引擎概述,5.1.1WWW信息资源及其特点5.1.2网络搜索引擎的兴起与发展5.1.3网络搜索引擎的类型,4,5.1.1WWW信息资源及其特点,什么是WWW?WWW全称为WorldWideWeb,通常简称为Web,俗称为万维网。WWW的特点:1.使用超文本技术2.使用HTML语言3.采用C/S模式4.方便灵活,功能强大,5,5.1.2网络搜索引擎的兴起与发展,搜索引擎的定义:搜索引擎是一种能够通过Internet接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统。搜索引擎的主要任务:1)信息搜集。2)信息处理。3)信息查询。网络搜索引擎的兴起与发展,6,5.1.3网络搜索引擎的类型,1.按照检索机制划分关键词检索型目录浏览型2.按照搜索引擎的数据收录范围划分综合型专题型特殊型3.按照包含检索工具的数量划分独立型搜索引擎集合型搜索引擎4.按照工作方式划分全文搜索引擎目录索引搜索引擎元搜索引擎,7,5.2网络搜索引擎的工作原理,5.2.1搜索引擎的基本结构5.2.2搜索引擎的数据采集5.2.3搜索引擎的数据提取5.2.4搜索引擎的数据组织5.2.5搜索引擎的数据检索,8,5.2.1搜索引擎的基本结构,9,5.2.2搜索引擎的数据采集,自动采集人工采集,10,5.2.3搜索引擎的数据提取,搜索引擎的数据提取主要指对所采集到的网页进行的分析与标引工作。抽词-词频语种,11,5.2.4搜索引擎的数据组织,搜索引擎的数据组织首先是指利用强有力的数据库管理系统(DBMS)来组织所采集、标引的网页信息,形成索引数据库,并存放在特定的计算机存储器中。数据库中一般包含有成千上万条的数据记录,而每一条记录(对应于一个网页)原则上会包括关键词、网页摘要、网页URL等不同的字段。由于各个搜索引擎的标引原则和数据提取方式不同,它们的索引记录内容可能很不相同,即使是对同一个网页,往往也是如此。,12,5.2.5搜索引擎的数据检索,数据检索模块主要包括以下4个部分:1.检索界面2.检索策略3.检索匹配4.组织检索结果,13,5.3网络搜索引擎的信息检索方法,5.3.1基本检索方法5.3.2高级检索方法5.3.3其他相关或辅助性检索方法,14,5.3.1基本检索方法,布尔逻辑算符ANDORNOT连接符+-截词符*邻近符空格、逗号、括号、引号的作用限定字段检索,15,5.3.2高级检索方法,自然语言检索相似检索3.概念检索,16,5.3.3其他相关或辅助性检索方法,1.检索结果的排序输出2.查询与浏览相结合3.检索结果的翻译与多语种检索,17,5.4百度(baidu)搜索引擎,5.4.1百度公司简介和搜索引擎5.4.2百度的检索使用方法5.4.3百度的网页和新闻搜索5.4.4百度的MP3搜索5.4.5百度的图片和视频搜索5.4.6百度帖吧和百度知道,18,5.4.1百度公司简介和搜索引擎,百度公司是中国互联网领先的软件技术提供商和平台运营商。中国提供搜索引擎的主要网站中,超过80%由百度提供。百度的起名,来自于“众里寻她千百度”的灵感,它寄托着百度公司对自身技术的信心。,19,5.4.2百度的检索使用方法基本检索,(1)“与”运算,增加搜索范围。(2)“非”运算,减除无关资料。(3)“或”运算,并行搜索。(4)使用双引号或书名号进行精确搜索。(5)用好百度快照。(6)相关检索(7)英汉互译词典(8)计算器和度量衡转换(9)股票、列车时刻表和飞机航班查询(10)百度的其它辅助功能拼音提示错别字提示,20,5.4.2百度的检索使用方法高级检索,(1)在指定网站内搜索检索算符:site基本查询语法:关键字+site+:+网站名称或国别(2)在标题中搜索检索算符:intitle基本查询语法:intitle+:+关键字1+空格+关键字2(3)在url中搜索检索语:inurl基本查询语法:inurl+:+关键字1+空格+关键字2(4)特定类型文件的搜索(filetype)检索算符:filetype基本查询语法:关键字1+空格+filetype+:+文件类型标识,21,5.4.3百度的网页和新闻搜索,1.百度网页搜索百度是中国互联网用户最常用的搜索引擎,每天完成6000多万次搜索;也是全球最大的中文搜索引擎,可查询6亿中文网页。,22,5.4.3百度的网页和新闻搜索,2.百度新闻搜索百度新闻频道每天动态抓取十万条新闻,新闻来源于500多个新闻站点,其中包括了政府机构、行业媒体网站、各类媒体的网络版和专业的新闻站点,比普通的新闻网站更新量至少多好几倍。,23,5.4.4百度的MP3搜索,百度中文搜索引擎是世界最大的中文搜索引擎,百度在天天更新的1亿2千万中文网页中提取MP3下载链接,建立庞大的MP3歌曲下载链接库。(1)在百度MP3搜索引擎主页(http:/,24,25,5.4.4百度的MP3搜索,(3)精确关键词。搜歌曲直接用歌曲名搜索,如果歌曲名太常见,搜索结果很多,可以用歌曲名加歌手名一起搜,在歌手名和歌曲名之间要加一空格。(4)利用歌词搜索。百度歌词搜索引擎能够搜到歌词,还能用来寻找MP3。(5)利用网页搜索。当我们不知道歌名,也不知道歌手名,只知道一些模糊信息,可以先在百度1亿两千万的中文网页搜索。(6)如果大家在百度的MP3搜索上没有搜到你要找的歌曲,可以用“歌曲名+歌手名+下载”或“歌曲名+MP3”,在“百度网页搜索”中查找,在关键词之间要加一空格。,26,27,5.4.5百度的图片和视频搜索,百度图片搜索百度图片搜索引擎是世界上最大的中文图片搜索引擎,百度从数十亿中文网页中提取各类图片,建立了世界第一的中文图片库。,28,5.4.5百度的图片和视频搜索,2.百度视频搜索百度视频搜索是百度汇集几十个在线视频播放网站的视频资源而建立的庞大视频库。百度视频搜索拥有最多的中文视频资源,提供用户最完美的观看体验。,29,5.4.6百度帖吧和百度知道,1.百度知道百度知道可以帮助我们了解到现实生活中遇到的各种难题。它类似于我们平时所用到的BBS。我们要想使用百度知道只需在“http:/,30,5.5谷歌(google)搜索引擎,5.5.1Google简介5.5.2Google的检索使用方法5.5.3Google的分类目录浏览5.5.4Google的多语种检索5.5.5Google的博客检索,31,5.5.1Google简介,Google最初于1998年由美国Stanford大学的两位博士生LarryPage和SergeyBrin创建。Google总部设在美国加州的MountainView。Google的名称据说取自于一种游戏名“googol”,其意思代表1后面跟有100个零。,32,5.5.2Google的检索使用方法,1.基本检索方式Google的查询简洁方便,用户仅需在检索输入框输入需要查询的关键词,单击【GoogleSearch】按钮或按回车键就可以了。Google查询不需要使用“AND”算符。Google不支持“OR”运算,以避免检到一大批无关的内容。Google也不支持截词检索。Google的查询不区分英文大小写,所有字母均当做小写处理。查询专用词语时,可使用双引号(“”),以便准确检索。Google中冒号“:”,33,2.检索结果的组织与显示Google对每条结果显示的内容有网页标题、摘要、语种、URL、时间、文本大小等,而全部结果按照Google独有的页面链接专利技术(PageRank)进行排序输出。在每条结果后面,还有两个功能按钮值得注意。“网页快照”:单击此按钮,用户可查看Google保存的该网页的快照内容。Google为用户储存了大量的应急网页,以避免当需要浏览某个结果的页面时,因为该页面站点忙碌或其他原因而不能顺利登录。“类似网页”:单击此按钮,Google便会开始寻找与这一网页性质相似的网页,一般都是同一级别的网页。,5.5.2Google的检索使用方法(续),34,在Google主页上选择【高级搜索】,即可进入其高级检索界面。在这里,Google为检索者提供了更加丰富、细致的信息查询功能。,5.5.2Google的检索使用方法(续),35,Google将收集到的所有Web信息组织到14个不同类目(categories)中,如休闲、体育、健康、参考、商业、地区、家庭、新闻、游戏、社会、科学、艺术、计算机、购物等。如图5-25所示。用户可按照这个类目结构进行浏览,并可在自己感兴趣的类目层次中提交关键词,快速查询相关信息。,5.5.3Google的分类目录浏览,36,在Google的主页上,单击【语言工具】按钮,即可以进入Google多语种检索的设置界面。,5.5.4Google的多语种检索,37,“博客搜索”是Google搜索技术针对博客内容所提供的服务。Google充分相信博客所代表的个人创作和发布潮流。我们希望能通过“博客搜索”帮助用户更有效的探索博客世界,从而激发更多的人加入这一潮流。,5.5.5Google的博客检索,38,5.6Yahoo!搜索引擎,5.6.1Yahoo!简介5.6.2Yahoo!的分类目录浏览5.6.3Yahoo!的关键词检索,39,Yahoo!是Internet上最受欢迎的搜索引擎之一,也是访问频率最高的门户网站之一。它是由美国斯坦福大学的华裔博士杨致远与他的同学DavidFilo于1994年开发的。目前由美国多家公司与个人资助。Yahoo具有覆盖范围广、连接速度快、数据容量大、使用方法简单等特点。中文雅虎是美国“Yahoo!”公司于1998年5月推出的中文搜索引擎,提供中文简体与中文繁体两种版本。中国大陆的站点一般使用简体中文,而香港与台湾地区的站点一般使用繁体中文。中文雅虎并非英文版的全文翻译,而是收录了数万个中文的Internet站点,按照英文版的分类方法以14个类目列出,提供Internet上的中文站点信息检索服务。,5.6.1Yahoo!简介,40,41,中文雅虎主页的顶端是一些常用的的链接,例如购物、黄页、寻人、城市地图与旅行社等;中文雅虎的分类目录位于其主页的中部。用户可以根据查找的内容所属的类别在分类目录中逐级逐类地选择相应的类目,经过多次选择后,就可以访问到包含所查找内容的站点。,5.6.2Yahoo!的分类目录浏览,42,如果用户已知要查找内容的主题概念,就可以利用关键词检索方式。中文雅虎支持以下几种限定检索操作符:(1)用引号(“”)来查询完全符合关键词字符串的网站。(2)在关键词前加“t:”,搜索引擎仅限在网站名称中查找。(3)在关键词前加“u:”,搜索引擎仅限在URL中查找。(4)在关键词前加“+”,查询结果中一定要出现“+”号后面的字符串。(5)在关键词前加“-”,查询结果中一定不能出现“-”号后面的字符串。,5.6.3Yahoo!的关键词检索,43,5.7其他中英文搜索引擎简介,5.7.1英文搜索引擎5.7.2中文搜索引擎,44,1.Excite(http:/,5.7.1英文搜索引擎,45,2.Lycos(http:/WWW,5.7.1英文搜索引擎,46,搜狐搜狗搜索(http:/)搜狗搜索是搜狐公司旗下网站。搜狐是爱特信公司创办的大型中文门户网站,于1998年2月正式推出。2000年9月搜狐收购国内最大的年轻人社区网C,成为中国最大的门户网站。搜狐公司从中国首家大型分类查询搜索引擎,发展成为最受用户喜爱的综合门户网站。1999年至今,搜狐公司连续推出新闻中心、体育、财经、IT、汽车、生活、教育、求职、搜狐商城等17个内容频道,为广大网民提供网上社交、学习、生活和购物的理想场所,成为中国网络用户进入互联网的最佳渠道。,5.7.2中文搜索引擎,47,48,2.新浪爱问搜索(,5.7.2中文搜索引擎,49,50,网易有道搜索(http:/,5.7.2中文搜索引擎,51,52,5.7其他中英文搜索引擎简介,5.8.1SEO是什么5.8.2SEO优化5.8.3SEO优化提示,53,SEO是SearchEngineOptimization的缩写。英文描述是:TousesometechnicstomakeyourwebsiteinthetopplacesinSearchEnginewhensomebodyisusingSearchEnginetofindsomething翻译成中文就是“搜索引擎优化”一般可简称为搜索优化。,5.8.1SEO是什么,54,SEO主要分为站外SEO和站内SEO。1.站外SEO优化站外SEO又说成是脱离站点的搜索引擎技术,命名源自外部站点对BLOG在搜索引擎排名的影响,这些外部的因素是超出BLOGGER的控制的。最有用功能最强大的外部站点因素就是反向链接。,5.8.2SEO优化,1.站外SEO优化,(1)高质量的内容(2)分类目录(3)BLOG的内部链接(4)买链接(5)交换链接,55,2.站内SEO优化,(1)写丰富关键词的内容(2)主题BLOG(3)站点设计(4)站点的内部链接(5)有规律的更新(6)导出链接(7)明智的选择域名(8)尽可能早的注册域名,56,(9)每篇文章的主题(10)写适宜长度的文章(11)避免内容重复(12)Ping(13)提交BLOG的RSS到MyYahoo(14)目录的数量(15)提交到搜索引擎,57,SEO是依据通过对搜索引擎长期摸索、观察得出来的技术与经验,利用搜索引擎录取网站的规则,将网站的整体结构、网站布局、关键词分布及密度进行优化,使网站对搜索引擎的抓取有友好性,从而进行搜索引擎优化,达网站到提高排名效果。由于搜索引擎的排名规则及算法是不固定的,是在不断改变中的,而且这些规则和算法又是绝对的商业机密,所以是不可能达到保证排在某几位的效果的。据了解,目前有很多的人打着SEO的旗号,自称可以将您的网站排在百度、Google的第一位,而做法则是作弊的手段,使您的网站的确可以在短时间内升到很靠前的位置。但是搜索引擎是可以识别这些手段被加以惩罚的。被惩罚的网站,最严重的是您的网站在各大搜索引擎完全消失,甚至不再录取。所以希望大家谨慎分辨,不要为了一时之利,使您的网站成为作弊者的牺牲品。,5.8.3SEO优化提示,58,本章总结,搜索引擎基本原理中英文搜索引擎谷歌、百度、雅虎等搜索引擎的使用SEO入门,59,本章总结,无线网络相关技术网络存储的基本概念(DAS、NAS、SAN)互联网数据中心和网络服务器,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!