应用层协议(动态网页)课件

上传人:风*** 文档编号:252585536 上传时间:2024-11-18 格式:PPT 页数:31 大小:163.81KB
返回 下载 相关 举报
应用层协议(动态网页)课件_第1页
第1页 / 共31页
应用层协议(动态网页)课件_第2页
第2页 / 共31页
应用层协议(动态网页)课件_第3页
第3页 / 共31页
点击查看更多>>
资源描述
,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,第,6,章,应用层协议(,动态网页),计算机网络,周继鹏,第6章 应用层协议(动态网页)计算机网络周继鹏,1,万维网,万维网为计算机网络的普及起到了至关重要的作用,.,万维网,=HTTP+HTML,HTML,写的网页是静态网页,.,HTML,的优点,:,标记数量较少:,不到,100,个,语法要求宽松:,大小写不敏感,控制标记可不配对,万维网万维网为计算机网络的普及起到了至关重要的作用.,2,HTML,实例,HTML,文档是一种任何文本编辑器可以创建的文本文件,它们由,.html,或,.htm,为后缀。只有通过浏览器才可以对,HTML,文档进行相应的解释。,一个,HTML,实例,这是我制作的第一个网页,和,之间的是一级标题,-,这是第二级标题,这是第三级标题,一共可定义六级标题,正文段落,和,之间是文档的一个段落,-,这只是刚刚开始,还有很多东西要学哦,。,返回主页,和,之间,定义了一个超链接,-,HTML实例,3,1、,动态页面技术,静态文档,是指该文档创作完毕后就存放在万维网服务器中,在被用户浏览的过程中,内容不会改变。,动态文档,是指文档的内容是在浏览器访问万维网服务器时才由应用程序动态创建。,动态文档和静态文档之间的主要差别,体现在服务器一端。这主要是文档内容的生成方法不同。而从浏览器的角度看,这两种文档并没有区别。,1、动态页面技术静态文档是指该文档创作完毕后就存放在万维网,4,万维网服务器功能的扩充,(1)应增加另一个应用程序,用来处理浏览器发来的数据,并创建动态文档。,(2)应增加一个机制,用来使万维网服务器把浏览器发来的数据传送给这个应用程序,然后万维网服务器能够解释这个应用程序的输出,并向浏览器返回,HTML,文档。,万维网服务器功能的扩充(1)应增加另一个应用程序,用来处理,5,扩充了功能的万维网服务器,万维网服务器,浏览器,程序,万维网客户,服务器,程序,HTTP,数据库,CGI,HTTP,请求报文,请求文档,CGI,程序创建,动态文档,响应动态文档,HTTP,响应报文,扩充了功能的万维网服务器万维网服务器浏览器万维网客户服务器H,6,通用网关接口,CGI,(Common Gateway Interface),CGI,是一种标准,,它定义了动态文档应如何创建,输入数据应如何提供给应用程序,以及输出结果应如何使用。,万维网服务器与,CG I,的通信遵循,CGI,标准。,“,通用,”:,CGI,标准所定义的规则对其他任何语言都是通用的。,“,网关,”:,CGI,程序的作用像网关,。,“,接口,”:,有一些已定义好的变量和调用等可供其他,CGI,程序使用。,通用网关接口 CGI(Common Gateway Int,7,CGI,程序,CGI,程序的正式名字是,CGI,脚本,(,script)。,“,脚本,”,指的是一个程序,它被另一个程序(解释程序)而不是计算机的处理机来解释或执行。,脚本运行起来要比一般的编译程序要慢,因为它的每一条指令先要被另一个程序来处理(这就要一些附加的指令),而不是直接被指令处理器来处理。,CGI 程序CGI 程序的正式名字是 CGI 脚本(scri,8,CGI,的使用形式,Display the Date,客户机(浏览器)如何与(,Web,),服务器通信,建立一个连接,即打开一个,Socket,,,将申请内容写入它;,申请一般通过,http,的方法,get,post,,建立一个申请头信息头,一并提交;,服务器根据浏览器的要求将,CGI,的结果信息返送回客户机(已被加工好的.,HTM,文,档)。,CGI,如何与服务器通信,CGI,从环境变量(用,GET,),和标准输入(用,POST,),获得信息,如:,QUERY_STRING,:URL,后,第一个“?”后的信息串,用,URL,的编码规则,PATH_INFO:,在,CGI,程序中用相对路径来传递参数,PATH_TRANSLATED:,在,CGI,程序中用绝对路径来传递参数,环境变量有很多。详见下页表(,CGI,环境变量,)。,CGI,如何返回信息,(1),MIME,完整类型:首行告诉内容,,text/html,text/plain(ASCII),(2),引用另一个文档:给出引用文档或所在服务器的,URL,(3),直接返回:有一种称为,NPH-Script(No-Parse-Header),描述程序,直接,返回信息给客户机。,CGI的使用形式,9,CGI,环境变量.,环 境 变 量,意 义,SERVER_NAME CGI,脚本运行时的主机名和,IP,地址.,SERVER_SOFTWARE,你的服务器的类型如:,CERN/3.0,或,NCSA/1.3.,GATEWAY_INTERFACE,运行的,CGI,版本.对于,UNIX,服务器,这是,CGI/1.1.,SERVER_PROTOCOL,服务器运行的,HTTP,协议.这里当是,HTTP/1.0.,SERVER_PORT,服务器运行的,TCP,端口,,通常,Web,服务器是80.,REQUEST_METHOD POST,或,GET,取决于你的表单是怎样递交的.,HTTP_ACCEPT,浏览器能直接接收的,Content-types,.,可以有,HTTP Accept header,定义,HTTP_USER_AGENT,递交表单的浏览器的名称、版本 和其他平台性的附加信息。,HTTP_REFERER,递交表单的文本的,URL,,不是所有的浏览器都发出这个信息,,PATH_INFO,附加的路径信息,由浏览器通过,GET,方法发出.,PATH_TRANSLATED,在,PATH_INFO,中系统规定的路径信息.,SCRIPT_NAME,指向这个,CGI,脚本的路径,是在,URL,中显示的(如,/,cgi-bin/thescript).,QUERY_STRING,脚本参数或者表单输入项(如果是用,GET,递交).,QUERY_STRING,包含,URL,中,问号后面的参数.,REMOTE_HOST,递交脚本的主机名,这个值不能被设置.,REMOTE_ADDR,递交脚本的主机,IP,地址.,REMOTE_USER,递交脚本的用户名.如果服务器的,authentication,被激活,这个值可以设置。,REMOTE_IDENT,如果,Web,服务器是在,ident(,一种确认用户连接你的协议)运行,递交表单,的系统也在运行,ident,这个变量就含有,ident,返回值.,CONTENT_TYPE,表单是用,POST,递交,这个值将是,application/x-www-form-urlencoded.,在上载文件的表单中,content-type,是个,multipart/form-data.,CONTENT_LENGTH,对于用,POST,递交的表单,标准输入口的字节数.,CGI 环境变量.,10,CGI,程序的编写与执行,分析问题,规划界面,编写程序,使用语言:,C,C+,VB,VC,JAVA,PERL,SHELL,,COBOL,BASIC,FOTRAN,ASP,PHP,JSP,HTML:FORM,CGI程序的编写与执行,11,2、万维网上的信息检索系统,搜索引擎的工作原理,在万维网中用来进行搜索的程序叫做,搜索引擎。,要在万维网上进行检索,就要将所有万维网页面标题中的关键词作成索引。,搜索引擎的 产生背景,INTERNET/WWW/MOSAIC/NETSCAPE/IE,用户十亿/自由世界,静态页面 /动态页面,多种信息工具/不同的标准/风格/随意/动态数据,信息杂乱无序/网上信息爆炸/信息海洋,知识宝库/信息渣滓,如何获得信息?/手工读主页?,2、万维网上的信息检索系统搜索引擎的工作原理,12,全文检索搜索和分类目录搜索,全文检索搜索引擎,是一种纯技术型的检索工具。它的工作原理是通过搜索软件到因特网上的各网站收集信息,找到一个网站后可以从这个网站再链接到另一个网站。然后按照一定的规则建立一个很大的在线数据库供用户查询。,用户在查询时,只要输入关键词,,,就从已经建立的索引数据库上进行查询(并不是实时地在因特网上检索到的信息)。,分类目录搜索引擎,并不采集网站的任何信息,而是利用各网站向搜索引擎提交的网站信息时填写的关键词和网站描述等信息,经过人工审核编辑后,如果认为符合网站登录的条件,则输入到分类目录的数据库中,供网上用户查询。,分类目录搜索也叫做分类网站搜索。,全文检索搜索和分类目录搜索全文检索搜索引擎是一种纯技术型的检,13,搜索引擎的出现,搜索引擎是,国际互连网上,解决,信息发现和查询的,需要牵引,一种,技术或工具,技术驱动,经济刺激,最著名的全文检索搜索引擎:,Google,(谷歌),(),百度,(),最著名的分类目录搜索引擎:,雅虎,(),雅虎中国,(),新浪,(),搜狐,(),网易,(),搜索引擎的出现,14,搜索引擎的分类,按查询方法来分:,(1),分类列表式搜索引擎,大量人力浏览页面,手工分类,整理后建立分类式目录索引,覆盖面窄,但是,比较精,Yahoo,是典型,(2),基于巡视软件的搜索引擎,典型:,AltaVista(DEC,2.5,亿页),Lycos(,梅隆,0.5,亿页),Exite(Architext soft 2.14,亿页)等,应用最广泛,利用巡视软件,在,Wold Wide Web,上按照给定的规则漫游,分析并返回遇到的文档信息,这些信息进一步抽样、加工存入索引库,而搜索引擎提供一定的查询界面和算法,帮助诱导用户获得所需信息。,搜索引擎的分类,15,搜索引擎的原理与功能,搜索引擎是,与因特网相连(一台或多台),服务器上,工作的,一组,程序,。,巡视软件,(,Robot,Web wander,Webcrawler,Spider,),在预先设定的,WWW,范围内(如给定,IP,地址范围)漫游,按照一定的协议(如,HTTP,协,议)、依据特定的规则搜集位于,WWW,上的信息资源,。,对收集到的信息(如网页),按照特定的方法进行,标引,(标题,正文,文件大小、,日期、链接、文摘信息等),将结果,信息保存,到索引库里,查询界面,系统为用户提供了,查询界面,,用户可根据界面形式,填入要求,向引擎提交,检索软件,检索软件按用户查询要求,查找符合用户所需信息,并将结果送客户机,显示结果,按一定格式,显示结果,信息,搜索引擎的主要功能:,信息发现,信息标引,信息存储,信息检索,信息显示,搜索引擎的原理与功能,16,搜索引擎的缺陷及新技术,1、缺陷,使用上:,简单方式检出,内容太多,且,有的无关,,高级方式太复杂,,检不出东西,;,YAHOO,比较受欢迎。事实上,,搜索引擎是面向整个网络信息资源;应面向用户,搜索引擎的体系结构:,巡视软件在网上爬,无法适应网上资源的多、变、用户的需求;,搜到的东西太多,又不断扩张,都取回加工,网络流量大;,标引智能低,无关东西混入,检索量太大,占据带宽;,HTTP,无通知变化之机制,对动态的网络信息世界,尽管采用了“轮询”机制,也难保持信息的一致性和最新性;,集中式索引库和查询服务器,成为系统瓶颈。,信息的创新和更新、使用和消费都是分布式,而其中介却是集中式,定会矛盾。,2、新技术,(1)分布式体系结构及,Agent,分布式,搜索引擎,体系结构的研究与开发,应与,Agent,技术密切配合,Agent,重点是,Agent,的组织与功能分配、知识表示与处理、,Agent,通信,(2)信息服务的智能化、个性化,用户检索习惯的识别、自然语言理解、提问式的智能宽展、排序、反馈、综合,(3)多媒体信息检索,多媒体信息的搜集、标引,基于内容的分析、编码、特征提取、检索等,(4)资源表达的规范,资源内容表达的规范化、
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!