互联网和WWW:电子商务的基础设施

上传人:zhan****gclb 文档编号:57192286 上传时间:2022-02-23 格式:DOCX 页数:24 大小:47.54KB
返回 下载 相关 举报
互联网和WWW:电子商务的基础设施_第1页
第1页 / 共24页
互联网和WWW:电子商务的基础设施_第2页
第2页 / 共24页
互联网和WWW:电子商务的基础设施_第3页
第3页 / 共24页
点击查看更多>>
资源描述
第二章 互联网和WWW:电子商务的基础设施引言 德尔(Dell)计算机公司是PC机销售历史上最成功的一家零售商。作为世界上最大的计算机制造商之一,德尔公司的年销售额已超过90亿美元。德尔的顾客包括各种公司、政府机构、教育机构和个人用户。90年代初,德尔通过免费电话向顾客直接销售计算机。几年后,德尔把其销售业务扩展到互联网,目前的海外销售额有相当一大部分是通过互联网实现的。成千上万的消费者现在可以访问公司的WWW网站并通过互联网订货。最近,德尔公司创造了一天销售650万美元的日销售记录。使用WWW不仅增加了公司的销售额,而且降低了公司的管理费用。通过WWW网站直销意味着参与交易的人将大大减少。技术支持(包括一些常见问题的解答)也可以通过WWW来实现。WWW网站是德尔公司21世纪发展战略的一个重要组成部分。公司的管理人员预测,在未来的几年内,公司一半以上的销售额将在互联网上完成。这种快速增长的销售额背后是通讯设备和网络组成的基础设施、德尔的服务器和微软公司提供的电子商务软件。在选择硬件和软件时,还要考虑到其能力应能满足日益增多的顾客的需要。先进的WWW网站带来了滚滚的利润,德尔公司的前途一片光明。学习目标本章讲述:l 互联网和电子商务支持网络的基本网络结构。l 在互联网上开展商务活动、收发电子邮件的各种协议。l 跟踪、寻找和验证互联网主机网站的互联网实用程序。l 互联网的主要应用,包括电子邮件、Telnet和文件传输协议。l WWW标注语言的历史和应用,包括SGML、HTML和XML。l HTML的标记和链接。l WWW的客户机/服务器结构以及彼此之间的信息通讯。l 互联网、内部网和外部网的区别和联系。l 连入互联网的各种方法以及各自的成本和带宽。技术概况电子商务存在的前提是几项关键技术。最重要的技术当然是互联网,除了这种彼此连接的网络系统外,很多其他的硬件和软件也是重要的支持手段,这些硬件和软件包括数据库软件、网络交换中心和集线器、加密硬件和软件、多媒体支持工具,当然还包括WWW。把这些硬件和软件集成起来支持电子商务的方法日新月异,另外这些支持工具的发展速度也是极其迅速的。所有参与电子商务并希望在未来保持竞争优势的企业都必须及时地采用新出现的各种互联网新技术。WWW及其支持技术的快速发展要求企业不断灵活地调整它们在WWW 开展商务活动的方式。那些僵化不变的企业将很快丧失它们在WWW上的业务。在线消费者认为WWW网站的拙劣表现(如响应时间太长)会使他们放弃某些电子商务网站,转向响应更迅速的网站。电子商务未来的急剧发展要求企业寻找更快更有效的方式,来迎接蜂拥而至的网上顾客和日趋增加的企业间业务。对于那些正在策划电子商务战略的企业来说,这种投入的回报将是惊人的,网上业务量有时不到一年就会翻一翻。本章将介绍电子商务的支持技术。我们首先介绍数据路由选择和几种基础协议,这些协议的任务是在互联网上传输信息并把信息送到目的地。然后,我们将介绍互联网、WWW和电子商务的其他支持技术。包交换网网络化计算机的早期模式(可以追溯到50年代)起源于地方和长途电话公司。早期的大部分计算机网络是通过租用电话公司的线路来建立连接。当时,一个电话呼叫在打电话和接电话的人之间建立一个连接。一旦这个连接建立起来,数据就沿着这个路径进行传输。电话公司的交换设备(既可能是机械的也可能是计算机化的)选择特定的电话线,或称为线路,并把线路连接起来在打电话和接电话的人之间形成一条通路。这种中央控制的单线连接模式叫做线路交换。虽然线路交换模式非常适用于电话,但它对大的网络间或网络群中的子网络之间的数据交换并不适用。在每对发出者和接收者之间建立点到点的连接既不经济又难以管理。互联网采用一种既经济又易于管理的技术在两点之间传输数据。这种模式叫做包交换。在包交换网络中,文件和信息被分解成包,在这些包上用表示信息源和目的地的代码打上电子标签。这些包在网络中从一台计算机传输到另一台计算机,直至到达目的地。目的地的计算机把这些包集中起来,并把每包中的信息重新集合成原先的数据。在包交换中,每个包从源到目的地的最佳路径是由途经的各个计算机决定的。图2-1给出了一个包交换网。决定包的路径的计算机通常叫做路由器,确定最佳路径的程序叫做路由算法。包交换是在互联网上进行数据传输的方法,它有很多优点。其中一个优点是,长数据流可分解成易于管理的小数据包,小的数据包沿着大量不同的路径进行传输,避免了网络中的交通拥挤。另一个优点是,在数据包到达目的地后,更换受损数据包的成本较低,因为如果一个数据包在传输途中被改变了,只要重新传输这个数据包就可以了。图2-1 包交换网和信息包最早的包交换网叫做ARPANET,仅连接了几个大学和研究中心。这种实验性的广域网(WAN)在接下来的几年里逐渐成熟起来,它采用的是网络控制协议(NCP)。协议是一组规则的集合,它规定网络传输数据的格式和顺序,并检查这些数据中的错误。协议确定了数据的发送设备如何表示已经完成信息的发送,以及接收设备如何表示已经收到(或没收到)信息。在ARPANET(后来发展成为互联网)的发展过程中开发出的开放式体系结构思想包括四个要点(这四个要点对互联网的成功作出了很大的贡献):l 独立的网络在连入另外的网络时不需要任何变化。l 没有到达目的地的信息包必须从其源节点重新传输。l 路由器计算机不保留处理过的信息包的信息。l 对网络没有全球化的控制。TCP/IP互联网协议支持互联网基本操作的协议是传输控制协议(TCP)和互联网协议(IP)。这些协议是互联网的先驱文森特瑟夫(Vincent Cerf)和罗伯特卡恩(Robert Kahn)开发的。它们建立了一些基本规则来确定数据的网络传输方式以及建立和断开网络连接的方式。我们通常用缩写字母TCP/IP来表示这两种协议。TCP/IP是一种双层程序。它包括网络上的计算机用来建立和断开连接的规则。TCP控制信息在互联网传输前的打包和到达目的地后的重组。IP控制信息包从源到目的地的传输路径。IP处理每个信息包的所有地址信息,确保每个信息包都打上了正确的目的地地址标签。这两种协议一开始就在技术上优于ARPANET上使用的NCP,并逐渐代替了后者。图2-2表示了TCP/IP的结构。按照任务将协议划分成5个功能层,在互联网传输数据时,这五个功能是同时工作的。最低层,也是最基本的功能层是硬件层,它管理互联网的相关设备。最高层是应用层,它是互联网的服务程序运行的地方。每一层为上一层提供服务。虽然本书不介绍TCP/IP各层的全部细节,我们有必要指出一些重要内容在这个结构中的位置。例如,TCP协议在传输层工作,IP协议属于互联网层。图2-2 TCP/IP结构除了可以用于互联网,TCP/IP也可用于局域网(LAN)。局域网是把一些工作站和个人机连成一个网络,局域网一般位于一个特定的地理区域内。局域网中的每台计算机都有自己的中央处理器(CPU)来运行程序,但可用网络中其他计算机的数据和设备。通过这种方式,很多用户可以共享激光打印机和扫描仪等设备。TCP/IP协议是Windows 95/98和Windows 2000计算机的标准协议。互联网的概念第一次出现在1974年瑟夫和卡恩写的一篇关于TCP协议的文章中。因为TCP/IP协议的开发在互联网的历史中起到了至关重要的作用,很多人把文森特瑟夫称为互联网之父。IP地址和域名互联网地址可以用多种方式表示,但不管什么方式都必须被翻译成一个32位的数字,这个数字被称为IP地址。这些32位的数字以后会被淘汰,因为它们不能满足对互联网地址日益增长的需要。替代的IP地址将是一种128位的数字,将大大提高地址的容量。在互联网向目的地发送信息之前,IP协议需要对信息打包,包中既包括源IP地址,也包括目的地IP地址。IP数字(地址)一般写成四组圆点分隔的数字。这种地址称为点分四元组,如126.204.89.56。这样的地址惟一确定了一台连入互联网的计算机。这四组数字都是从0到255,因此可能的IP地址都是在0.0.0.0和255.255.255.255之间。一般来说,四组数中的第一组代表计算机所在的网络,剩下的数字代表这个网络上的一台特定的计算机(一个节点)。互联网的用户认为点分四元组标记法非常难以记忆。所以大部分用户使用一种名为统一资源定位符(URL)的命名约定。URL由名称和缩略语构成,比数字容易记忆。一个URL至少包括两个部分,至多包括四个部分。一个简单的两部分URL的前一部分表示互联网访问的资源所采用的协议名称,后一部分表示资源位置。例如,一个写成的URL表示:访问资源的协议是HTTP,这个资源是一台称为的计算机。另一种互联网协议是超文本传输协议(HTTP),这是传输和显示WWW页面的访问协议。同其他互联网协议一样,HTTP协议确定了访问互联网资源的方式。这种方法是用URL确定一个资源的地址,这个资源的地址必须转换成一个32位或128位的IP 地址。下一节我们将更详细地介绍HTTP。类似于和这样的地址称为域名。域名包括两个或以上的圆点分隔的单词。除“www”之外,域名越左面的部分越具体,从左到右越来越通用,域名最右部分是域名中最通用的部分。例如,域名psci.nebraska.edu包括五个部分,从左边开始,www表示这是一个WWW地址,breezy表示计算机系里多台计算机中的某一台,compsci表示计算机系,nebraska表示内布拉斯加大学,edu表示教育机构,它是一级域名。有些域名还包括国家代码,如果省略了国家代码,则表示美国。国家名也是一级域名。图2-3给出了一些一级域名的例子。域名含义com营利性商业组织edu教育机构gov政府组织mil军事部门net主要网络支持中心org非营利组织au澳大利亚ca加拿大de德国fr法国jp日本uk英国us美国图2-3 一些一级域名其他的互联网协议TCP/IP包括很多为用户提供服务的应用层协议。这些服务有时也称为应用服务,包括WWW页面显示、网络管理工具、远程登录、文件拷贝、电子邮件和目录服务。有些协议是很常用的,其他的一些TCP/IP应用服务则用得少一些。下面介绍几种常用的协议。HTTPHTTP是超文本传输协议的缩写,它是负责传输和显示WWW页面的互联网协议。最早的HTTP协议是1991年开发出来的,当时还非常简单,后来不断地完善。HTTP运行在TCP/IP模型(见图2-2)的应用层。和其他的互联网协议一样,HTTP采用客户机/服务器模式,即用户(客户机)的WWW浏览器打开一个HTTP会话并向远程服务器发出WWW页面请求。作为回答,服务器产生一个HTTP应答信息,并把它送回到客户机(请求者)的WWW浏览器。应答包括客户机服务器上显示过的页面。如果客户机确定收到的信息是正确的,就断开TCP/IP连接,HTTP会话就结束了。如果WWW页面含有电影、声音和图像等内容,客户机就对每个对象发出一个请求。这样,一个包含一种背景声音和三种图像的WWW页面就要求五个独立的服务器请求信息来检索四个对象背景声音和三种图像以及带有这些对象的页面。由于HTTP的用户数增长很快,HTTP对互联网有极其重要的影响。SMTP、POP和IMAP互联网上传送电子邮件是通过一套称为邮件服务器的程序和硬件管理并储存的。与个人计算机不同,这些邮件服务器及其程序必须每天24小时不停地运行。否则就不能收发邮件了。SMTP和POP是两个负责用客户机/服务器模式发送和检索电子邮件的协议。用户计算机上运行的电子邮件客户机程序请求邮件服务器进行邮件传输,邮件服务器采用简单邮件传输协议(SMTP)标准。很多邮件传输工具,如Eudora、UNIX mail和PINE等,都遵守SMTP标准并用这个协议向邮件服务器发送邮件。SMTP协议规定了邮件信息的具体格式和邮件的管理方式。SMTP向连入局域网的用户提供应用层的服务。POP是邮局协议的缩写,它负责从邮件服务器中检索电子邮件。它要求邮件服务器完成下面几种行动之一:从邮件服务器中检索邮件并从服务器中删除这个邮件;从邮件服务器中检索邮件但不删除它;不检索邮件,只是询问是否有新邮件到达。POP协议支持多用互联网邮件扩展(MIME),后者允许用户在电子邮件上附带二进制文件,如文字处理文件和电子表格文件等。在你阅读邮件时,POP命令所有的邮件信息立即下载到你的计算机上,不在服务器上保留。互联网信息访问协议(IMAP)是一种优于POP的新协议,也许有一天会取代POP。和POP一样,IMAP也能下载邮件、从服务器中删除邮件或询问是否有新邮件。但IMAP克服了POP的一些缺点。例如,它可以决定客户机程序请求邮件服务器提交所收到邮件的方式,请求邮件服务器只下载所选中的邮件而不是全部邮件。客户机可先阅读邮件信息的标题和发送者的名字再决定是否下载这个邮件。通过你的客户机电子邮件程序,IMAP可让你在服务器上创建并管理邮件文件夹或邮箱、删除邮件、查询某封信的一部分或全部内容,完成所有这些工作时都不需要把邮件从服务器下载到你的个人计算机上。FTP 文件传输协议(FTP)是TCP/IP 的组成部分,它在TCP/IP连接的计算机之间传输文件,采用的是客户机/服务器模式。FTP允许文件双向传输:从客户机到服务器或从服务器和客户机。FTP既可以传输二进制数据也可以传输ASCII码文本,你可在两种模式中任选一种。二进制数据是包括文字处理文档、电子表格、图像和其他数据的文件。ASCII码文本是只包含键盘输入字符的文件,不含有排版格式,这种文本和Windows的Notepad所创建的文件类型是一样的。有些版本的FTP允许传输EBCDIC码文件。EBCDIC是IBM发明的一种8位编码系统,它可用数字代表字符。IBM大型机和IBM微机用EBCDIC储存信息。FTP可以一次传输一个文件,也可以一次传输多个文件。FTP还可提供其他一些服务,如显示远程或本地计算机目录、改变客户机或服务器的现有活动目录、创建并移动本地或远程目录。FTP采用TCP协议及其内置错误控制功能来准确无误地把文件从一台计算机拷贝到另一台计算机。用FTP访问远程计算机要求你登录这个远程计算机。如果你在这台计算机上有一个账户,你可以向FTP提交你的用户名和口令。FTP于是同这台计算机远程建立连接并使你登录到在这台计算机上的账户。这种全权FTP访问方式可以使你向远程计算机发送文件并从远程计算机上下载文件。访问远程计算机的另一种途径是匿名FTP。匿名FTP允许你以客户的身份登录。输入匿名的用户名和口令(口令一般是你的电子邮件地址)可以使你访问远程计算机的部分内容。本章后面将讨论FTP的应用。互联网实用程序TCP/IP提供大量的实用程序和工具。很多实用程序帮助用户更有效地使用互联网。另外一些工具为互联网之外系统的用户提供帮助。在这些实用程序中,比较常用的有Finger、Ping、Tracert和VisualRoute。本节将介绍这几种有用的程序及其应用实例。每种实用程序都有多个不同的软件开发商提供。你可以在互联网上下载并试用你感兴趣的程序。本书在线版提供的TUCOWS和D等网站都可以让你访问到成千上万的程序。FingerFinger是一种在UNIX机上运行的互联网实用程序,它允许用户获取其他网络用户的有限信息。你可以发出一条Finger命令来确定哪些用户登录了某个网络,或得到网络上某个用户的更多信息。例如,你可以确定某个用户最后一次登录网络的时间和该用户输入系统的其他信息。出于隐私权和安全的考虑,很多组织不允许组织之外的用户使用Finger命令。例如,如果你向微软公司发出一条Finger命令(finger www.M),你将收不到任何回复。很多电子邮件程序含有内置的Finger程序,所以你可在读电子邮件的时候发送Finger命令。图2-4给出了一个Finger命令的实例及其输出结果。Finger命令的输出结果通常有五列。图2-4 Finger程序的输出结果PingPing用来测试两台互联网主机之间的连通性,也可确定网络上的某台主机是否开机。它的工作方式是向一个特定地址发出一个包(短信息),然后等待回复。Ping主要用于查找互联网连接的故障。在互联网上有很多免费的或共享的Ping实用程序。Ping提供关于互联网计算机之间连接性能的数据,如计算机之间的主机(转发)数和计算机之间发送一条信息所花的时间。虽然基于Windows的ping程序有很多种,人们一般是在MS-DOS的提示符后直接使用ping命令。在运行ping时,只需在ping后写上你准备访问的主机的IP地址或域名就可以了。例如,为了确定美国人口统计局的WWW网站是否联机,你只需在MS-DOS的提示符后(或使用ping客户机)键入下面的命令:Ping www.census.gov或Ping 148.129.129.31你可以从TUCOWS和D等互联网下载网站下载ping客户机程序来试一下。关于本章提到的几个程序,你可以在本书在线版查到链接清单。Tracert和其他路由跟踪程序Tracert (TRACE RouTe的缩写)和其他相关的程序可跟踪互联网上的两台计算机之间的往返路由。它可提供信息在你的计算机和远程计算机往返所花费的时间,还可以确定该远程计算机是否联机。和Ping的功能相似,路由跟踪程序计算并显示计算机之间的转发数及两台计算机之间传输信息所需的时间。路由跟踪程序(如Tracert)的工作方式是向目的地发送一系列的信息包。在你的计算机和目的地计算机之间的互联网通路上的每台计算机都称为路由器,每台路由器都向你的计算机发回该路由器的IP地址及信息往返该路由器所花的时间。跟踪程序运行结束后,你就知道转发数是多少以及信息到达每个节点和全程的传输时间。除了提供传输时间的数据,其他路由跟踪程序还可在地图上标出从源到目的地的路径。你可利用路由跟踪程序算出信息在哪个路由器上耽搁的时间最长。即使你对确定信息在互联网上的耽搁地点不感兴趣,还可用它来多少展示了一下互联网的工作方式,这很有趣。在可以通过互联网下载、试用并购买的多种Windows图形用户界面的路由跟踪程序中,VisualRoute是比较典型的一个。图2-5所示为用VisualRoute程序跟踪西海岸(圣地亚哥大学)和东海岸(哈佛大学)计算机之间信息传输路径的例子。图2-5 跟踪两台计算机之间的信息传输路由互联网的应用互联网的三个代表性的应用电子邮件、Telnet和FTP从ARPANET的发展早期就开始了,并一直保留到现在。这些流行程序要早于互联网目前最广泛的应用WWW。通过这些工具,你可以使用任何连入互联网的计算机来访问互联网并查找商业信息,这种个人计算机一般都是通过在电话线上仿真TCP/IP协议来上网的。通过这种方式,地球上的任一角落都可以连上互联网了。电子邮件电子邮件的使用可以追溯到70年代。虽然建立ARPANET的目的是控制武器系统并传输研究文件,70年代初时这种大规模的网络出现了其他一些用途。1972年ARPANET的一个研究者雷汤姆林森(Ray Tomlinson)编写了一种通过此网络收发信息的程序。1976年,英国女王通过ARPANET发送了一条电子邮件信息,这标志着电子邮件的诞生。今天,电子邮件已成为最常用的商务沟通手段,在数量上超过了电话、传统信件和传真。在一些国家,糟糕的电话服务已使越来越多的人转而采用更可靠的电子邮件系统和他人进行交流。电子邮件不仅是互联网早期的一种应用,而且也是把众多的人吸引到互联网的一个原因。电子邮件可以在短短的几秒时间内把信件从一个地方传输到另一个地方。传输的信件可以是简单的ASCII码文本,也可以是类似文字处理程序中字符的信息。电子邮件的一个吸引人的优点是,传输的信件可附带文件、图片、电影、电子表格和其他重要的信息。这些附件常常是信件最重要的部分。企业间电子邮件的附件可能是发票、最新的产品目录、介绍企业在线销售产品的压缩的WWW页面。人们常用的电子邮件客户机程序有Eudora、Netscape Messenger和Outlook Express。后两种特别流行是因为它们分别同Netscape及Internet Explorer浏览器捆绑销售。图2-6是一个带有附件的典型电子邮件客户机程序(微软公司的Outlook Express),它可以直接通过互联网发送了。图2-6 把一个文件和一个图片作为附件发送电子邮件的一个常见的用途是通过互联网确认收到了顾客订单以及确认订购商品的运输或交付。在互联网上购买和交付软件也要用电子邮件传递关于交易的重要信息。假设你决定从网上下载试用版软件,它只可以免费使用一段时间或只可使用一部分功能。用了一段时间后,你认为这种软件正是你所需要的,于是决定购买。因为软件已经下载了,你只需在开发商的WWW网站上用信用卡直接购买软件的使用许可证就可以了。开发商一般会向你的电子邮件地址发一个很长的代码,此代码可以允许你对软件无限制地使用,或消除使用版上不断显示的催款信息。你可以看到,电子邮件大大方便了电子商务交易(如购买软件和其他商品)。电子邮件也有缺点。它的最大的缺点也许是垃圾邮件(spam)。垃圾邮件的常见形式是商业噱头(如“你想在计算机上发大财吗?”)、广告和来自新闻组的稿件。这些垃圾邮件不仅浪费你的时间和电子邮件磁盘空间,还占用大量的互联网容量。如果一个无用的电子邮件发给了10万个人,这个垃圾邮件就浪费了大量的本来可用作正当用途的资源。垃圾邮件还侵占互联网的带宽。带宽是一段固定时间内互联网传输的数据量。它通常以比特/秒(bps)为单位来表示。很多民间组织和企业已经决定向垃圾邮件宣战。例如,美国在线(AOL)已采取积极的行动通过法律渠道限制垃圾邮件。对垃圾邮件制造者来说,最大的威胁是冻结他们在ISP的账户。没有ISP,他们就无法传输这些垃圾邮件了。ISP的问题将在本章的后面部分和第14章具体讨论。关于垃圾邮件这个词spam的来源也有很多争论。大部分人认为它来自蒙蒂派索恩(Monty Python)的一首歌,这首歌唱的是罐头里神秘的肉:“Spam spam spam spam, spam spam spam spam,可爱的spam,美妙的spam”。和这首歌一样,spam是对无聊内容简单乏味的重复。Telnet Telnet是一种让你登录互联网上的远程计算机的应用软件。互联网上有好几种Telnet客户机软件,你可能会对Windows系统提供的Telnet.exe比较满意。Windows提供的这种Telnet程序虽然不大但很有效。它可以改变光标的形状、背景和前台的颜色及字体。和电子邮件不同,Telnet可以让你使用远程主机的命令和程序。通过执行终端仿真程序的功能,Telnet将你键入的命令和其他字符串直接传输到远程主机。这台远程计算机就可以直接执行你通过Telnet键入的命令了。Telnet可以模仿多种终端,如VT-52和VT-100行业标准的终端,但奇怪的是,它不能模仿非常流行的IBM 3270终端。你可以使用任何Telnet客户机并键入地址locis.loc.gov来登录美国国会图书馆。你也可以把自己的WWW浏览器作为Telnet客户机,输入URL地址telnet:/locis.loc.gov并按回车键。图2-7给出了使用Windows提供的Telnet的一个例子。图中展示了国会图书馆网站的第一个对话屏幕。你一般是输入“退出(quit)”结束Telnet对话,也可以按照主机的指令结束Telnet对话。对于UNIX系统来说,通常输入的退出对话命令是“退出登录(logout或logoff)”。图2-7 Telnet对话的例子出差在外甚至在国外的销售人员都可以使用互联网和Telnet客户机登录他们公司的计算机,以查看订单和库存情况,也可以获取其他业务信息。FTPFTP是计算机间传输数字化业务信息的最快途径。FTP的最广泛应用也许是销售和交付软件包及更新软件。例如,微软公司在网上免费提供大量更新软件。不管是使用WWW浏览器还是FTP客户机程序,你都可以下载图书、手册和完整的软件包。通过匿名FTP,商业用户和学生可以从商业网站下载准备购买的文件。使用一个有用户名和口令的账户,你在访问企业或大学的计算机时可以比匿名账户有更多的特权,你可以向主机或你的个人计算机发送文件、文档或其他任意数字信息,前一种方式称为上载,后一种方式称为下载。图2-8展示了一个FTP的会话窗口。主机网站的URL地址是,从这个主机上你可以下载最新的反病毒数据文件。左边窗口是本地计算机磁盘上的文件夹和文件,右边窗口是远程计算机磁盘上的文件夹和文件(在这个例子中是McAfee的网站)。两个窗口中的按钮可以使你在本地计算机和远程计算机上独立地转换目录、创建新的目录或完成其他目录维护工作。图2-8 从McAfee网站下载软件的FTP会话窗口标注语言和WWW当然,互联网的最广泛应用还是WWW。WWW页面数以百万计。本节将讨论WWW页面是如何构建的。过去,“标注”这个术语指的是手稿上的注解或记号,用来告诉编辑或打字员某页文稿的格式应如何设计或打印。标注纸本文稿有一套通用的文本编辑符号。同样,电子页面也需要用标注来管理文本内容的显示和格式。本章将介绍三种标注语言:SGML(标注语言的鼻祖)、HTML(SGML的派生物)以及XML(SGML的最新变种)。SGML、HTML和XML简介 SGML、HTML和XML是三种最重要的标注语言。SGML是最早的标注语言,HTML和XML都是在此基础上派生出来的。每种语言的目的都不一样。SGML是一种丰富的元语言,几乎可以用来定义无数种标注语言。HTML特别适用于WWW页面的显示。XML是目前最新的语言,用来定义数据结构,这种数据结构对包括电子商务在内的大规模数据传输是非常重要的。下面将一一介绍这三种语言。标准通用标注语言(SGML)60年代,科学家开始定义一种通用的标注语言,这种语言用来描述电子文档及其构成。1986年,国际标准化组织(ISO)采用了一种叫做标准通用标注语言(SGML)的特殊语言作为标准。作为一种编程元语言,SGML提供了一套标注文档的系统,该系统独立于其他任何应用软件。它还包括一套国际标准,这个标准定义了同设备和机器无关的电子文档表示方法。SGML对那些需要标准化的机构来说是非常有效并且非常适合的,同时它还提供了多种选择。很多机构(特别是那些对文档管理有特殊的或复杂要求的组织)都使用SGML,如美国国防部、美国出版家协会、惠普公司和柯达公司,。SGML具有以下优点:l 因为它从1986后被确定为ISO的标准,所以具有长期的适用性。l 它是人类共有的、独立于操作平台的,其寿命将超过现有的大部分应用软件。l 它支持用户定义的、用来满足文件特殊要求的标记和体系结构。虽然SGML是一套完整的规范,它并不能跟上WWW页面的快速发展。虽然它很先进,但它在以下几方面还有一些不足:l 它的安装耗资不菲,而且需要很特殊技术,这种技术是大部分WWW设计者所不具备的。l 与HTML相比,SGML的工具相当昂贵。l 用SGML创建文档类型定义的成本很高,特别是用人工来做。l SGML有一个陡峭的学习曲线。超文本标注语言(HTML)我们在第一章已经介绍过,在CERN工作的蒂姆伯纳斯李和罗伯特卡利奥分别独立地发明了超文本标注语言(HTML),这是一种文档生成语言,它包括一套定义文档结构和类型的标记。这套编码描述了文档内文本元素之间的关系。这个术语中的“超文本”这个词起源于60年代,文字机器一书的作者特德尼尔森首次使用了这个词。尼尔森设想出一种页面链接系统来连接相关的页面,不论这些页面分别存储在什么地方。“标注语言”这个词则来源于传统的印刷业。HTML的基础是SGML。HTML是一种特殊的SGML文档类型文档类型定义(DTD),它比SGML更容易学习和使用。例如,HTML DTD用于WWW上的所有文档。在HTML的早期应用时期(即90年代初),当时流行的HTML版本非常适合于创建带有标题、标题栏、布告、行和项目列表的文本文档。但用户要求更好的 WWW页面元素的标题栏,以及更精确的图形定位、表格和框架,WWW的设计者每周都在要求新的特征。此外,软件开发商也不断要求增加HTML的功能。针对这些需要,微软公司在HTML增加了很多只能用于Internet Explorer浏览器的特征,网景公司增加的特征则只能用于其主导产品Navigator(它是Netscape Communicator程序套件的一部分)。伯纳斯李编写的HTML实际上是SGML的一个简化版。他删去了SGML中很少用到的特征,并增加了一些新的特征,如连接WWW文本的超连接。与之相反,SGML是完全可扩展的,它可供开发不同的文档类型定义(DTD),为不同的、容量更大的文档提供标注元素。各种新版的HTML只是原始的基于SGML的HTML DTD的变种。Navigator和Internet Explorer等浏览器不能阅读SGML,它们只能阅读HTML。所以,SGML对于大部分WWW设计者来说是比较陌生的。下面将介绍SGML的一个最新的变种XML,也称为扩展标注语言。扩展标注语言(XML)和HTML一样,扩展标注语言(XML)也是从SGML发展而来的。XML是一种相对较新的语言,它定义了WWW页面显示哪些数据,而HTML确定页面如何显示。XML使设计者很容易地以标准化的、连续的方式来描述并传输来自任意应用程序的结构化数据。很多WWW设计者都相信XML将很快成为WWW上优先使用的编程语言。尽管HTML可以提供大量描述页面格式的标记,但它不能描述页面的具体内容,即不能解释页面上数据的含义。与之相反,XML可以描述页面的内容。此外,XML还有数据跟踪能力这将改变数据共享的方式以及检索数据库和文件的方式。XML的其他优点包括:l 它可以提供元数据(关于信息的数据),这些元数据将帮助人们找到信息,并帮助信息的使用者和提供者彼此找到对方。l 用户可用低成本的软件处理数据l 简化企业间的数据交流,有助于产生独立于平台的协议,这些协议将丰富电子商务的数据l 为服务于企业或个人的电子商务代理人提供有助于自动业务处理的信息通过标注文档每个逻辑部分(元素)的开头和结尾,XML可定义文档的结构。在互联网上的数据从一个地点流向另一地点时,XML的使用者可以检查文档的每一部分是否处于应在的地方。XML标注数据时使用成对的开头和结尾标记,类似于在数据库系统中定义一条记录的结构。例如,假设你的公司在WWW上销售产品。在WWW页面有公司销售的不同产品的名称和图片,这些页面是用HTML写成的。除了产品名称外,其他的产品数据各种产品的信息,包括价格、编号和库存量是用XML格式化的,其存放方式和数据一样。图2-9给出了XML格式的产品的例子,该产品有三个元素。图2-9 XML的例子除了第一个标记,其他的所有标记都是严格地开头/结尾成对出现的。这些标记和HTML使用的标记一样,但图2-9中的编码和典型的HTML编码有很大的区别:在这个例子中,没有信息说明数据的显示方式和格式。如果需要,格式信息可从其他地方获得(如其他WWW页面、接收XML文件的应用软件或其他文档)。XML的设计思想类似于为个人数据助理(PDA,如Palm Pilot)或数据库(如微软公司的Access)的条目确定地址。你在数据库的不同区域一条一条地输入姓名和电话号码的记录。XML处理数据库结构的细节。当你想得到PDA地址簿的硬拷贝时,可以很简单地用Word生成一个结构美观的地址簿。数据库中的记录合并成了Word文档。无论何时,你都可以用HTML来处理XML文件数据的显示和格式细节。这一点特别重要,例如,如果你想生成一个对WWW网站查询的回应,这个查询要求你列出手头南非或肯利亚各类咖啡的现货产品,XML包括了允许查询要求的结构信息,HTML具有强大的显示和格式能力来显示反馈的产品信息。尽管XML具有一些很明显的优势,HTML对当今WWW的影响还是最大的。在介绍下一个内容之前,有必要再介绍一些HTML的知识。下一节将介绍HTML的概述,它是如何确定WWW页面的以及几个代表性的WWW浏览器的格式的差别。关于HTML的更多内容WWW可以组织全球各地网站上的互相链接的信息页面。超文本标注语言是一种可以显示数百万计这种页面的语言,HTTP协议用于在服务器和用户之间传输页面。文档页面间的超链接形成了文档页面的“Web”。为了转换这些互相交织的页面,你可以点击超链接从一个页面转到另一页面。如果这样做,你可以按照顺序阅读文档的不同页面,也可以通过跟踪超链接按任何顺序阅读。图2-10显示超链接是如何用非线形的方式把不同的主题联系到一起的,这种链接方式可以使你以序列或非序列的方式阅读页面。图2-10 传统的和超链接的文档页面HTML标记HTML文档既包括文档的内容又包括文档的标记。文档内容是在计算机屏幕上显示的所有信息,包括文本、图片和图像。标记是插在文档中的HTML编码,它们规定一个完整部分的文档一格式及在屏幕上的显示方式(标记用于所有的格式规范,包括SGML、XML和HTML,这些规范把文档作为文本文件储存起来)。HTML标记结构简单,通常成对使用。其基本格式是:标记影响的显示信息标记对的一个例子是把“best”这个单词以粗体字形式显示的粗体字格式标记:best。可用一个WWW浏览器力量看这个文档。在HTML文档中,可很容易认出标记,因为每个标记都用括号()括起来。标记既可小写也可大写,标记和标记的意思完全一样。尽管大部分标记是双侧标记既需要开始标记也需要结束标记也有些标记不是这样的,即单侧标记。首先出现的是开始标记,后接该标记影响的文本,结束标记在标记名前有个斜杠(/)。如果你在上例中省略了粗体字的结束标记,后面的所有内容都将是粗体字了。有时一个开始标记包括一个或更多的属性修饰,可进一步确定该标记将如何运作。一个标记的属性可以修改文本的显示,或确定在何处找到一个图形元素。例如,单侧的段落标记确定一个文本段落的开始。可选的属性之一表示一个段落的队列。例如,下面的这个HTML区段在浏览器的窗口显示并右对齐。 This will right-align the paragraph, based on the width of the users browser and computer screen, so that the end of each line (except the last) lines up with the right border of the screen. The left ends of each line will not be aligned. This is known as ragged left alignment.图2-11表示了在微软公司的Internet Explorer浏览器中显示上面这段话的样式。因为窗口没有最大化,文本的每一行根据浏览器的窗口大小自动调整。如果你改变浏览器窗口的大小,这段文字又会再次调整。图2-11 WWW页面和右对齐段落标记HTML定义了相当多的标记。介绍HTML标记及其用法的资料和教科书也有好几种,你可阅读这些书进一步了解HTML。下面先看几个HTML标记,在不考虑HTML编码细节的情况下对HTML文档结构有一个基本的了解。HTML编码定义WWW页面的结构和格式,但同一个页面在不同的浏览器中看起来可能是不一样的。请看一下图2-12中的HTML页面,然后再把它和图2-13中的显示页面比较一下。图2-12 规定备忘录页面格式的HTML编码图2-13 Internet Explorer显示的备忘录页面看完图2-12再观察图2-13中WWW浏览器的结果,你将看到每个标记对是如何确定页面的格式的。例如,标记创建显示在浏览器标题栏中的标题(WWW页面标题的文本是一个基本元素,在多种检索引擎浏览WWW页面的条目时,这些标题将列成索引)。注意,在开始的标记中有一个修饰“bgcolor”。你可能会猜出它是表示背景的颜色。颜色编码值是16进制,16进制是计算机使用的一种以16为基数的计数方法。它表示多少红色(第一种颜色)、绿色(第二种颜色)和蓝色(第三种颜色)混合在一起所得到颜色(“CC”等于10进制中的204)。靠近底部是一个用开始标记和结束标记界定的标明序号的清单。在开始和结束标记之间有三个编号列表(用标记表示),从1开始自动给各条目按顺序编号。你会发现查看页面下的HTML编码是很有趣的。要想查看你在浏览器上阅读的任何WWW页面的编码,如果你用的是Internet Explorer,你可点击菜单栏中“View(查看)”下的“Source(源文件)”;如果你用的是Netscape Navigator,你可点击菜单栏中“View(查看)”下的“Document Source(源文档)”。HTML链接使WWW真正具有意义的是HTML超链接,它使WWW不再局限为储存很多单独文档的电子存储设施。超链接实际上是一些文本,它们把当前文档链接到同一文档的另一位置、同一主机的其他文档或互联网上其他地方的文档里。通过超链接将文档彼此链接起来就创造了文档组成的WWW。超链接是用HTML定位标记创建的。不管你是与同一文档的不同文本还是与远程计算机的文档建立链接,定位标记的基本格式都是一样的,即:可见的链接文本 和其他标记一样,定位标记也有开始和结束标记。开始标记也是确定HREF的属性,这个属性确定远程或本地文档的地址。点击开始标记后面的文本就把控制转换到HREF地址不管这个地址是什么。假设你要创建一份基于WWW的电子简历,简历中包含有“教育”标题下你的大学的名称和地址。你可以不只在简历中简单地写上大学的名字,而可以创建超链接连到该大学的名称上。查看简历的人点击这个链接就可以进入大学的主页。下面的例子说明如何用HTML编码创建一个连入其他WWW服务器的链接:Purdue University 同样,你也可以用下面的链接和HTML编码链接到同一文档的其他部分也许是你简历中的第三页:references are found here 在上面两个例子中,定位标记之间的文本在WWW页面上显示为一个超链接。大部分浏览器用蓝色显示这种链接并加上下划线。但不管以何种方式显示,只要你把鼠标移到超链接上,鼠标指针就从一个箭头变成一个手形指针。和其他所有的WWW应用软件一样,电子商务应用软件用超链接引导顾客访问企业服务器或其他服务器的不同页面。引导顾客浏览页面的链接方式会对网站的用户友善评价产生很大影响,同时还会影响顾客对企业的印象。在WWW网站上,你可以用多种不同的链接结构。经验的积累和顾客的反馈会帮助你确定何种结构最适合你的企业。两种常用的链接结构是线形结构和分层结构。线形超链接结构类似于传统的纸面文档,读者从第一页开始,点击“下一页”按钮进入下一页。除了这种路径,页面几乎不提供其他路径。这种结构适用于顾客填写订单或其他协议的表格。在这种情况下,顾客只能从第一页开始阅读和响应,然后才能到下一页。该过程持续到整个表格全部完成为止。用户可以选择的WWW页面漫游方式只有“后退”和“前进”两种。另一种常用的链接方式是分层结构。在分层超链接结构中,WWW用户从介绍或主页开始。主页通常包括一个或多个连入其他页面的链接,这些页面依次链接更多的页面。这种分层结构类似于一棵自上而下的树,树根在上,树枝在下。分层结构特别适用于引导顾客从产品或主题的概要开始,逐步访问到具体的产品。企业的主页还可能包括的链接有帮助内容、公司历史、公司员工、订单处理、常见问题和产品目录等。图2-14给出了线形结构和分层结构。当然,同时包含这两种结构的页面也是可能的。图2-14 超链接的结构HTML的版本历史超文本标注语言的第一版1.0版是在1991年夏天发布,此后,它经过了多次修改。当时,伯纳斯李为1.0版开发了一系列的规范并贴在互联网上。为了使HTML语言独立于平台,他建议并开发了一种语言编译程序浏览器。不久,各地就出现了一些新的浏览器。每种浏览器都产生了伯纳斯李规范的一些变种,并导致一些专用HTML版本的出现。这种现象偏离了HTML的初衷一种独立于平台的WWW页面浏览器。直到WWW共同体(W3C)发布了HTML规范的下一个版本2.0版,一种行业标准才真正地确立下来。HTML 2.0发布于1995年9月。它是HTML几个改进版本中第一个成为行业标准的版本。与此同时,两个新的浏览器出现了:微软公司的Internet Explorer 2.0和网景公司的Navigator 2.0。网景公司在COMDEX(一个行业博览会)上分发它的浏览器软件,以刺激用户接受这种浏览器,事实证明这是一种非常成功的战略。HTML 2.0版是第一个支持内联图形和填表的版本。HTML2.0版标志着互联网特别是WWW广泛应用和迅速膨胀的开始。HTML 2.0版发布不久,HTML 3.0版就出现了。1997年,HTML 3.2发布。3.2版是建立在3.0版基础之上,它支持图表、复杂数字以及图像之间的文本流动。因为HTML的专用版本(只能在特定的浏览器上工作的版本)不断地开发出来,WWW共同体就成立了一个委员会来开发HTML 3.2版,目的是进一步标准化这种语言。WWW共同体成立于1994年。其目的是维护WWW的标准和公用的协议,并促进它们的发展和互可操作。虽然3.0版失去了其他WWW浏览器已采用的一些重要特性,但现在主要的浏览器都支持HTML 3.2版。1997年12月,WWW共同体发布了HTML 4.0版。4.0版第一次支持OBJECT标记和层叠风格表单(CSS)。WWW页面设计者可用OBJECT标记把脚本语言代码直接嵌入HTML页面。脚本语言代码允许所下载的WWW页面执行用户计算机上的程序。层叠风格表单(CSS)可让WWW开发者更好地控制页面显示的格式。同文字处理程序中的预定义的文档风格一样,CSS使设计者定义重复使用的格式风格。“层叠”意味着设计者可将多种风格表单用在同一WWW页面上。除了OBJECT和CSS外,4.0版还考虑了语言的国际化。例如,因为许多语言是从右到左阅读的,4.0版的国际化功能支持从右到左显示文本。4.0版还有容易使用的特点。HTML编辑程序在讨论WWW服务器和WWW客户机之前,有必要介绍一下HTML编辑程序。HTML编辑程序的复杂程度差异很大。最简单的HTML编辑程序直接在屏幕上显示HTML代码,你可以点击选择按钮来插入HTML标记对。在建立WWW页面时,这种编辑程序比Notepad的帮助大,但不提供拖放图形的功能,而且通常会要求你用浏览器来页面效果。在互联网上有很多免费、共享或收费的HTML编辑程序。最复杂的HTML编辑程序实际上就是WWW网站创建软件。用这些软件可创建各种能访问数据库、具备图形和填表功能的商业级网站。这些编辑程序还提供了丰富的环境来显示WWW页面(而不是HTML代码)。你可在页面上拖放图形、按钮和行等对象。由软件来生成页面的HTML代码。当你创建完页面时,这些软件可把这些页面从PC机里上载到WWW服务器上。常见的WWW网站创建软件有微软的FrontPage和Dreamweaver,当然还有很多其他好程序,详细资料可查看本书在线版里第二章的内容。图2-15给出了Dreamweaver网站的一个例子。图2-15 Dreamweaver网站创建软件WWW客户机和服务器当你用互联网的连接进入WWW时,你的计算机就成为了覆盖全球的客户机/服务器网络中的一台WWW客户机。你的浏览器软件(如Internet Explorer 或Navigator)就是支持你的计算机以WWW客户机方式工作的软件。互联网将很多不同类型的计算机连接在一起,这些计算机运行着不同的操作系统软件。因为WWW软件独立于平台,它能够让你的计算机与这些不同类型的计算机实现有效的通讯。这就是WWW能够迅速膨胀并被广泛接受的关键。互联的文档WWW服务器是一些联入互联网的计算机,这些计算机包含有大量的文件,这些文件的所有者通过与互联网的连接使这些文件为大众共享。图2-16表示了这种客户机/服务器结构如何利用互联网在各种客户机和服务器计算机之间建立多种连接。图2-16 WWW的客户机/服务器结构WWW上共享的文档包括文本和HTML代码。位于同一计算机或不同计算机上的文档之间的HTML超链接构成了文档互联的WWW。存储在密苏里州肯萨斯城一台计算机上的文档可通过一个超链接同存储在希腊雅典一台计算机上的文档连在一起。在雅典的文档也会同世界各地的其他文档建立链接。WWW页面真正是国际化的。但如果这些页面不符合这种客户机/服务器体系结构,不能满足互联网基础设施的要求,这些WWW页面就会停滞不动了。当WWW浏览器的用户点击一个超链接,此链接的目标URL所指向的另一个页面会立即出现在用户的屏幕上。这是如何发生的?浏览器和目标计算机之间到底发生了何种相互作用?下面这一节将介绍WWW客户机和服务器之间的相互作用。WWW客户机/服务器体系结构客户机/服务器体系结构可用于局域网、广域网和WWW。这三种用途迥异的网络的一个共同特点是工作负荷在服务器和客户机之间的分配。在每种网络中,客户机计算机一般是要求服务,包括打印、信息检索和数据库访问。这些活动由服务器来完成,它负责处理客户机的要求。客户机一般不做什么工作。客户机的工作负荷很轻,服务器的工作负荷却很重。除了收取和解释客户机的要求外,服务器还要寻找信息、重新处理信息、要求对资源初始化,这些资源是由服务器所控制的计算机上运行的其他应用程序提供的。因为有这种工作负荷分担协议,所以服务器通常是可靠的、价值昂贵的计算机,有巨大的磁盘容量、容错的处理器和巨大的存储器。与服务器不同,客户机只是一台普通的个人计算机。我们通常用“瘦客户机”来描述客户机相对较少的工作负荷。这种无硬盘的瘦客户机一般是连入互联网的局域网中。在电子商务中,它们是低成本的客户计算机,人们用它们来从有WWW主机的企业采购商品和服务。在这种情况下,WWW企业必须承担更大的购买成本,并运行强大的计算机和软件以便服务于数量很大的潜在顾客群。客户机如何与服务器实现通讯,通讯的内容是什么?服务器何时开始工作?服务器发生了何种信息转换,返回什么内容?在电子商务中,客户机同服务器如何进行交互?下一节就回答这些问题。WWW客户机/服务器通讯工作负荷在WWW客户机和服务器之间的分配截然不同。WWW客户机办公室或家庭计算机向远程计算机上的一个特定WWW服务器请求信息。通过互联网这个传输媒体,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 销售管理


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!