超文本传送协议(Hypertext transfer protocol,HTTP)是万维网(world Wide web,www,也简称为web)的基础,本节主要对http协议进行介绍,并分别给出http多线程服务器和客户程序的实例,而不介绍有关WEB和浏览器方面的知识。
HTTP是一个属于应用层的面向对象的协议,适用于分布式超媒体信息系统。它于1990年提出,经过几年的使用与发展,得到不断地完善和扩展,目前在WWW中使用的是http1.1
1、http协议特点:
HTTP协议是网络中使用最为广泛的一种高级协议,WWW服务广泛应用,而WWW服务器使用的主要协议是HTTP协议,经过十几年的使用与发展,HTTP协议得到了极大的扩展和完善,目前HTTP协议支持的不仅限于WWW服务,还有FTP等其他服务。
HTTP协议最初开始的设计目标就是通过网络来支持ClIEnt和Server之间的事务处理,其最初原型在1990年出现,为了适应WWW的需求,在功能和性能方面进行了大量的改进,最开始出现的HTTP原始协议现在称为HTTP0.9,它是一个面向消息的简单协议,是现在使用的HTTP协议的子集。因此它同HTTP1.0,HTTP1.1兼容。该协议描述了Client和Server之间请求和响应的过程:
Client在本地主机向运行于远程主机上的Server请求链接,连接成功之后通过GET来访问Server端对象(可以是普通网页,也可以是通过CGI或ISAPI生成的动态页面),Server端在连接终止之前将请求的对象或者是错误消息返回给Client,结束响应过程.HTTP0.9和现在使用的HTTP1.1在基本上实现上没有大的区别,HTTP1.0是以HTTP0.9为基础发展起来的,增加了复杂网络连接下访问不同对象类型的功能,基本的改进如下:
(1)增加了请求的类型,如HEAD、POST等。
(2)增加了请求和响应消息的协议版本,如响应消息第一行以“HTTP/1.0”开始,表示Server使用的是HTTP协议的1.0版。
(3)使用Server响应码来表示请求响应消息的成功与否,如果响应消息第一行以200 OK结束,说明操作成功。
(4)使用MIME(Multipurpose Internet Mail Externsion)的消息标题(Header)和消息体(Body)格式来描述访问对象的数据类型和附加在后面的元信息,如MIME的Header为"Content-type:text/html"表明响应的消息实体是HTML文件,增加了MIME支持之后,使HTTP协议可以处理的数据类型获得很大的扩充,从而实现了对多媒体流信息(如声音,图像)的处理支持。
(5)用Challenge/Response实现认证,这样可以在用户访问某些页面时要求输入用户名和密码,进行身份认证。
(6)增加了代理(proxy)支持功能,在HTTP0.9中,规定了Client和Server只能直接交互,而1.0版可以通过代理等中间实体实现间接连接。
HTTP1.1是在HTTP1.0的基础上实现的一次飞跃,主要的改进集中在性能、安全、数据类型处理等方面:
(1)提出了Server端缓冲对象的概念,其目的是为了减少网络上相同类型内容的反复传送,提高访问速度,节约带宽。
(2)使用永久连接(persistent ConNECt)作为基本的连接,提高性能。
(3)允许Client和Server之间对内容进行协商
(4)突破了HTTP1.0中Server和IP一一对应的限制,可能通过主机名来决定由哪一个Server提供服务HTTPng是发展中的下一代协议,在效率和性能上有了更进一步的提高,HTTP协议的主要特点可概括为如下几点:
(1)简单快速
客户向服务器请求服务时,只需要传送请求方法和路径,请求方法主要有GET,HEAD,POST等,其中又以GET最为广泛。由于HTTP协议简单,使得HTTP服务器的程序规模小,通信速度很快。
(2)灵活
HTTP允许传输任意类型的数据对象(ASCII文本:二进制流如BMP,JPG,ZIP等),传输数据的具体类型在Content-type域中加以标记
(3)无连接
无连接的含义是限制每次连接只处理一个请求,服务器处理完客户的请求,并收到客户的应答后立即断开连接。采用这种方式可以节省传输时间
(4)无记忆状态能力
无记忆状态能力是指协议不保留当前事务处理的信息。虽然这样会带来一些副作用,可是服务 需要重新利用先前信息,可以实现较快应答.
HTTP协议报文结构:
HGGP是一个面向事务的客户服务器协议。虽然HTTP使用了TCP协议,但HTTP协议是无状态的(StateLess)。也就是说每一个事务都独立地进行处理。当一个事务开始时,就在WWW客户与WWW服务器之间产生一个TCP连接,当事务结束时就释放这个TCP连接。
HTTP的无状态特性很适合它的典型应用。用户在使用WWW时,往往要读取一系列的网页,而这些网页又可能分布在许多相距很远的服务器上,将HTTP协议做成无状态,可使读取网页信息完成得较迅速,HTTP协议本身也是无连接的,虽然它使用了面向连接的TCP连接。
在许多情况下,用户的个人计算机并不是一起连在Internet上,而是通过拨号方式经过Internet服务提供商再连接到Internet上的。在这种情况下,先要使用SLIP或PPP协议与ISP接通,待ISP分配给用户一个临时的IP地址后,才能使用WWW浏览器。
从HTTP的观点来看,上述WWW浏览器就是一个HTTP客户,而在WWW服务器等待HTTP请求的进程常称为、HTTPdaemon,HTTPdaemon在收到HTTP客户请求后,经过一些必要的处理,将所需的文件返回给HTTP客户。
下面让我们来研究一下HTTP的报文结构。HTTP有两类报文:从客户到服务器的请求报文和从服务器到客户的响应报文。
两种报文都由5个成员组成,其中请求报文的结构如下:
1、第1成员:请求行(Request-Line)或状态行(Status-line)
2、第2成员:通用头(General-Header)
3、第2成员:请求头(Request-Header)
4、第4成员:实体头(EntIty-Header)
5、第5成员:实体主体(Entiry-Body)
发布于 2016-08-22 00:19:58 | 169 次阅读
发布于 2016-08-08 00:27:23 | 153 次阅读
发布于 2016-07-28 00:18:17 | 70 次阅读
发布于 2016-07-15 00:22:14 | 135 次阅读
发布于 2015-12-21 01:01:35 | 206 次阅读