6.7 万维网WWW
6.7 万维网WWW
即 World Wide Web,是一个大规模的、联机式的信息储藏所,是运行在因特网上的一个分布式应用。

统一资源定位符URL
万维网使用统一资源定位符URL来指明因特网上任何种类“资源”的位置。
其一般形式为:
<协议>:/∥<主机>:<端口>/<路径>
超文本传输协议HTTP
超文本传输协议 HTTP (HyperText Transfer Protocol) 定义了浏览器(即万维网客户进程) 怎样向万维网服务器请求万维网文档以及万维网服务器怎样把万维网文档传送给浏览器。
HTTP1.0
采用非持续连接方式。每次浏览器要请求一个文件都要与服务器建立TCP连接(80端口),当收到响应后就立即关闭连接。
每请求一个文档就要有两倍的TT的开销。若一个网页上有很多引用对象(例如图片等),那么请求每一个对象都需要花费2RTT的时间。 为了减小时延,浏览器通常会建立多个并行的TCP连接同时请求多个对象。但是,这会大量占用万维网服务器的资源,特别是万维网服务器往往要同时服务于大量客户的请求,这会使其负担很重。
HTTP1.1
采用持续连接方式。万维网服务器在发送响应后仍然保持这条连接,使同一个客户(浏览器)和该服务器可以继续在这条连接上传送后续的HTTP请求报文和响应报文。
为了进一步提高效率,还可采用流水线方式,即浏览器在收到HTTP的响应报文之前 就能够连续发送多个请求报文。
HTTP两种报文——请求报文和响应报文
报文中的每一个字段都是一些ASCII码串,并且每个字段的长度都是不确定的。
请求报文格式
响应报文格式
Cookie技术
Cookie提供了一种机制使得万维网服务器能够“记住”用户,而无需用户主动提供用户标识信息。 也就是说,Cookie是一种对无状态的HTTP进行状态化的技术。
万维网缓存(Web缓存)
在万维网中还可以使用缓存机制以提高万维网的效率。 可位于客户机,也可位于中间系统上,位于中间系统上的Web缓存又称为代理服务器。
字段 说明 Last-Modified 最后修改时间 Expires 有效期 - 若过了最后有效期,则在客户机发来请求时,代理服务器向原始服务器发送请求得到新的数据
- 若原始服务器的数据也未更改,则发回一个不带实体数据的响应报文, 代理服务器收到后更新有效期,将数据发给客户机
- 若原始服务器的数据更改,那么发回新数据的响应报文,代理服务器更新数据以及两个字段并将新数据发给客户机
- 若过了最后有效期,则在客户机发来请求时,代理服务器向原始服务器发送请求得到新的数据