# 12.HTTP协议 ## 12.HTTP协议 ### 1. HTTP协议介绍 HTTP(HyperText Transfer Protocol,超文本传输协议)是用于在客户端(通常是浏览器)和服务器之间传输超文本(如HTML)的应用层协议。它是无状态的、面向请求-响应的协议,基于TCP/IP传输。 HTTP有不同版本号,不同版本号区别如下 * HTTP0.9:仅支持GET方法,仅能访问HTML格式的资源 * HTTP1.0:增加POST和HEAD方法,MIME支持多种数据格式,开始支持Cache,支持tcp短连接 * HTTP1.1:支持持久连接(长连接),一个TCP连接允许多个请求,新增PUT、PATCH、DELETE等 * HTTP2.0:性能大幅提升,新的二进制格式,多路复用,header压缩,服务端推送。 ### 2. HTTP工作原理 HTTP的工作过程可以总结为以下几个步骤: 1. **建立连接:** 客户端(如浏览器)与服务器之间通过TCP三次握手建立连接。 2. **发送请求:** 客户端向服务器(Apache、Nginx、IIS服务器)发送HTTP请求报文,请求资源或操作。 3. **服务器处理请求:** HTTP服务器接收到请求后,处理请求并生成响应。 4. **返回响应:** 服务器将响应报文返回给客户端。 5. **断开连接:** 通常在响应完成后关闭TCP连接(HTTP/1.0默认短连接,HTTP/1.1支持长连接)。 ### 3. URL与URI #### 3.1 URI(Uniform Resource Identifier) URI是统一资源标识符,用于标识互联网上的资源。URI分为两种 - **URL(Uniform Resource Locator):** 统一资源定位符,用于描述资源的地址。 - **URN(Uniform Resource Name):** 统一资源名称,用于标识资源的名称,不依赖物理位置 #### 3.2 URL(Uniform Resource Locator HTTP使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和建立连接。URL是一种特殊类型的URI,包含了用于查找某个资源的足够的信息 URL,全称是UniformResourceLocator, 中文叫统一资源定位符,是互联网上用来标识某一处资源的地址。以下面这个URL为例,介绍下普通URL的各部分组成: ```plain http://iproute.cn:80/news/search?keyword=123&enc=utf8#name=321 ``` 从上面的URL可以看出,一个完整的URL包括以下几部分: 1. **协议部分:**该URL的协议部分为“http:”,这代表网页使用的是HTTP协议。在Internet中可以使用多种协议,如HTTP,FTP等等本例中使用的是HTTP协议。在"HTTP"后面的“//”为分隔符 2. **域名(主机)部分:**该URL的域名部分为“iproute.cn”。一个URL中,也可以使用IP地址作为域名使用 3. **端口部分:**跟在域名后面的是端口,域名和端口之间使用“:”作为分隔符。端口不是一个URL必须的部分,如果省略端口部分,将采用默认端口 4. **虚拟目录部分:**从域名后的第一个“/”开始到最后一个“/”为止,是虚拟目录部分。虚拟目录也不是一个URL必须的部分。本例中的虚拟目录是“/news/” 5. **文件名部分:**从域名后的最后一个“/”开始到“?”为止,是文件名部分,如果没有“?”,则是从域名后的最后一个“/”开始到“#”为止,是文件部分,如果没有“?”和“#”,那么从域名后的最后一个“/”开始到结束,都是文件名部分。本例中的文件名是“search”。文件名部分也不是一个URL必须的部分,如果省略该部分,则使用默认的文件名 6. **参数部分:**从“?”开始到“#”为止之间的部分为参数部分,又称搜索部分、查询部分。本例中的参数部分为“keyword=123&enc=utf8”。参数可以允许有多个参数,参数与参数之间用“&”作为分隔符。 7. **锚部分:**从“#”开始到最后,都是锚部分。本例中的锚部分是“name”。锚部分也不是一个URL必须的部分 ### 4. HTTP注意事项 1. HTTP是无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。 2. HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。 3. HTTP是无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。 ### 5. HTTP 消息结构 * HTTP是基于客户端/服务端(C/S)的架构模型,通过一个可靠的链接来交换信息,是一个无状态的请求/响应协议。 * 一个HTTP"客户端"是一个应用程序(Web浏览器或其他任何客户端),通过连接到服务器达到向服务器发送一个或多个HTTP的请求的目的。 * 一个HTTP"服务器"同样也是一个应用程序(通常是一个Web服务,如Apache Web服务器或IIS服务器等),通过接收客户端的请求并向客户端发送HTTP响应数据。 * HTTP使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和建立连接。 * HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文,下面是一个HTTP响应示例  #### 5.1 HTTP请求头部 客户端发送一个HTTP请求到服务器的请求消息包括以下格式:   * 使用burpsuit抓包如下 * GET请求案例 ``` GET / HTTP/1.1 Host: iproute.cn User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3 Accept-Encoding: gzip, deflate Connection: close ``` * POST请求 ``` POST / HTTP/1.1 Host: d2.s.iproute.cn User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3 Accept-Encoding: gzip, deflate Referer: http://d2.s.iproute.cn/ Connection: close Content-Type: application/x-www-form-urlencoded Content-Length: 27 m_name=admin&m_pwd=admin888 ``` #### 5.2 常见http请求报文头部属性 * Accpet * 告诉服务端,客户端接收什么类型的响应 * Referer * 表示这是请求是从哪个URL进来的,比如想在网上购物,但是不知道选择哪家电商平台,你就去问百度,说哪家电商的东西便宜啊,然后一堆东西弹出在你面前,第一给就是某宝,当你从这里进入某宝的时候,这个请求报文的Referer就是[www.baidu.com](http://www.baidu.com) * Cache-Control * 对缓存进行控制,如一个请求希望响应的内容在客户端缓存一年,或不被缓可以通过这个报文头设置 * Accept-Encoding * 这个属性是用来告诉服务器能接受什么编码格式,包括字符编码,压缩形式(一般都是压缩形式) * 例如:Accept-Encoding:gzip, deflate(这两种都是压缩格式) * Host * 指定要请求的资源所在的主机和端口 * User-Agent * 告诉服务器,客户端使用的操作系统、浏览器版本和名称 * 更多的头部属性可以参见脚本之家提供的http请求头部大全 * [http://tools.jb51.net/table/http_header](http://tools.jb51.net/table/http_header) #### 5.3 HTTP响应头部 服务的相应信息格式如下:   * 使用burpsuit抓包如下 ```plain HTTP/1.1 200 OK Server: nginx Date: Sun, 02 May 2021 00:27:06 GMT Content-Type: text/html Last-Modified: Wed, 05 Aug 2020 11:25:56 GMT Connection: close Vary: Accept-Encoding ETag: W/"5f2a9744-aff7" Strict-Transport-Security: max-age=31536000 Content-Length: 45047