Python编程系列---获取请求报文行中的URL的几种方法总结

本文转载自查看原文 2018-08-27 16:57 1499 网络编程/ Python编程系列

在浏览器访问web服务器的时候,服务器收到的是一个请求报文,大概GET请求的格式大概如下:

先随便拿到一个请求报文,蓝色即为我们要获取的

GET /index.html HTTP/1.1
Host: www.baidu.com
Connection: keep-alive
Cache-Control: max-age=0
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3528.4 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8

方法一:使用正则表达式中的match方法

 1 import re  2 
 3 request = """GET /index.html HTTP/1.1  4 Host: www.baidu.com  5 Connection: keep-alive  6 Cache-Control: max-age=0  7 Upgrade-Insecure-Requests: 1  8 User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3528.4 Safari/537.36  9 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8 10 Accept-Encoding: gzip, deflate, br 11 Accept-Language: zh-CN,zh;q=0.9,en;q=0.8 12 """
13 
14 # 将上面的请求报文以行的形式分割返回一个列表
15 request_lines = request.splitlines() 16 
17 # 方法一:使用正则表达式中的match方法
18 # [^/]+ 不以/开头的至少一个字符 匹配到/之前
19 # (/[^ ]*) 以分组来匹配第一个字符是/,然后不以空格开始的0到多个字符,也就是空格之前
20 # 最后通过匹配可以拿到 请求的路径名 比如:index.html
21 
22 ret = re.match(r"[^/]+(/[^ ]*)", request_lines[0]) 23 print("使用正则表达式中的match方法结果为:",ret.group(1)) 24 
25 
26 结果如下: 27 使用正则表达式中的match方法结果为: /index.html 28 
29 Process finished with exit code 0

方法二:使用正则表达式中的spilt方法

 import re

 1 request = """GET /index.html HTTP/1.1  2 Host: www.baidu.com  3 Connection: keep-alive  4 Cache-Control: max-age=0  5 Upgrade-Insecure-Requests: 1  6 User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3528.4 Safari/537.36  7 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8  8 Accept-Encoding: gzip, deflate, br  9 Accept-Language: zh-CN,zh;q=0.9,en;q=0.8 10 """
11 
12 # 将上面的请求报文以行的形式分割返回一个列表
13 request_lines = request.splitlines() 14 
15 # 方法二:使用正则表达式中的spilt方法
16 ret2 = re.split(" ",request_lines[0]) 17 print("使用正则表达式中的spilt方法的结果为:",ret2[1]) 18 
19 
20 结果如下: 21 使用正则表达式中的spilt方法的结果为: /index.html 22 
23 Process finished with exit code 0

方法三:使用字符串分割的方法

 1 request = """GET /index.html HTTP/1.1  2 Host: www.baidu.com  3 Connection: keep-alive  4 Cache-Control: max-age=0  5 Upgrade-Insecure-Requests: 1  6 User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3528.4 Safari/537.36  7 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8  8 Accept-Encoding: gzip, deflate, br  9 Accept-Language: zh-CN,zh;q=0.9,en;q=0.8 10 """
11 
12 # 将上面的请求报文以行的形式分割返回一个列表
13 request_lines = request.splitlines() 14 
15 # 方法三:使用字符串分割的方法
16 str = request_lines[0].split() # 或者.spilt(" ",2)
17 url_str = str[1] 18 print("使用字符串spilt分割的方法:",url_str) 19 
20 
21 
22 结果如下: 23 使用字符串spilt分割的方法: /index.html 24 
25 Process finished with exit code 0

如果你和我有共同爱好,我们可以加个好友一起交流哈!

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 springboot（服务端接口）获取URL请求参数的几种方法 springmvc请求参数获取的几种方法 springmvc请求参数获取的几种方法 python的__init__几种方法总结调试python 程序的几种方法总结 angular中的用到的几种方法总结 linux中删除文件内空白行的几种方法。 Python http.server中获取Post的请求报文从gin的请求中获取参数的各种方法 python中取整数的几种方法