我们用Java开发项目时,发送请求都是用的RestTemplate。最近和其他部门合作时,我们需要请求他们的一个http接口。两边协议都确定好后,发现联调不通。后来发现是我们这边发出的请求,到达对方那边时,他们接收到的是经过了urlencode后的结果,通过wireshark抓包也看到确实发出的请求是被urlencode的。
我们这边的进程,并没有显式调用urlencode相关的方法,因此猜测是RestTemplate自动给我们进行了urlencode。网上查找资料,发现这两篇文章讲得很详细:
https://blog.csdn.net/Petershusheng/article/details/54236816
RestTemplate确实在底层自动给我们进行了urlencode,不过我们也可以通过UriComponentsBuilder来构建URI对象,手动选择不进行urlencode,具体操作方式可以参考这个文章:
https://blog.csdn.net/blueheart20/article/details/80916517
1 |
riComponentsBuilder builder = UriComponentsBuilder |
不过一般接口调用,都应该进行urlencode,避免一些特殊字符在传递过程中出现问题。因此回到我们这个应用,最终还是联系接口提供方,在接收请求时,对所有参数都进行了urldecode。
RestTemplate中encode请求参数的原理
我的请求参数里面,有个sign参数,其值含有一些特殊符号,比如斜杠(/)和等号(=),经过RestTemplate处理并发送请求后,我抓包发现请求中的斜杠没有被urlencode,但是等号却被urlencode了,这是为什么呢?RestTemplate的urlencode难道不是通用的,而是自定义的么?
下午花了2个小时,通过IDE断点跟踪调试源码,终于弄清楚原因了。
原因
在HierarchicalUriComponents的大约234行,有个encodeUriComponent方法,这个方法就是RestTemplate用来对url中的参数进行encode处理的逻辑:
1 |
static String (String source, Charset charset, HierarchicalUriComponents.Type type) { |
从代码可以看到,encode的过程,是先将参数转为byte数组,然后逐个byte进行检查,如果发现某个byte不在url参数允许的范围内,则对其进行encode操作。
然后我们找到上面的HierarchicalUriComponents.Type.QUERY_PARAM的代码,大约在HierarchicalUriComponents的811行:
1 |
QUERY_PARAM { |
从上面的逻辑可以看到,如果字符是斜杠(ASCII码等于47),那么进程会判断这个字符是在url参数中被允许的,则不进行encode了;而等号(ASCII码为61)被其判断为是一个不被允许的url字符,因此就会被encode。
至此,原因终于找到了。
解决方案
解决方案也比较简单,因为我们可以自行选择要不要让RestTemplate对我们的参数进行urlencode,所以我们可以先自己手动将url进行encode,然后发送请求时,选择不让RestTemplate自动做encode即可。
这是处理参数的方法:
1 |
/** |
这是发送请求的代码:
1 |
String requestUrl = "http://www.10jqka.com.cn/" |