.0; CIBA; aff-kingsoft-ciba; .NET CLR 2.0.50727) Content-Type: application/x-www-form-urlencoded Accept-Encoding: gzip, deflate Host: localhost:8888 Content-Length: 49 Connection: Keep-Alive Cache-Control: no-cache username=%E4%B8%96%E7%95%8C%E6%9D%AF&;password=123
以上报文内容,可以看出post方式的请求报文是有专门的数据部的。,
下面的同一请求页面的get提交方式的请求报文:
Get方式的请求报文代码
1.GET /EncodingTest/requestresult.jsp?username=%E4%B8%96%E7%95%8C%E6%9D%AF&;password=123 HTTP/1.1
2.Accept: image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
3.Referer: localhost:8080/TomcatJndiTest/requesttest.jsp
4.Accept-Language: zh-cn
5.User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; aff-kingsoft-ciba; .
NET CLR 2.0.50727)
6.Accept-Encoding: gzip, deflate
7.Host: localhost:8888
8.Connection: Keep-Alive
GET /EncodingTest/requestresult.jsp?username=%E4%B8%96%E7%95%8C%E6%9D%AF&;password=123 HTTP/1.1 Accept: image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */* Referer: localhost:8080/TomcatJndiTest/requesttest.jsp Accept-La
nguage: zh-cn User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; aff-kingsoft-ciba; .NET CLR 2.0.50727) Accept-Encoding: gzip, deflate Host: localhost:8888 Connection: Keep-Alive
以上报文内容,可以看出get方式的请求报文没有专门的数据部,数据是直接跟在url的后面。
请求报文中对汉字的处理:
从上面两种报文可以看出页面上输入的"世界杯"三个汉字被替换成了"%E4%B8%96%E7%95%8C%E6%9D%AF"这样一个字符串,然后发给服务器的。看到这,可能会有两个问题:
问题一、这个字符串是什么?问题二、为什么要做这样的替换?
这个字符串是"世界杯"这三个汉字对应的"UTF-8"编码"E4B896E7958CE69DAF"在每个字节前追加一个"%"后形成的。至于为什么要做这样的转化,我的理解是:因为请求报文会以"ISO-8859-1"的编码方式编码后,通过
网络流的方式传送到服务器端。"ISO-8859-1"仅支持数字、英文字母和一些特殊字符,所以像汉字等这样的字符"ISO-8859-1"是不认识的。所以就必须先给这些"ISO-8859-1"不支持的字符做个"整形"手术。这样才能正确的将页面上的信息传送到服务器端。
这时可能又会有另外一个问题:上面的例子中为什么会选用"UTF-8"编码,其它的编码
方案可以吗?答案是可以的。在jsp页面代码的头部有这样一段代码"<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>"其中charset的值就是浏览器在提交请求报文前,对请求报文做"整形"手术时用的字符集,同是也是浏览器解释服务器的响应页面时的字符集。
在了解了以上内容后,开始剖析表单方式传递参数的乱码问题。
以上例为例,点击"Submit"按钮后,浏览器将做完"整形"手术后的请求报文发送给WEB服务器上的Servlet容器,容器在收到这个请求报文后,会解析这个请求报文并用这个报文的信息生成一个HttpServletRequest对象,然后将这个HttpServletRequest对象传给这个页面所要请求的jsp或Servlet(上例中为"requestresult.jsp")。在这个被请求的jsp或Servlet(上例中为"requestresult.jsp")中,使用HttpServ