问题重现

在编写一个表单文件时,由于我考虑到表单中没有敏感数据,于是使用了get的方式来提交表单。

html<%@ page contentType="text/html;charset=UTF-8" language="java" %>
<html>
<head>
    <title>添加雇员</title>
</head>
<body>
<form action="emp_insert_do.jsp" method="get">
    雇员ID: <input type="text" name="empno"/>
    <br/>
    姓名: <input name="ename" type="text"/>
    <br/>
    工作: <input name="job" type="text"/>
    <br/>
    雇用日期: <input name="hiredate" type="text"/>
    <br/>
    基本工资: <input name="sal" type="text"/>
    <br/>
    <input type="submit" value="注册"/>
    <input type="reset" value="重置"/>
</form>
</body>
</html>

其中emp_insert_do.jsp这个文件正确的设置了编码:

request.setCharacterEncoding("utf-8");

但是真正存入到数据库中的汉字是乱码。

问题分析

对于表单中POST方式提交的数据,只要在接收数据的JSP中正确设置request.setCharacterEncoding·参数,即将对客户端请求进行重新编码的编码设置成浏览器编码,就可以保证得到的参数编码正确。有写读者可能会问,那如何得到浏览器编码呢?上面我们提过了,在默认请情况下,浏览器编码就是你在响应该请求的JSP页面中response.setCharacterEncoding设置的值。所以对于POST表单提交的数据,在获得数据的JSP页面中request.setCharacterEncoding要和生成提交该表单的JSP页面的 response.setCharacterEncoding设置成相同的值。

对于URL提交的数据和表单中GET方式提交的数据,在接收数据的JSP中设置request.setCharacterEncoding参数是不行的,因为在Tomcat5.0中,默认情况下使用ISO- 8859-1对URL提交的数据和表单中GET方式提交的数据进行重新编码(解码),而不使用该参数对URL提交的数据和表单中GET方式提交的数据进行重新编码(解码)。要解决该问题,应该在Tomcat的配置文件的Connector标签中设置useBodyEncodingForURI或者URIEncoding属性,其中useBodyEncodingForURI参数表示是否用request.setCharacterEncoding 参数对URL提交的数据和表单中GET方式提交的数据进行重新编码,在默认情况下,该参数为false(Tomcat4.0中该参数默认为true); URIEncoding参数指定对所有GET方式请求(包括URL提交的数据和表单中GET方式提交的数据)进行统一的重新编码(解码)的编码。 URIEncodinguseBodyEncodingForURI区别是,URIEncoding是对所有GET方式的请求的数据进行统一的重新编码(解码),而useBodyEncodingForURI则是根据响应该请求的页面的request.setCharacterEncoding参数对数据进行的重新编码(解码),不同的页面可以有不同的重新编码(解码)的编码。所以对于URL提交的数据和表单中GET方式提交的数据,可以修改 URIEncoding参数为浏览器编码或者修改useBodyEncodingForURItrue,并且在获得数据的JSP页面中 request.setCharacterEncoding参数设置成浏览器编码。

建议

  1. 对于同一个应用,最好统一编码,推荐为UTF-8,当然GBK也可以。

  2. 正确设置JSP的pageEncoding参数

  3. 在所有的JSP/Servlet中设置contentType="text/html;charset=UTF-8"或response.setCharacterEncoding("UTF-8"),从而间接实现对浏览器编码的设置。

  4. 对于请求,可以使用过滤器或者在每个JSP/Servlet中设置request.setCharacterEncoding("UTF-8")。同时,要修改Tomcat的默认配置,推荐将useBodyEncodingForURI参数设置为true,也可以将URIEncoding参数设置为 UTF-8(有可能影响其他应用,所以不推荐)。


MockingBird
5.8k 声望743 粉丝

引用和评论

0 条评论