jsp或java乱码

今天我又被JSP乱码问题撞了一下腰，特把该问题处理方案整理如下：

1、TOMCAT6.0.33配置文件server.xml没有URIEncoding="utf-8"

URL有中文字符串，后台用java，采用流行作法，

String str = request.getParameter("hello");

System.out.println(str);

结果乱码，改为

System.out.println(new String(str.getBytes("iso-8859-1"),"UTF-8"));

结果正常。

2、TOMCAT配置文件server.xml有URIEncoding="utf-8"，形如：

    <Connector port="8080" protocol="HTTP/1.1"
               connectionTimeout="20000"
               redirectPort="8443" URIEncoding="utf-8"/>
URL有中文字符串，后台用java，采用流行作法，

String str = request.getParameter("hello");

System.out.println(new String(str.getBytes("iso-8859-1"),"UTF-8"));

也是乱码，原因很简单，由于容器已经指定URIEncoding="utf-8"，勿需再转换！！！

改为System.out.println(str);结果即可正常。

3、无论字符原来用何种本地字符集表示，在Unicode字符集中都被表示成相同的编码。或者说，Unicode字符集和语言的种类无关。
使用两次编码的过程相当于如下代码：

            String name=java.net.URLEncoder.encode("测试", "UTF-8");
            System.out.println(name);
            name=java.net.URLEncoder.encode(name,"UTF-8");
            System.out.println(name);
            name=java.net.URLDecoder.decode(name, "UTF-8");
            System.out.println(name);
            System.out.println(java.net.URLDecoder.decode(name, "UTF-8"));
输出为：

            %E6%B5%8B%E8%AF%95
            %25E6%25B5%258B%25E8%25AF%2595
            %E6%B5%8B%E8%AF%95
            测试

第一次编码后将汉字编码为%和字母数字的格式，而第二次编码的时候是对%字母数字进行编码，虽然解码的时候使用的是ISO-8859-1，但是对于%和字母数字而言用ISO-8859-1和UTF-8解码出来的是一样的，此时就回到了汉字被编码过一次的字符串了，当再次进行解码的时候使用UTF-8就回将它转会汉字。

标签: 后台 jsp str.getbytes 下腰 uriencoding server.xml 又被配置文件撞了 tomcat6.0.33

首页

jsp或java乱码

猜您也喜欢...

热门TagS