`

Java WEB开发中的中文乱码问题解决

 
阅读更多
在项目中总是遇到乱码问题,有时候在网上查找到了解决方案,但是没有记录下来为什么出现的乱码。因为出现乱码的方式有好几种,我简单总结一下吧,为以后留着用,也算总结学习一下。
一般来讲,为了处理乱码问题,在javaweb中我们需要注意哪些地方?
1、java文件的编码格式
2、jsp页面的编码格式
3、在servlet中对request、response对象的编码格式的设定
4、浏览器中查看页面的字符集编码格式
前提:
1.开发和编译代码时指定字符集,JBuilder和Eclipse都可以在项目属性中设置。页面的编码格式一致:
所有页面的编码格式应该尽量一样,因为有时候在两个页面之间跳转的时候,如果编码格式不一,那么服务器不知道该用哪一种编码格式。
2.页面编码格式和tomcat配置文件中的编码格式保持一致:
tomcat/conf/server.xml配置文件中Connector(连接器)标签URIEncoding(统一资源标示符编码)的属性为"GBK"或"UTF-8"。
3.使用过滤器,如果所有请求都通过一个servlet控制分配器,那么使用servlet的filter的执行语句,将浏览器发送过来的请求都设置编码为utf-8.
在web.xml文件中:

   <filter>
    <filter-name>SetCharacterEncodingFilter</filter-name>
    <filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
    <init-param>
      <param-name>encoding</param-name>
      <param-value>utf-8</param-value>
    </init-param>
  </filter>
  <filter-mapping>
    <filter-name>SetCharacterEncodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
  </filter-mapping>

在类中:
public class SetCharacterEncodingFilter implements Filter {
	private String encoding;
public void init(FilterConfig filterConfig) throws ServletException {
		// TODO Auto-generated method stub
		this.encoding = filterConfig.getInitParameter("encoding");
	}
public void doFilter(ServletRequest request, ServletResponse response,
			FilterChain chain) throws IOException, ServletException {

request.setCharacterEncoding(this.encoding);
chain.doFilter(request, response);
}}


4.设定数据库连接方式是utf-8.
易出现乱码的方式: 
1.通过<a>超链接传递中文乱码。超链接地址栏传参和form表单的get方法,都是以get()方式向服务器提交的数据。这个时候我们会发现地址栏中出现的是中文被编码之后的一串%的东东,

<a   href="some.jsp?key=<%=java.net.URLEncoder.encode("可能包含中文的参数","UTF-8")%>">联结</a> 

2.通过javascript传递中文乱码
function getName(){
  var name=jQuery("#name").val();
  name= encodeURI(encodeURI(name));//需要经过两次编码
  window.location.href="user.action?name="+name;
}

在后台Action类中需要解码:
String name= request.getParameter("name");
try {
name= URLDecoder.decode(name, "UTF-8"); 
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}

因为iso-8859-1是Java中网络传输使用的标准字符集,request.getParameter("name")得到的还是ISO-8859-1字符集,所以要转换一下才不会是乱码。
3.通过表单get提交中文乱码
  第一:先解码然后转码
  第二:get走的是url提交方式,而在进入url之前已经进行了iso-8859-1的编码。要想影响这个编码可以在server.xml文件中Connector节点中添加userBodyEncodingURI="true",就可以控制tomcat对get方式的汉字编码。
4.通过表单post提交中文乱码
第一:其实这也和tomcat的内置编码有关,如果没有设置URIEncoding="UTF-8",那么默认的编码是iso8859-1,需要在servlet中String str=new String(request.getParameter("name").getBytes("ISO-8859-1"),"UTF-8").每一个汉字都需要这样编码,很麻烦。
第二:设定执行请求编码的格式request.setCharactorEncoding("UTF-8");
String str=request.getParameter("name");但是这种方法只针对post提交的参数有效,对于get和上传的方式则是无能为力的。




分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics