JSP中文乱码的产生原因及解决方案
- 格式:pdf
- 大小:200.29 KB
- 文档页数:10
万方数据《电子设计工程》2011年第1期转换的规律。
3)缩程所用的软件工具的字符编码开发JSP文件时,1)iS08859一l编码通常叫做htin一1,属于单字节编码.最多能表示的字符范围是0~255.应用于英文系列。
IS08859一l编码表示的字符范围很窄,无法表示中文字符。
但是.由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍IH使用IS08859一l编码来表示。
而且在很多协议上.默认使用该编码。
2)GB2312/GBK编码这就是汉字的国标码,专门用来表示汉字.是双字节编码其中GBK编码能够用来同时表示繁体字和简体字,而GB2312只能表示简体字,GBK是兼容GB2312编码的。
3)Unicode编码这是最统一的编码,可以用来表示所有语言的字符,而且是定长双字节(也有四字节的)编码,包括英文字母在内。
但是它是不兼容IS08859一l编码的,也不兼容任何编码。
4)UTF一8编码UTF一8编码兼容IS08859一l编码.兼容Unicode编码。
兼容同时也可以用来表示所有语言的字符.不过。
UTF-8编码是不定长编码,每一个字符的长度从l~6个字节不等。
另外,UTF一8编码自带简单的校验功能。
一般来讲。
英文字母都是用一个字节表示,而汉字使用3个字节。
从以上的所述13I可以知道。
当网贞上仅有英文字符时。
可以选用IS08859一l编码。
网贞141上一旦有汉字时,字符的编码必须为GB2312/GBK编码.Unicode编码或UrⅡ、_8编码。
特别值得一提的是。
UTF一8编码还与其他编码兼容。
使用这种编码.就不会出现乱码。
2影响JSP文件中字符编码的外部因素在JSP动态网页开发过程中.所谓的影响JSP文件巾字符编码的外部因素,是指运行其他软件的最低层软件——操作系统。
建立JSP文件时所用的软件,以及显示JSP文件的工具对汉字编码的影响151。
具体地说就是操作系统、测览器、编程所用的软件T具。
每个软件都有自己默认支持的字符编码。
JSP乱码问题探讨摘要:SP是以Java编程语言为基础的跨平台WEB开发技术,在全球WEB开发领域都占据了很大的空间,然而在JSP中处理和显示中文时常常出现问题。
本文对JSP中文显示乱码问题产生的原因作了分析,并提出相应的较为简单的解决方案。
关键词:JSP 乱码0 引言SUN公司在Java的基础上开发出来的JSP(Java Server Pages)实现了动态页面与静态页面的分离、脱离了硬件平台的束缚,以及编译后运行等方式,大大提高了其执行效率而逐渐成为因特网上的主流开发工具。
Java 语言在内部采用Unicode表示字符,Unicode是用两个字节表示一个字符的字符编码。
而我们通常使用的中文字符编码如GB2312,GBK等都是双字节字符集,与Unicode的编码机制有很大差别,所以在中文环境下,就存在一个编码转换的问题。
然而,在这个方面,Java或是JSP做的并不完善。
1 JSP乱码解决方案现状分析在JSP技术中,数据采用的默认编码格式并不支持中文,因此,当涉及到中文的时候,必须做出一定的编码转换才能支持中文显示。
虽然某些开发环境提供了一些解决方案,例如在Tomcat中,编辑web.xml里面的filter标签来解决一些问题,还比如编写一些编码转换的JavaBean来解决问题,然而,在笔者看来,这些都有些复杂,不适合初学者掌握,并且其处理的结果往往不尽如人意。
编辑web.xml需要我们掌握一定的XML方面的知识,编写JavaBean要求我们的Java基础足够扎实,难道没有这些,就处理不了JSP的中文显示乱码问题了吗?下一节中给出了比较简单的解决方案,并且被证明是行之有效的。
2 JSP乱码解决方案想解决JSP乱码问题,就必须对JSP乱码进行一定的认识,把乱码问题分为三类,基本上囊括了日常出现的乱码问题。
2.1 第一类出现的问题:JSP服务器端编辑页面上是中文,但是浏览器看到的是乱码。
分析:浏览器端遇到中文不能正确显示,首先应该检查浏览器是否支持中文,浏览器的编码是否设置正确。
在java编程中,经常会碰到汉字的处理及显示问题,一不小心就会产生一大堆乱码或问号,这也是让许多初学者手足无措的讨厌问题。
造成这种问题的根本原因是java中默认的编码方式是Unicode,而中国人通常使用的文件和DB都是基于GB2312或者big5等编码,固会出现此问题。
对于中文问题,不同的jdk版本,不同的应用服务器,处理方法都会有一些微小的差异。
在这里,主要针对Tomcat中JSP开发容易出现的中文乱码问题进行讨论,当然,大多数解决方法是通用的。
一般有以下几种情况:1、JSP输出中文的乱码问题所谓在JSP输出中文,即直接在JSP中输出中文,或者给变量赋中文值再输出等,这种情况下的乱码问题往往是因为没有给JSP页面制定显示字符的编码方式,解决方法如下:(1)在JSP页面头部加上语句<% @ page contentType=”text/html;charset=utf-8”%>(在servlet 中使用httpServletResponse.setContentType(“text/html; charset=utf-8”)),最好同时在JSP页面的head部分加上<meta http-equiv=”Content-Type”content=”text/html;charset=utf-8”>。
(2)在每次要输出中文的地方主动转换编码方式,比如要在页面中输入“中文”二字,就可以用以下方法:<%String str = “中文”;Byte[] tmpbyte = str.getBytes(“ISO8859_1”);str = new String(tmpbyte);out.print(str);2、获取表单提交的数据时的中文乱码问题在没有加任何其他处理之前,用request.getParameter(“paramName”)获取表单提交中的数据,且表单数据中含有中文时,返回的字符串会呈现乱码。
JSP中文乱码问题解决方案中文乱码就是因为编码不符,可能出现乱码有四个地方:1 JSP编码乱码2 HTML编码乱码3 request获取数据乱码4 response输出信息乱码5 Cookie导致的编码问题下面将会对上面几种情况进行介绍:1 JSP乱码这种是最常见的,设置编码的位置位于JSP的第一行,如果在Eclipse中新建一个JSP默认是下面这种:<%@ page language="java"contentType="text/html; charset=ISO-8859-1"pageE ncoding="ISO-8859-1"%>可以看到它默认的页面编码和传输编码都是ISO-8859-1,这是用于欧洲国家的编码。
可以通过设置Eclipse中JSP的编码格式,来修改默认生成的编码格式。
如果想要支持中文,可以使用UTF-8、GB2312、GBK等,其中UTF-8是国际化的,哪个国家的都支持,所以推荐使用这个。
再来说说上面涉及到编码的两个地方:charset 和pageEncodingcharset是指服务器发往客户端展现时的编码;pageEncoding用于设置JSP页面本身的编码。
JSP在部署后提供给用户使用,会经过三个阶段:(1)JSP生成java文件:这个阶段会使用pageEncoding所定义的编码格式进行转换(2)java文件生成class文件:这个阶段由服务器tomcat自动使用utf -8编码把java文件转换成字节码class文件(3)通过读取class文件展现给用户:这个阶段由tomcat服务器获取字节码内容,通过使用contentType所定义的编码格式展现给用户。
大致过程如下图:这样设置好JSP中的第一行代码,就可以保证基本的JSP展现没有乱码了!<%@ page language="java"contentType="text/html; charset=UTF-8"pageEncodi ng="UTF-8"%>2 HTML乱码因为JSP中也包含html的内容,HTML本身也是有编码格式的。
jsp中文编码乱码的分析与解决摘要jsp技术目前普遍应用于网络编程,java在中文处理方面经常出现乱码现象。
本文从分析各种常见的jsp页面中文乱码产生的原因入手,并给出该乱码的解决方案。
经过多次实践,基本可以解决常见jsp页面常见的中文乱码问题,有着很好的广泛性。
关键词网络编程;中文乱码;jsp页面编码0引言JSP(Java Server Pages)是由Sun公司倡导、许多公司参与一起建立的一种动态网页技术标准,jsp技术采用java作为开发脚本语言,java本身有着很好的跨平台性,但是jsp在结合页面技术后,最使人头疼的一个问题就是不能很好的处理中文乱码问题,在开发过程中带来诸多不便,本文从剖析中文乱码产生的各种原因入手,并给出相应的解决方案。
1中文乱码的根源1)中文的编码很多,在不同的情况下可能有多种不同的二进制值;2)在某些应用中传递数据时,可能把中文转换成其它形式;3)在一个应用系统中,编码之间存在各种各样的转换;4)在转换过程中需要制定编码方式;5)在具体实践过程中,可能忽略或忘记设置编码;6)不同的软件环境其编码设置方式不同也容易导致中文乱码;7)编码工具的多样性以及对编码的模糊认识不清。
2常见的jsp页面中文乱码网上常出现的JSP/Servlet encoding 问题一般都表现在browser 或应用程序端,如:浏览器中看到的Jsp/Servlet 页面中的汉字怎么都成了‘?’;浏览器中看到的Servlet 页面中的汉字怎么都成了乱码;JA V A 应用程序界面中的汉字怎么都成了方块;Jsp/Servlet 页面无法显示GBK 汉字;Jsp/Servlet 不能接收form 提交的汉字;JSP/Servlet 数据库读写无法获得正确的内容。
3 中文乱码产生原因分析1)在jsp中如果指定了,那么在该jsp中所有用到的数据,如果沒有指定编码,那么这些数据的编码方式为A。
从request得到的数据如果没有指定request的编码的话,默认编码为iso-8859-1。
页面乱码这种乱码的原因是应为没有在页面里指定使用的字符集编码,解决方法:只要在页面开始地方用下面代码指定字符集编码即可代码如下数据库乱码这种乱码会使你插入数据库的中文变成乱码,或者读出显示时也是乱码,解决方法如下:在数据库连接字符串中加入编码字符集代码如下 String Url="jdbc:myql://localhot/digitgulfuer=root&paword=root&ueUnicode=true&characterEncoding=GB2312";并在页面中使用如下代码:代码如下 repone.etContentType("te某t/html;charet=gb2312"); requet.etCharacterEncoding("gb2312");URL传值乱码方法一:1. 在b.jp中把pageEncoding="GB2312"改为pageEncoding="ISO8859-1"虽然这样b.jp页面显示的内容还是乱码,但是不是那种“ ”的乱码,而是一些特殊字符2. 然后在浏览器中查看菜单中修改成GB2312的编码,这时乱码就显示中文了。
3. 但是这种方法是不可行的。
方法二:1. 在b.jp中把代码如下 String name=requet.getParameter("name");修改为代码如下 String name=new String(requet.getParameter("name").getByte("ISO-8859-1"),"GB2312");2. 这时再在页面上显示,则就是中文了。
方法三:在请求页面的请求参数需要用encodeURI进行转码,然后在接收请求的页面需要进行字符集转换。
JSP中文乱码问题有如下几个方面:页面乱码、参数乱码、表单乱码、源文件乱码。
下面来逐一解决其中的乱码问题。
一、JSP页面中文乱码在JSP页面中,中文显示乱码有两种情况:一种是HTML中的中文乱码,另一种是在JSP中动态输出的中文乱码。
先看一个JSP程序:[java]view plaincopyprint?1.<%@ page language="java"import="java.util.*" %>2.<html>3. <head>4. <title>中文显示示例</title>5.6. </head>7. <body>8.这是一个中文显示示例:9. <%10. String str = "中文";11. out.print(str);12. %>13. </body>14.</html>上面这个JSP程序看起来好像是在页面显示几句中文而且标题也是中文。
运行后在浏览器中显示如图所示原因在于没有在JSP中指定页面显示的编码,消除乱码的解决方案很简单上面代1.<%@ page language="java"import="java.util.*" contentType="text/html;charset=GB2312" %>再次运行乱码消失,原理就是向页面指定编码为GB2312,那么页面就会按照此编码来显示,于是乱码消失。
二、URL传递参数中文乱码一般情况下在使用get方法提交表单的时候传递的参数如果是中文的话很可能会出现乱码。
下面是一个示例程序[java]view plaincopyprint?1.<%@ page language="java"import="java.util.*" contentType="text/html; charset=gb2312"%>2.<html>3. <head>4. <title>URL传递参数中文处理示例</title>5. </head>6. <%7. String param = request.getParameter("param");8. %>9. <body>10. <a href="URLCharset.jsp?param='中文'">请点击这个链接</a><br>11.你提交的参数为:<%=param%>12. </body>13.</html>上面这个JSP程序的功能就是通过一个URL链接向自身传递一个参数,这个参数是中文字符串,这个程序的运行效果如下图对于URL传递中文参数乱码这个问题,其处理方法比较特殊,仅仅转换这个中文字符串或者设置JSP页面显示编码都是不能解决问题的,需要修改Tomcat服务器的配置文件才能解决问题。
JSP技术中的中文乱码成因与对策探析JSP技术是进行动态网页设计过程中的关键技术,然后在进行网页的设计和开发过程中,利用JSP技术会经常出现中文乱码的问题,从而影响了动态网页的正常使用。
因此,本文通过简要介绍JSP技术开发过程出现中文乱码的主要原因,进而针对中文乱码出现的不同原因提出了相应的解决策略。
标签:JSP技术;动态网页技术;中文乱码;显示乱码0 引言中文利用了特殊的字符编码方式,所以在利用JSP技术进行动态网页开发过程中,如果没有注意到这一点,很可能会造成中文乱码问题。
中文乱码问题出现的原因有很多,所以本文主要介绍了中文乱码出现的主要场景,进而针对其出现的原因提出了响应的解决策略,从而为更多的JSP技术开发人员提供参考。
1 字符常见的几种编码格式字符常见的几种编码格式如下:第一,Lain-1编码,这种编码格式仅仅支持英文系列的编码,不支持汉字编码,因此在具有汉字的情况下,一定不能使用这种编码方式;第二,GB2312/GBK编码,这种编码方式是专门用来表示汉字的,而且支持简体字和繁体字两种不同的表示方式;第三,unicode编码,这种编码方式支持中文的编码,同时也支持英文的编码,但是它无法很好地对Latin-1编码格式进行兼容;第四,UTF-8编码,目前很多开发的场景下都是使用该种编码方式进行编码,它不仅支持中英文,而且对其他编码方式都能做的很好的兼容。
2 影响JSP技术中文乱码的外部因素其实在利用JSP技术进行动态网页的开发过程中,会受到很多外在因素的影响,这些因素也是造成中文乱码的重要因素,主要体现在以下几点:2.1 操作系统的字符编码由于操作系统存在很多版本,因此其字符编码也不尽相同,对于很多操作系统来讲,默认的编码方式是Latin-1的编码方式,即很多操作系统默认是不支持中文的。
但是,值得庆幸的是,目前很多操作系统可以通过修改其配置文件,更改它的编码方式,能够满足不同用户对操作系统的需求。
JSP中文乱码的产生原因及解决方案在JSP的开发过程中,经常出现中文乱码的问题,可能一直困扰着大家,现在把JSP 开发中遇到的中文乱码的问题及解决办法写出来供大家参考。
首先需要了解一下Java中文问题的由来:Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。
原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。
首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。
基于这种乱码,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding GBK或-ecoding gb2312或-ecoding UTF-8编译;对于JSP,在文件头加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解决这类乱码问题。
下面是一些常见中文乱码问题的解决方法(下面例子中ecoding采用的是gb2312,也可设为ecoding GBK或ecoding UTF-8):一、 JSP页面乱码这种乱码问题比较简单,一般是页面编码不一致导致的乱码,一般新手容易出现这样的问题,具体分以下两种情况:未指定使用字符集编码下面的显示页面(display.jsp)就出现乱码:<html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"> </head><body><%out.print("JSP的中文处理");%></body>这种乱码的原因是没有在页面里指定使用的字符集编码,JSP页面中出现了中文字符,而默认的ISO-8859-1字符集中无中文字符,解决方法:只要在页面开始地方用下面代码指定字符集编码即可,在JSP页面中指定编码方式(gb2312),和浏览器解码方式设置相同,即在页面的第一行加上:<%@ page contentType="text/html; charset=gb2312"%>,就可以消除乱码了。
完整页面如下:<%@ page contentType="text/html; charset=gb2312"%><html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"> </head><body><%out.print("JSP的中文处理");%></body></html>编码字符集设置不一致下面的显示页面(display.jsp)就出现乱码:<%@ page language="java" pageEncoding="gb2312"%><%@ page contentType="text/html;charset=iso8859-1"%><html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"> </head><body><%out.print("JSP的中文处理");%></body>这个出现乱码原因是由于页面编码不一致导致的乱码,在这个例子中我们可以看到有三处设置字符集的地方,下面分别了解一下这三处设置具体含义:第一处<%@ page language="java" pageEncoding="gb2312"%>的编码格式为jsp文件的存储格式。
Eclipse会根据这个编码格式保存文件。
并编译jsp文件,包括里面的汉字。
第二处编码为解码格式。
因为存为gb2312的文件被解码为iso8859-1,这样如有中文肯定出乱码。
也就是必须一致。
而第二处所在的这一行,可以没有。
缺省也是使用iso8859-1的编码格式。
所以如果没有这一行的话,也会出现乱码。
必须一致才可以。
第三处编码为控制浏览器的解码方式。
如果前面的解码都一致并且无误的话,这个编码格式用不用设置都可以。
有的网页出现乱码,就是因为浏览器不能确定使用哪种编码格式。
因为页面有时候会嵌入页面,导致浏览器混淆了编码格式出现了乱码。
完整解决代码如下:<%@ page language="java" pageEncoding="gb2312"%><%@ page contentType="text/html;charset= gb2312"%><html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"> </head><body><%out.print("JSP的中文处理");%></body></html>二、 表单提交中文时出现乱码下面是一个提交页面(submit.jsp),代码如下:<%@ page contentType="text/html; charset=gb2312"%><html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312"></head><body><form name="form1" method="post/get" action="process.jsp"><div align="center"><input type="text" name="name"><input type="submit" name="Submit" value="Submit"></div></form></body></html>下面是处理页面(process.jsp)代码:<%@ page contentType="text/html; charset=gb2312"%><html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312"> </head><body><%=request.getParameter("name")%></body></html>如果submit.jsp提交英文字符能正确显示,如果提交中文时就会出现乱码。
原因:浏览器默认使用UTF-8编码方式来发送请求,而UTF- 8和GB2312编码方式表示字符时不一样,这样就出现了不能识别字符。
POST提交方式解决办法:A、接受参数时进行编码转换String s=new String(request.getParameter("name").getBytes("ISO-8859-1"),"gb2312") ;修改后的process.jsp代码如下:<%@ page contentType="text/html; charset=gb2312"%><html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312"> </head><body><%String s=new String(request.getParameter("name").getBytes("ISO-8859-1"),"gb2312") ;out.print(s);%></body></html>如果使用该方法的话,每一个参数都必须这样进行转码。
很麻烦。
但确实可以拿到汉字。