·天新网首页·加入收藏·设为首页
首页|笔记本|手机|数码相机|摄像机|MP3/MP4|主板|内存|显示器|办公|打印机|下载|开发|汽车|学院|业界
硬件|台式机|数码|数字家庭|投影仪|GPS/CPU|显卡|硬盘|服务器|网络|一体机|驱动|源码|游戏|考试|报价
您现在的位置:天新网 > 软件开发 > Java开发 > Servlet/JSP
JSP和Servlet对中文的处理过程
http://dev.21tx.com 2007年12月11日 网页教学网

上一页 1 2 3 4 5 6 7 下一页

JSP:从源文件到Class的过程

Jsp的源文件是以“.jsp”结尾的文本文件。在本节中,将阐述JSP文件的解释和编译过程,并跟踪其中的中文变化。

1、JSP/Servlet引擎提供的JSP转换工具(jspc)搜索JSP文件中用中指定的charset。如果在JSP文件中未指定,则取JVM中的默认设置file.encoding,一般情况下,这个值是ISO8859-1;

2、jspc用相当于“Javac –encoding ”的命令解释JSP文件中出现的所有字符,包括中文字符和ASCII字符,然后把这些字符转换成Unicode字符,再转化成UTF格式,存为JAVA文件。ASCII码字符转化为Unicode字符时只是简单地在前面加“00”,如“A”,转化为“\u0041”(不需要理由,Unicode的码表就是这么编的)。然后,经过到UTF的转换,又变回“41”了!这也就是可以使用普通文本编辑器查看由JSP生成的JAVA文件的原因;

3、引擎用相当于“javac –encoding UNICODE”的命令,把JAVA文件编译成CLASS文件;

先看一下这些过程中中文字符的转换情况。有如下源代码:


这段代码是在UltraEdit for Windows上编写的。保存后,“中文”两个字的16进制编码为“D6 D0 CE C4”(GB2312编码)。经查表,“中文”两字的Unicode编码为“\u4E2D\u6587”,用 UTF表示就是“E4 B8 AD E6 96 87”。打开引擎生成的由JSP文件转变而成的JAVA文件,发现其中的“中文”两个字确实被“E4 B8 AD E6 96 87”替代了,再查看由JAVA文件编译生成的CLASS文件,发现结果与JAVA文件中的完全一样。

再看JSP中指定的CharSet为ISO-8859-1的情况。


同样,该文件是用UltraEdit编写的,“中文”这两个字也是存为GB2312编码“D6 D0 CE C4”。先模拟一下生成的JAVA文件和CLASS文件的过程:jspc用ISO-8859-1来解释“中文”,并把它映射到Unicode。由于ISO-8859-1是8位的,且是拉丁语系,其映射规则就是在每个字节前加“00”,所以,映射后的Unicode编码应为“\u00D6\u00D0\u00CE\u00C4”,转化成UTF后应该是“C3 96 C3 90 C3 8E C3 84”。好,打开文件看一下,JAVA文件和CLASS文件中,“中文”果然都表示为“C3 96 C3 90 C3 8E C3 84”。

如果上述代码中不指定,即把第一行写成“”,JSPC会使用file.encoding的设置来解释JSP文件。在RedHat 6.2上,其处理结果与指定为ISO-8859-1是完全相同的。

到现在为止,已经解释了从JSP文件到CLASS文件的转变过程中中文字符的映射过程。一句话:从“JspCharSet到Unicode再到UTF”。下表总结了这个过程:

表2 “中文”从JSP到CLASS的转化过程

Jsp-CharSet
JSP文件中
JAVA文件中
CLASS文件中

GB2312
D6 D0 CE C4

(GB2312)
从\u4E2D\u6587(Unicode)到

E4 B8 AD E6 96 87 (UTF)
E4 B8 AD E6 96 87 (UTF)

ISO-8859-1
D6 D0 CE C4

(GB2312)
从\u00D6\u00D0\u00CE\u00C4 (Unicode)到C3 96 C3 90 C3 8E C3 84 (UTF)
C3 96 C3 90 C3 8E C3 84 (UTF)

无(默认=file.encoding)
同ISO-8859-1
同ISO-8859-1
同ISO-8859-1

上一篇: EJB初学者怎样面对经常有的十一个疑惑
下一篇: JSP实例程序:统计当前在线人数

上一页 1 2 3 4 5 6 7 下一页

Google
 
热点文章
关于我们 | 联系我们 | 广告服务 | 工作机会 | 版权声明 | 欢迎投稿 | 网站地图
Copyright © 2000-2008 , www.21tx.com , All Rights Reserved .
晨新科技 版权所有 Created by TXSite.net