对Java程序中的中文乱码问题的解决方法_java代码

对Java程序中的中文乱码问题的解决方法_java代码

源代码 2013-3-3　版权投诉上传资料复制论文网址上传用户：lqchinaqqq

录中，它存在于 WEB 容器的临时目录中，故这一步中我们也把它做为 Servlets 来看。对于 Servlets，客户端请求它时，WEB 容器调用它的 JVM 来运行 Servlet，首先，JV M 把 Servlet 的 class 类从系统
    中读出并装入内存中，内存中是以 UNICODE 编码的 Servl et 类的代码，然后 JVM 在内存中运行该 Servlet 类，如果 Servlet 在运行的过程中，需要接受从客户端传来的字符如：表单输入的值和 URL 中传入的值，此时如果程序中没有设定接受参数时采用的编码格式，则 WEB 容器会默认采用 ISO-8859-1 编码格式来接受传入的值并在 JVM 中转化为 UNICODE 格式的保存在 WEB 容器的内存中。 Servlet 运行后生成输出，输出的字符串是 UNICODE 格式的，紧接着，容器将 Servlet 运行产生的 UNICODE 格式的串（如 html 语法，用户输出的串等）直接发送到客户端浏览器上并输出给用户，如果此时指定了发送时输出的编码格式，则按指定的编码格式输出到浏览器上，如果没有指定，则默认按 ISO-8859-1 编码发送到客户的浏览器上。 D、Java 程序和数据库之间对于几乎所有数据库的 JDBC 驱动程序，默认的在 JAVA 程序和数据库之间传递数据都是以 ISO-8859-1 为默认编码格式的，所以，我们的程序在向数据库内存储包含中文的数据时，JDBC 首先是把程序内部的 UNICODE 编码格式的数据转化为 ISO-8859-1 的格式，然后传递到数据库中，在数据库保存数据时，它默认即以 ISO-8859-1 保存，所以，这是为什么我们常常在数据库中读出的中文数据是乱码。 3、分析常见的 JAVA 中文问题几个必须清楚的原则首先，经过上面的详细分析，我们可以清晰地看到，任何 JAVA 程序的生命期中，其编码转换的关键过程是在于：最初编译成 class 文件的转码和最终向用户输出的转码过程。
    其次，我们必须了解 JAVA 在编译时支持的、常用的编码格式有以下几种： *ISO-8859-1，8-bit, 同 8859_1,ISO-8859-1,ISO_8859_1 等编码 *Cp1252，美国英语编码，同 ANSI 标准编码 *UTF-8，同 unicode 编码
    *GB2312，同 gb2312-80,gb2312-1980 等编码 *GBK , 同 MS936，它是 gb2312 的扩充及其它的编码，如韩文、日文、繁体中文等。同时，我们要注意这些编码间的兼容关体系如下： unicode 和 UTF-8 编码是一一对应的关系。GB2312 可以认为是 GBK 的子集，即 GB K 编码是在 gb2312 上扩展来的。同时，GBK 编码包含了 20902 个汉字，编码范围为：0x 8140-0xfefe，所有的字符可以一一对应到 UNICODE2.0 中来。再次，对于放在操作系统中的.java 源程序文件，在编译时，我们可以指定它内容的编码格式，具体来说用-encoding 来指定。注意：如果源程序中含有中文字符，而你用-encod ing 指定为其它的编码字符，显然是要出错的。用-encoding 指定源文件的编码方式为 GBK 或 gb2312，无论我们在什么系统上编译含有中文字符的 JAVA 源程序都不会有问题，它都会正确地将中文转化为 UNICODE 存储在 cla
    ss 文件中。然后，我们必须清楚，几乎所有的 WEB 容器在其内部默认的字符编码格式都是以 IS O-8859-1 为默认值的，同时，几乎所有的浏览器在传递参数时都是默认以 UTF-8 的方式来传递参数的。所以，虽然我们的 Java 源文件在出入口的地方指定了正确的编码方式，但其在容器内部运行时还是以 ISO-8859-1 来处理的。



首页 12原创
版权说明
上一篇：实验三Java基本应用_java代码
下一篇：关于企业电子商务网站的平安控制

【设为主页】【加入收藏】【打印本文】【回到顶部】【关闭此页】
特别推荐

免费论文,原创论文,参考论文,论文源代码-网学

对Java程序中的中文乱码问题的解决方法_java代码