Java语言的char类型是16位的;
Java支持Unicode,Java对Unicode支持采用的是UTF-16的编码实现;
在UTF-16下,Java的一个Unicode字符(代码点)由1或2个char(代码单元)表示。
Some sources for these fact:
http://baike.baidu.com/view/40801.htm?fr=ala0 ----> Unicode与UTF-8,UTF-16,UTF-32的关系
Core java(Volnume 1) Page 45 ----> 代码点,代码单元的概念
顺便贴出一个程序:
public class UnicodeShow {
public static void main(String[] args) {
String string = "我们都是中国人\uD843\uDC30";
/*返回这个字符串的代码单元数,也就是问"我们都是中国人"中有多少个16位,UTF-16中16位为一个代码单元。*/
System.out.println("The size of string \"我们都是中国人\uD843\uDC30\" is " + string.length());
System.out.println("The Unicode of 我 is \\u" + Integer.toHexString((short)string.charAt(0)));
}
}
其实在UCS-4标准中,有些代码点比如一些非常少见的字符,包括一些生僻汉字是4字节编码的即2个代码点。只是UCS-4标准很多设备还不支持。于是\uD843\uDC30显示一个方框\u20C30。
这是我的程序运行结果:
The size of string "我们都是中国人
分享到:
相关推荐
北京动力节点-Java编程零基础教程-053-Java基本语法-Unicode码.avi 北京动力节点-Java编程零基础教程-054-Java基本语法-UTF-8.avi 北京动力节点-Java编程零基础教程-055-Java基本语法-UTF-8的编码格式.avi 北京...
GB2312编码与utf-8编码的字符串的转换,主要使用windows api函数MultiByteToWideChar和WideCharToMultiByte,代码简洁,经测试可用
linux C/c++ 源代码,将中文字串与UTF-8格式字串相互转化,我在项目中使用的代码,完全可用
utf8test 以 UTF-8 编码打印所有 unicode 字符的控制台(终端)应用程序。 测试字体的完整性和查找... max length: 16)h show hex byte sequencec show UTF-8 characteru show unicode notation ("U+xxxx")-d char d
解码 说明:本方法保证 不论参数s是否经过escape()编码,均能得到正确的“解码”结果。另外如果出现了Erro—Parameters: Character decoding failed. 请使用escape(escape(s)...解码URL中的中文,默认使用UTF-8进行解码
\char2\2-1\ NIO类网络应用 提供了本书第2章的实例NIO类网络应用的源程序;...\char16\16-5\ Java Servlet应用的头部信息请求程序 提供了本书第16章的Java Servlet应用的头部信息请求程序实例的源程序;
char型是存储字符的数据类型,它在机器中占16位,范围为0-...在C /C++中,char型采用的是ASCII字符集,宽度为8位,范围为0-255,而Java中char型采用的是Unicode字符集,范围较 ASCII字符集更大,可以表示更多的字符
webpack加载器,用于将中文或双字节的scss / sass / less / css文件字符串转换为unicode char。 用法 npm install --save-dev css-unicode-loader 如果是vue-cli 3+,则将加载程序添加到vue config文件中。 // ...
Unicode下CString与char_转换
将UTF8格式的字符串转变为char型格式字符串
gromacs拉伸分子动力学模拟学习笔记之mdp文件-charmm36-2022力场
这是一个用JAVA语言编写的源代码,里面的内容主要是char数据类型的应用,适合初学者参考.
Java 3DMenu 界面源码,有人说用到游戏中不错,其实平时我信编写Java应用程序时候也能用到吧,不一定非要局限于游戏吧,RES、SRC资源都有,都在压缩包内。 Java zip压缩包查看程序源码 1个目标文件 摘要:Java源码...
ASCII 及UTF-8 与字符互相转换
UNICODE下宽字符的CString转换为const char 和char到WCHAR的相互转换
Java显示Unicode特殊字符, protected char base; // 指定我们显示的初始值7 protected Font font = new Font("serif", Font.PLAIN, 18); // 指定缺省的显示字体 protected Font headingfont = new Font(...
java_byte与char、String互转.................
Java通用范例开发金典-- 源码。字符处理,各种函数操作,源代码,可直接运行。
C语言中判断一个char*是不是utf8编码 里我修改了一下, 纯ASCII编码的字符串也返回true, 因为UTF8和ASCII兼容 实例代码: int utf8_check(const char* str, size_t length) { size_t i; int nBytes; unsigned ...
import java.io.*; /** * FileUtil. Simple file operation class. * * @author BeanSoft * */ public class FileUtil { /** * The buffer. */ protected static byte buf[] = new byte[1024]; /**...