中文编码格式有哪些(讲解汉字内码正确形式)

在码农的世界中除了Bug,还有一个比较头疼的事情,那就是中文编码格式,对于普通人,你现在看到的中文,或者说你看到的所有中文,其实都是中文,你可能根本就不关心它是什么编码格式,但是程序员却不得不关注中文的编码格式,或者代码的编码格式,不然就会出现下面这种:

中文字符编码格式的验证和证明
中文字符编码格式的验证和证明
中文字符编码格式的验证和证明

可能已经乱瞎你们的眼了,其实它们正常如下:

中文字符编码格式的验证和证明

中文字符编码格式的验证和证明

这就是编码格式导致的,乱到火星人也无法认识,编码不仅仅会导致显示出现短路,还会让程序无法正常运行,特别是在加解密或者验签中,如果不按规定的编码格式编码,经常会遇见:签名失败,验签不符这种的错误。今天分享的是如何证明编码的格式:

第一步:复制乱码的字符串(这个是还不要叫中文了,谁也不认识了),利用UE转16进制查看乱码处对应的16进制。如查看‘一个程序员’对应的16进制:

中文字符编码格式的验证和证明

第二步:在Java代码中查询‘一个程序员’对应的UTF-8和GBK 16进制表示;

中文字符编码格式的验证和证明

比较就可以发现UE中的‘一个程序员’的编码格式是GBK的,这样就可以证明对应中文的编码格式了。

获取字符串编码格式的16进制的Java代码如下:

中文字符编码格式的验证和证明

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至624739273@qq.com举报,一经查实,本站将立刻删除。
Like (0)
柳的头像

相关推荐

发表回复

Please Login to Comment
微信
微信
SHARE
TOP
要想花得少,就用购宝。话费电费9折起,官方公众号:购宝