unicode和UTF-8,ISO8859-1等是什么关系?

首先这两个究竟是什么关系?还有就是编码和实现是什么关系?有点没理解这些概念= =

又有人问这样的问题,我就只好贴链接了。
https://segmentfault.com/q/1010000004240543/a-1020000004241029

http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

谢谢阮一峰的博文http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

总结了一下,区别大概就是,Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。UTF-8等就是字符集的存储方式名称。一个是符号集,一个是存储方式,这就是区别。

ANSI 和 unicode 是两种不同的表示字符的标准体系。

ISO8859-1 还有GBK 这类的都是衍生自 ANSI的,这类编码是针对某种文字而建立的标准,一般只会兼容ASCII。

UTF-8、UTF-16 这些都是unicode标准的编码,旨在包含世界上所有的语言文字,以达到可以在不同语言环境的电脑上正常显示文字而不乱码,这类的编码因为包含的字符很多,所以占用空间会相对大一些。

简而言之,我们经常接触到的包括UTF-8,本质都是一样的,就是对unicode的一种包装,因而编码之间的转换,需要先转换成unicode然后再转换。

发表评论

电子邮件地址不会被公开。 必填项已用*标注