|
如果说我自己非要加一些什么补充就是:
对于unicode码,因为它不同于 ascii,或者 gbk big5这三种编码。
它最大的变化是,它的字节是不固定的,而后三者都是 定字节,比如ascii码,一个字节表示一个编码,而gbk big5都是2字节。
因为它们表示的字符总数有限。
而unicode则不然,它已经容纳了全世界的文字和编码。
所以它采用了一种要复杂的多的多的编码。
但是,其实我们不用太关心这个事情。
因为,再复杂,我们都会有相应的转换算法。
比如说,虽然我在工作的时候,最终因为项目并非需要,我没有把实现 unicode gb2312 ascii三者之间的编码转化做进去,但实际上,我已经知道了一个专门用来处理转化的 C库。
libconv
所以下次,如果我再遇到这件事情,我第一时间就会去下载和编译,集成这个库到我自己的项目里,而你也可以。 |
|