跨平台UNICODE编程总结

这段时间在架构整个服务器，虽然前段时间受到了5.12汶川8.0级大地震的影响（深切悼念在此次大地震中遇难的同胞们），但是，我的工作还是在不断地向前推进着。为了让我们的服务器能够跨平台（主要是WINDOWS与LINUX），且能支持世界上的各种语言，我写了一个跨平台的且支持UNICODE的库。

其实，我在之前也有写过跨平台方面的代码，积累了不少的经验，但在写这个库的过程，还是遇到过许多问题，我觉得其中最值得注意的是在UNICODE的支持上，之前没有仔细去研究过LINUX的UNICODE编程，所以也并不知道LINUX下的UNICODE与WINDOWS下的UNICODE其实是不一样的。WINODWS下的UNICODE都是用两个字节，16位来表示的，也就是UCS2，而LINUX下的UNICODE是用四个字节，32位来表示的。这就导致了同样的代码，在WINDOWS与LINUX中会产生不同的结果。

例如，同样的代码：

wchar_t Str[] = L"测试";

wprintf(L"ls",Str);

在WINDOWS下能够编译通过，但是在LINUX下却很可能是不能编译通过的。这个主要是因为:

WINDOWS下的UNICODE为UCS2，而LINUX下的UNICODE为UCS4。
代码文件的编码问题，WINDOWS下用VC保存的文件，都是WINDOWS.936编码的，VC也只能识别这种编码的带非英文字符的有效代码源文件；而LINUX下GCC需要的是与系统相关语言编码的源文件，如：如果LINUX下的语言是UTF8编码的，那么GCC就需要UTF8编码的带非英文字符的有效代码源文件，否则就会报错。

所以如果想要让编写的代码跨平台且支持UNICODE，那么就最好不要在有效代码中使用非英文字符，鉴于此，可以使用UNICODE文件来代替代码中的非英文字符。需要注意的是在读取文件后，需要根据不同的平台作平台相关的UNICODE编码转换，比如：WINDOWS就转换成UTF16（UCS2）的UNICODE，而LINUX就转换成UTF32（UCS4）的UNICODE。

跨平台UNICODE编程总结

相关文章

最近文章

分类

标签

友情链接

其它