与国际标准ucs接轨的汉字编码
2023-06-22 分类:百科
TIPS:本文共有 315 个字,阅读大概需要 1 分钟。
ISO组织制定的国际标准ISO 10646定义了通用字符集(Universal Character Set, UCS)。UCS是所有其他字符集标准的一个超集,它保证与其他字符集是双向兼容的。
就是说,如果你将任何文本字符串翻译到UCS格式,然后再翻译回原编码,你不会丢失任何信息。
ISO 10646定义了一个31位的字符集。然而,在这巨大的编码空间中,迄今为止只分配了前65534个码位(0x0000到0xFFFD)。这个UCS的16位子集称为基本多语言面(Basic Multilingual Plane, BMP)。
将被编码在16位BMP以外的字符都属于非常特殊的字符(比如象形文字),且只有专家在历史和科学领域里才会用到它们。
如果觉得《与国际标准ucs接轨的汉字编码》对你有帮助,请点赞、收藏,并留下你的观点哦!
阅读剩余内容