不依赖任何系统API，用c语言实现gbk/utf8/unicode编码转换

2023-07-30 12:31:25

转载地址:https://blog.csdn.net/bladeandmaster88/article/details/54837338

汉字'我'

Unicode编码是0x6211 01100010 00010001

UTF8编码是 0xe68891 11100110 10001000 100010001

Unicode符号范围

(十六进制)

UTF-8编码方式

(二进制)

0x00 - 0x7F

0x80 - 0x7FF

0x800 - 0xFFFF

0zzzzzzz

110yyyyy 10zzzzzz

1110xxxx 10yyyyyy 10zzzzzz

0x10000 - 0x1FFFFF

0x200000 - 0x3FFFFFF

0x4000000 - 0x7FFFFFFF

11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

一、Unicode转utf8

‘我’的unicode编码0x6211,二进制为: 01000010 00010001

将二进制形式分割成3段为0110 001000010001(分别是高4位、中间的6位、最后的低6位)

unicode转utf8只需要这3段分别填入1110xxxx 10yyyyyy 10zzzzzz中的xxxx yyyyyy zzzzzz

得utf8编码是0xe6889,二进制为: 11100110 10001000 100010001

int UnicodeToUtf8(char *pInput, char *pOutput)
{int len = 0; //记录转换后的utf8字符串的字节数while (*pInput) {//处理一个unicode字符char low = *pInput;  //取出unicode字符的低8位pInput++;char high = *pInput;  //取出unicode字符的高8位int w=high<<8;unsigned wchar = (high<<8)+low;  //高8位和低8位组成一个unicode字符，加法运算级别高if (wchar <= 0x7F) //英文字符{pOutput[len] = (char)wchar;  //取wchar的低8位len++;} else if (wchar >= 0x80 && wchar <= 0x7FF) //可以转换成双字节pOutput字符{pOutput[len] = 0xc0 | ((wchar >> 6)&0x1f);  //取出unicode编码低6位后的5位，填充到110yyyyy 10zzzzzz 的yyyyy中len++;    pOutput[len] = 0x80 | (wchar & 0x3f);  //取出unicode编码的低6位，填充到110yyyyy 10zzzzzz 的zzzzzz中len++;}   else if (wchar >= 0x800 && wchar < 0xFFFF) //可以转换成3个字节的pOutput字符{pOutput[len] = 0xe0 | ((wchar >> 12)&0x0f)J;  //高四位填入1110xxxx 10yyyyyy 10zzzzzz中的xxxxlen++;pOutput[len] = 0x80 | ((wchar >> 6) & 0x3f);  //中间6位填入1110xxxx 10yyyyyy 10zzzzzz中的yyyyyylen++;pOutput[len] = 0x80 | (wchar & 0x3f);  //低6位填入1110xxxx 10yyyyyy 10zzzzzz中的zzzzzzlen++;}else //对于其他字节数的unicode字符不进行处理{return -1;}pInput++;//处理下一个unicode字符}//utf8字符串后面，有个\0pOutput[len] = 0;return len;
}

二、utf8转unicode

utf8二进制形式为1110xxxx 10yyyyyy 10zzzzzz

'我'的utf8编码0xe6889,二进制为:11100110 10001000 100010001

分别提取里面的xxxx yyyyyy zzzzzz,然后组合成xxxxyyyy yyzzzzzz,

xxxxyyyy就是unicode的高8位，yyzzzzzz就是unicode的低8位

/*
* 将utf8编码转换成Unicode (UCS-2LE) 编码  低地址存低位字节
* 参数:
*     char *pInput    输入字符串
*     char *pOutput   输出字符串
* 返回值: 转换后的Unicode字符串的字节数，如果出错则返回-1
*/
//utf8转unicode
int Utf8ToUnicode(char *pInput, char *pOutput)
{int outputSize = 0;   //记录转换后的Unicode字符串的字节数while(*pInput) {if (*pInput > 0x00 && *pInput <= 0x7F) //处理单字节UTF8字符(英文字母、数字){*pOutput = *pInput;pOutput++;*pOutput = 0;   //小端法表示，在高地址填补0} else if (((*pInput) & 0xE0) == 0xC0) //处理双字节UTF8字节{char high = *pInput;pInput++;char middle = *pInput;pInput++;char low = *pInput;if (((middle & 0xC0) != 0x80) || ((low & 0xC0) != 0x80)) {return -1;}*pOutput = (middle << 6) + (low & 0x3F); //取出middle的低两位与low的低6位，组合成unicode字符的低8位pOutput++;*pOutput = (high << 4) + (middle >> 2) & 0x0F); //取出high的低四位与middle的中间四位，组合成unicode字符的高8位} else //对于其他字节数的UTF8字符不进行处理{return -1;}pInput ++; //处理下一个utf8字符pOutput++;outputSize += 2;
}//unicode字符串后面，有两个\0
*pOutput = 0;
pOutput++;
*pOutput = 0;
return outputSize;

//一个调用示例
int main(int argc, char **argv)
{//汉字'我'的UTF8编码是0xe68891,Unicode的编码是0x6211//1.unicode转utf8char unicodeStr[3] = {0x11, 0x62, 0x00}; //'我'的unicode是0x6211,按低地址存低位字节char *utf8Str = new char[5];memset(utf8Str, 0, 5);int num = UnicodeToUtf8(unicodeStr, utf8Str);unsigned char *p = (unsigned char *)utf8Str;for (int i=0; i

 
三、gbk与unicode互转 
代码下载地址：c语言利用编码转换表实现gbk与unicode互转 
  
参照博客： 
http://blog.csdn.net/tge7618291/article/details/7599902
http://www.ithao123.cn/content-1832906.html 
 
                        
                        
本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！



                    



                    

    收藏
    



                    
    
        
        标签：技术
        
    

    
        
                
            上一篇 >
            四大开源无人机项目，极客要Get了
        
                
            下一篇 >
            【slighttpd】基于lighttpd架构的Server项目实战(5)—TCP的TIME_WAIT状态
        
                
    



                    
    
        
        
            相关文章
        
                
            Duilib中list控件支持ctrl和shif多行选中的实现
        
                
            [ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif
        
                
            win10系统 微软输入法 于eclipse ctrl+shif+f冲突间接处理办法
        
                
            Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif
        
                
            读LDD3，内存映射与DMA--PAGE_SHIF…
        
                
            VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】
        
                
            更换iBus五笔的左与右Shif
        
                
            sublime ctrl+shif+f 没用解决办法
        
                
            idea 对 ctrl + z 的撤销 是 ctrl + shif + z
        
                
            计算机最早的设计师应用于,计算机应用基础选择题doc.doc
        
                
            win10自带截图神器：Win+Shift+S
        
                
            Python基础之文件目录操作
        
                
            python简述目录_Python基础之文件目录操作(示例代码)
        
                
            tp5 如何做数据采集
        
                
            任务2-7(服务器字体+阿里巴巴矢量库)
        
                
            html标签（1)：h1~h6,p,br,pre,hr
        
                
            TI 电量计介绍与芯片选型指南
        
                
            几款TI电源芯片简介
        
                
            TI DSP芯片C2000系列读取FLASH数据
        
                
            德州仪器(Ti)平台嵌入式开发基础
        
                
            TI三相电机智能栅极驱动芯片特点分类
        
                
            省选模拟（12.08） T3 圈圈圈圈圈圈圈圈
        
                
            Hadoop生态圈技术栈（上）
        
                
            大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询
        
                
            小猿圈之Linux下Mysql 操作命令
        
                
            大数据Hadoop生态圈常用面试题
        
                
            大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作
        
                
            备战Noip2018模拟赛11（B组）T3 Monogatari 物语
        
                
            【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码
        
                
            NYOJ 78 圈水池
        
                
            递归问题 跑道 汽车 绕圈问题 Python实现
        
                
            Hadoop生态圈（三）：MapReduce



        
            


            

    
        内容推荐
    
    
                
            
                1
            
            
                大厂出品！保姆级教程帮你掌握「用户体验要素」
            
        
                
            
                2
            
            
                大厂实战案例！设计师如何助力京东快递业务增长？
            
        
                
            
                3
            
            
                总监干货！5个常见的UI设计规范创建误区
            
        
                
            
                4
            
            
                数据库管理利器——Navicat Premium v17.0.4学习版(Windows+MacOS+Linux)
            
        
                
            
                5
            
            
                进阶必学！快速掌握10种国际主流设计模型
            
        
                
            
                6
            
            
                春节期间，10个大厂的产品细节走心设计
            
        
                
            
                7
            
            
                如何帮助用户度过新人期？来看雪球APP的实战总结！
            
        
                
            
                8
            
            
                Sketch 95.3最新版下载 (Sketch矢量绘图应用软件)
            
        
                
            
                9
            
            
                Axure RP 9 最新正式版安装软件与汉化语言包下载(2023年3月30日更新)
            
        
                
            
                10
            
            
                嘘！SaaS产品的差异化设计细节，一般人我不告诉他
            
        
            




    





    
    
        最新更新
    
    
        
                        
                [产品经理]
                3分钟绘制流程图！这个AI+绘图工具的神仙组合，学完老板直呼内行
            
                        
                [产品经理]
                商业潜规则：打败你的不是AI，而是人性
            
                        
                [产品设计]
                DeepSeek+智能派单系统的实践分享
            
                        
                [产品经理]
                一文读懂本年实际损益借(贷)方发生额
            
                        
                [创业学院]
                大客户 vs 中小企业：需求竟天差地别？以企业培训数字化为例
            
                        
                [产品经理]
                不要将员工的“猴子”背到自己身上：职场管理中的权责划分
            
                        
                [产品经理]
                人工智能的三层架构：从应用层到基础服务层，解密智能革命
            
                        
                [产品设计]
                一文讲清楚iOS的SKAN4.0
            
                    
    
    



    
        热门标签
    
    
        
                         数量
                         AI技术趋势
                         用户角色
                         心智游移
                         自然生态系统
                         会员权益
                         AirDrop
                         hashmap
                         小龙虾
                         焦虑
                         危机处理
                         发展
                         微信群折叠
                         toast
                         测评新算法
                         改版
                         wireshark
                         投放方式
                         音频播放动效
                         timer
                         女性商业
                         古典自媒体
                         海外博主
                         repeater
                         转账
                         万能钥匙
                         秋招
                         快服务
                         个人演讲
                         客户共识