编码与解码详细探究,找到错误的根源
概念
文本,字符串:显示在屏幕,控制台,网页等等的Unicode字符.
字符集:为显示的字符集合分配一个独一无二的位置
字节流:存放在硬盘,磁盘,传输流中的字节数据形式
编码:encode,是将文本、字符串转换成字节流的过程
解码:decode,是将字节流转换成文本,字符串的过程
编码与解码是一个互逆过程
像字符’A’,显示在屏幕中就是A本身,但是由于计算机是二进制的,只能存取0和1(但是读写按照字节读取),所以要将’A’保存到硬盘,要按照给定的字符集(默认Unicode)的位置’\x41’,使用"UTF-8"编码为0100 0001(2)存入硬盘,也就是字节流b’A’,
>>> '\x41' #Unicode字符集的位置
'A'
>>> bin(ord('\x41'))
'0b1000001' #二进制位置
>>> 'A'.encode("utf-8")
b'A' #字节流
>>> char='我'
>>> char.encode('utf-8')
>>> char.encode('gbk')
b'\xe6\x88\x91'
b'\xce\xd2'
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
