分类导航

刨根究底字符编码之十二——UTF-8究竟是怎么编码的

发布时间：2017年06月07日作者： IT网络文摘 (该文来自笔记，点击查看原文)

UTF-8究竟是怎么编码的

1.

UTF-8编码是Unicode字符集的一种编码方式(CEF)，其特点是使用变长字节数(即变长码元序列、变宽码元序列)来编码。一般是1到4个字节，当然，也可以更长。

为什么要变长呢？这可以理解为按需分配，比如一个字节足以容纳所有的ASCII字符，那何必补一堆0用更多的字节来存储呢？

实际上变长编码有其优势也有其劣势，优势是节省空间、自动纠错性能好、利于传输、扩展性强，劣势是不利于程序内部处理，比如正则表达式检索；而UTF-32这样等长码元序列(即等宽码元序列)的编码方式就比较适合程序处理，当然，缺点是比较耗费存储空间。

2.

那UTF-8究竟是怎么编码的呢？也就是说其编码算法是什么？

延伸阅读

ssh框架 2016-09-30
阿里移动安全 [无线安全]玩转无线电——不安全的蓝牙锁 2017-07-26
消息队列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
Selective Search for Object Recognition 论文笔记【图片目标分割】 2017-07-26
词向量-LRWE模型-更好地识别反义词同义词 2017-07-26
从栈不平衡问题理解 calling convention 2017-07-26
php imagemagick 处理图片剪切、压缩、合并、插入文本、背景色透明 2017-07-26
Swift实现JSON转Model - HandyJSON使用讲解 2017-07-26
阿里移动安全 Android端恶意锁屏勒索应用分析 2017-07-26
集合结合数据结构来看看(二) 2017-07-26

学习是年轻人改变自己的最好方式-Java培训,做最负责任的教育,学习改变命运,软件学习,再就业,大学生如何就业,帮大学生找到好工作,lphotoshop培训,电脑培训,电脑维修培训,移动软件开发培训,网站设计培训,网站建设培训

学习是年轻人改变自己的最好方式

我想了解如何学习