压缩技术主要的工作方式就是找到重复的模式,进行紧密的编码。
BWT(Burrows–Wheeler_transform)将原来的文本转换为一个相似的文本,转换后使得相同的字符位置连续或者相邻;
之后可以使用其他技术如:Move-to-front transform 和 游程编码(RLE) 进行文本压缩。
一般压缩可以将文本先使用Burrows–Wheeler transform生成局部相关性很好的序列,再使用MTF减少信息熵,最后再进行压缩。
Burrows–Wheeler transform + Run-length coding
延伸阅读
学习是年轻人改变自己的最好方式