压缩技术主要的工作方式就是找到重复的模式,进行紧密的编码。

BWT(Burrows–Wheeler_transform)将原来的文本转换为一个相似的文本,转换后使得相同的字符位置连续或者相邻;

之后可以使用其他技术如:Move-to-front transform 和 游程编码(RLE) 进行文本压缩。

 

一般压缩可以将文本先使用Burrows–Wheeler transform生成局部相关性很好的序列再使用MTF减少信息熵最后再进行压缩。

 

Burrows–Wheeler transform + Run-length coding

网友评论