本章介绍了本书其它部分未涉及到的一些编码和设计原则。包含了一些.NET的应用场景,有些不会造成太大危害,有些则会造成明显的问题。剩下的则根据你的使用方法会产生不同的效果。如果要对本章节出现的原则做一个总结,那就是:
过度的优化会影响代码的抽象
这意味着,当你希望更高的优化性能,你需要了解每个层次代码的实现细节。本章会有很多相关介绍。
类 vs 结构体
类的实例都是在堆上分配的,通过指针的引用进行访问。传递这些对象代价很低,因为它只是一个指针(4或者8直接)的拷贝。然而,对象也有一些固定开销:8或16字节(32或64位系统)。这些开销包括指向方法表的指针和用于其它目的同步字段。但是,如果通过调试工具查看一个空对象占用的内存,这会发现大了13或者24字节(32位或64位系统)。这是.NET的内存对齐机制导致的。
而结构体则没上面的开销,它的内存使用量就是字段大小的综合。如果结构体是方法(函数)里声明的局部变量,则它在堆栈上分配控件。如果结构体被声明为类的一部分,这结构体使用的内存这是该类的内存布局里的一部分(因此它会分配在堆上)。但你将结构体传递给方法(函数)时,他将对字节数据做复制。因为它不在堆上,结构体是不会导致垃圾回收的。
因此这里有一个折中。你可以找到各种关于结构体尺寸大小的建议,但这里我不会告诉你一个确切的数字。在大多数情况下,你结构体需要保持一个比较小的尺寸,特别是他们需要经常被传递,你需要保证结构体的大小不会造成太大的问题。唯一能确定的是,你需要根据自己的应用场景进行分析。
有些情况下,效率的差别还是蛮大的。当一个对象开销看起来不是很多,但是对比一个对象数组和结构体数组就可以看出差别。在32位系统下,假设一个数据结构包含16字节的数据,数组长度是100w。
使用对象数组占用的空间
8字节数组开销+
(4字节指针地址X1,000,000)+
((8字节头部+16字节数据)X1,000,000)
=28MB
使用结构体数组占用的空间
8字节数组开销+
(16字节数据X1,000,100)
=16MB
如果使用64位系统,对象数组则使用40MB,而结构体数组仍然是16MB。
可以看到,在一个结构数组中,相同大小的数据占用的内存小。随着对象数组里对象的增加,还会增加GC的压力。
除了空间,还有CPU效率问题。CPU有多级缓存。越靠近CPU的缓存越小,但访问速度也会更快,对于顺序保存的数据越容易优化。
对于一个结构体数组,他们在内存里都是连续的值。访问结构体数组里数据很简单,只要找到正确的位置就可以得到对应的值。这就意味着在大数组数据做迭代访问有巨大的差异。如果该值已经在CPU的告诉缓存中,它的访问速度是要比访问RAM要快一个数量级。
如果要访问对象数组里的某一项,需要先获得该对象的指针引用,再去堆里访问。迭代对象数组的时候,就会造成数据指针在堆里跳转,频繁更新CPU的缓存,进而浪费了很多访问CPU缓存数据机会。
在很多时候,通过改进数据保存在内存的位置,降低CPU访问内存的开销是使用结构体的一个主要原因,它可以显著的提升性能。
因为结构体使用的时候总是被复制,所以编码时要很小心,否则你会产生一些有趣的bug。例如下面的栗子,你是无法通过编译的:
struct Point { public int x; public int y; }public static void Main(){ List<Point> points = new List<Point>(); points.Add(new Point() {x = 1, y = 2}); points[0].x = 3; }
问