谈谈.NET中的内存管理

.NET 中的内存管理通常会被认为是 GC ( Garbage Collection )的事情,程序员不用太操心。的确, GC 通过对托管堆( Managed Heap )的管理,使我们(程序员们)有机会从繁琐的诸如内存泄漏之类的问题中解放出来,将精力专注于程序的逻辑上。然而,将所有的事情都交给 GC 有时会损及程序的效率,严重的甚至可能导致错误。这是由于, GC 虽然可以有效地管理托管对象( Managed Object ),但是对于那些非托管资源(例如文件句柄、 Socket 链接等)或者需要特别关照的对象(例如 Bitmap 对象等), GC 的表现就不是那么尽如人意了。对于这些工作, GC 需要程序员的协助才能很好的完成。因此,有效地利用 GC 进行内存管理,在 .NET 中是很重要的。这也是在对 .NET 程序进行优化时应当考虑的方向之一。

** Garbage Collection **


关于 GC 原理的讨论已经有很多非常好的文章了。记得《程序员》 2003 年第一期上也专门做过一期关于 GC 的专题,其中裘宗燕老师的文章——《 Garbage Collection—— 问题和技术》将 GC 的技术原理剖析的十分透彻。因此本文不打算对 GC 的原理做过多的讨论,如果你在这方面有所疑惑,可以参考这篇文章。

简单说来, .NET CLR 所使用的垃圾收集器是一种典型的分代式( generational )、标记-压紧型( mark-and-compact )收集器。它将整个托管堆分成数个(默认是 3 个) generation ,利用标记-清除( mark-and-clean )算法对这几个 generation 进行垃圾回收,然后对托管堆进行整理,将非垃圾数据压紧以减少内存碎片。

为了尽量提高算法效率, .NET CLR 实现了两种类型的 GC :工作站 GC ( mscorwks.dll )和服务器 GC ( mscorsvr.dll )。当运行时( run-time )被加载到进程中时,可以通过 CorBindToRuntimeEx() 函数选择使用哪种 GC 。服务器 GC 是专门针对具有多处理器的服务器系统而设计的,它采用并行算法,每个 CPU 都具有一个 GC ,当进行 GC 过程时,该 CPU 上的程序会暂停。这样的设计能够尽量提高服务器的数据吞吐量。而所有的单处理器系统都工作在工作站 GC 模式下,工作站 GC 不存在并行模式,它的设计目标是尽可能减少垃圾回收过程中程序暂停的次数。很显然,如果在多处理器系统中使用工作站 GC ,无疑会降低系统的性能,无法发挥多处理器的强大威力。因此,选择合适的 GC 使有效的内存管理的第一步。

** Dispose() vs. Finalize() **


对于前文提到的那些非托管资源,通常在释放之前需要做一些适当的清理工作。 .NET 提供了 Dispose() 和 Finalize() 两个途径来执行这些清理工作。那么这两种方式的区别是什么呢?简单说来, Dispose() 是提供给程序员调用的;而 Finalize() 是让 GC 调用的。二者的具体区别见下表:

** Dispose() ** ** 与 ** ** Finalize() ** ** 的主要区别 ** ** **

|

Dispose()

|

Finalize()

---|---|---

由谁调用?

|

程序员

|

GC

何时调用?

|

由程序员决定

|

不可预知

以何种顺序调用?

|

由程序员决定

|

不可预知

资源何时释放?

|

调用结束后

|

下次 GC 过程之后,在此之前对象仍可用。

之所以有如此的不同是由于,当一个具有 Finalizer ( Finalize() 方法)的对象被标记为可被回收时, GC 并不直接回收它,而是将它的一个引用添加到一个特殊的队列里。一个独立的线程遍历这个队列,逐个调用队列中每个元素的 Finalize() 方法。 Finalize() 方法被调用过的对象会在下一次 GC 过程时被释放。程序员无权控制这个线程,同时也不能访问这个队列。而 Dispose() 是 IDisposable 接口的一部分,这个接口专门用来实现对象的清理工作。

基于以上的区别,我们有四种策略来实现对象的清理。

1、 同时实现 Dispose() 和 Finalize() 。

对于同时具有托管资源和非托管资源的对象,这种方法是 .NET 所推荐使用的。实现 Dispose() 方法能够使程序员在已知资源不再使用时立即释放它。但由于 Dispose() 强迫程序员必须做显示的调用才能释放资源,因此实现 Finalize() 能够保证在 Dispose() 没被调用时也能正确地释放资源。

典型的实现模式如下:

public class Sample : IDisposable

{

// Implement IDisposable.

public void Dispose ()

{

Dispose ( true );

** // Forbid GC to call finalizer. ** ** **

** GC . SuppressFinalizer ( this ); **

}

protected virtual void Dispose ( bool disposing )

{

if ( disposing )

{

** // Free managed objects. **

}

** // Free unmanaged objects, and set large fields to null. **

}

// Finalizer.

~ Sample ()

{

Dispose ( false );

}

}

在C#和Managed C++中,使用析构函数来实现Finalize()方法。析构函数能够自动产生Finalize()方法,并生成对基类Finalize()方法的调用 [1] 。

2、 只实现 Dispose() 方法。

这适用于只包含托管资源的对象。如果你想为这类对象提供明确的释放资源的机会,可以采用这种方式。典型的实现模式如下:

public class Sample : IDisposable

{

// Implement IDisposable.

public virtual void Dispose ()

{

// Free managed objects.

}

}

3、 只实现 Finalize() 。

这种方式不推荐使用,它只适合于程序员无法确定资源何时能够被释放,或者所用到的资源复杂到无法通过显示的方式释放,只能通过 Finalize() 强行回收。这两种情况不应该出现在设计良好的项目中,如果你不得不使用这种方式,那么你首先应当回头检查你的设计。

实现代码如下:

public class Sample

{

// Implement IDisposable.

~ Sample ()

{

}

}

4、 既不实现 Dispose() ,也不实现 Finalize() 。

这种方式适用于仅包含对其他托管对象的引用的对象,这些引用既不需要 Dispose ,也不需要 Finalize 。

** 总结 ** ** **


在使用 Dispose() 和 Finalize() 来协助 GC 进行高效的内存管理时,以下一些规则应当遵守:

· 对象使用完毕应当立即释放(设为 null ,或调用它的 Dispose() 方法)。

·对于使用到非托管资源的对象,应当同时实现Dispose()和Finalize()方法来进行清理工作。

·应当禁止调用已经被Dispose的对象,“重新创建已被Dispose的对象”这个模式很难实现(.NET Framework无能为力)。

·应当保证Dispose()被调用两遍不会抛出异常。

·必须实现Finalize()时,应当同时实现IDisposable接口(也就是Dispose()方法)。

·只在不得不用的地方,或者不得不用的时候,使用Finalize()。

[1]:此处原文中有误,谢谢网友zhangdawei78及时指出 J

Published At
Categories with Web编程
Tagged with
comments powered by Disqus