** 带验证的阅读器 **
XmlValidatingReader 类实现了 XmlReader 类,它提供了支持多种类型的 XML 验证: DTD , XML-Data Reduced(XDR) 架构,以及 XSD , DTD 和 XSD 都是 W3C 官方推荐的。而 XDR 是 Microsoft 早期用于处理 XML 构架的一种格式。
你可以用 XmlVlidatingReader 类去验证 XML 文档和 XML 片断。 XmlValidatingReader 类工作在 XML 阅读器上面 --- 是一个典型的 XMLTextReader 类实例。 XMLTextReade 用于读取文档的节点,但是 XmlVlidatingReader 依据需要的验证类型去验证每一个 XML 块。
XmlVlidatingReader 类只实现了非常小的 XML 阅读器必备的一个功能子集。该类总是工作在一个已存在的 XML 阅读器上面,它监视方法和属性。如果你深入该类的构造函数,你会发现它很明显的依靠一个已存在的文本阅读器。带验证的 XML 阅读器不能直接的从一个文件或一个 URL 序列化。该类的构造函数列表如下:
public XmlValidatingReader(XmlReader);
public XmlValidatingReader(Stream, XmlNodeType, XmlParserContext);
public XmlValidatingReader(string, XmlNodeType, XmlParserContext);
带验证的 XML 阅读器能分析任何的 XML 片断, XML 片断通过一个 string 或者一个 stream 提供 , 也可以分析任何阅读器提供的 XML 文档。
XmlVlidatingReader 类中有重大改变的方法非常少 ( 相对其它 reader 类来说 ) ,另外对 Read ,它有 Skip 和 ReadTypedValue 方法。 Skip 方法跳过当前节点所有的子节点(你不能跳过不良格式的 XML 文本,它是相当有用的算法), Skip 方法也验证被跳过的内容。 ReadTypedValue 方法返回指定 XML 架构 (XSD) 类型对应的 CLR 类型。如果该方法找到了 XSD 类型对应的 CLR 类型,则返回 CLR 的类型名。如果找不到,则把该节点的值作为一个字符串值返回。
带验证的 XML 阅读器正如其名,它是一个基于节点的阅读器,它验证当前节点的结构是否符合当前的 schema 。验证是增量式的;它没有方法返回表示文档是否有效的布尔值。通常你都是用 Read 方法去读输入的 XML 文档。实际上,你也可以用带验证的阅读器去读 XML 文档。在每一步中,当前被访问的节点的结构是否与指定的 schema 符合,如果不符合,抛出一个异常。图四是一个控制台应用程序,它有一个要输入文件名的命令行,最后输出验证结果。
** Figure 4 ** Console App
using System;
using System.Xml;
using System.Xml.Schema;
class MyXmlValidApp
{
public MyXmlValidApp(String fileName)
{
try {
Validate(fileName);
}
catch (Exception e) {
Console.WriteLine("Error:\t{0}", e.Message);
Console.WriteLine("Exception raised: {0}",
e.GetType().ToString());
}
}
private void Validate(String fileName)
{
XmlTextReader xtr = new XmlTextReader(fileName);
XmlValidatingReader vreader = new XmlValidatingReader(xtr);
vreader.ValidationType = ValidationType.Auto;
vreader.ValidationEventHandler += new
ValidationEventHandler(this.ValidationEventHandle);
vreader.Read();
vreader.MoveToContent();
while (vreader.Read()) {}
xtr.Close();
vreader.Close();
}
public void ValidationEventHandle(Object sender,
ValidationEventArgs args)
{
Console.Write("Validation error: " + args.Message + "\r\n");
}
public static void Main(String[] args)
{
MyXmlValidApp o = new MyXmlValidApp(args[0]);
return;
}
}
ValidationType 属性设置验证的类型,它可以是 :DTD, XSD, XDR 或者 none 。如果没有指定验证的类型(用 ValidationType.Auto 选项),阅读器将自动的根据文档用最适合的验证类型。在验证过程中出现任何错误,都会触发 ValidationEventHandler 事件。如果未提供事件 ValidationEventHandler 事件处理程序,则抛出一个 XML 异常。定义 ValidationEventHandler 事件处理程序是用于捕捉任何在 XML 源文件中存在错误而引发 XML 异常的一种方法。要注意的是阅读器的原理是检查一个文档是否是格式良好的,以及检查文档是否与架构吻合。如果带验证的阅读器发现一个有严重的格式错误的 XML 文档,只会触发 XmlException 异常 , 它不会触发其它的事件。
验证发生在用户用 Read 方法向前移动指针时,一旦节点被分析和读取,它获得传送过来的处理验证的内部的对象。验证操作是基于节点类型及被要求的验证类型。它确认节点所有的属性和节点包含的子节点是否符合验证条件。
验证对象在内部调用两个不同风格的对象: DTD 分析器和架构生成器 (schema builder) 。 DTD 分析器处理当前节点的内容和不符合 DTD 的子树。架构生成器根据 XDR 或者 XSD 架构对当前的节点构建一个 SOM ( schema object model )。架构生成器类实际上是所有指定为 XDR 和 XSD 架构生成器的基类。为什么呢,虽然 XDR 和 XSD 架构的许多相同的方法被加工处理过,但是它们在执行时的性能没有区别。
如果节点有子节点,用另一个临时的阅读器收集子节点信息,因此节点的架构信息能被完全地验证。你可以看图五:
注意,尽管 XmlValidatingReader 类的构造函数可以接受一个 XmlReader 类作为其阅读器,但是该阅读器只能是 XmlTextReader 类的一个实例或者是它的一个派生类的实例。这意味着你不能用其它从 XmlReader 派生的类(例如一个自定义的 XML 阅读器)。在 XmlValidatingReader 类的内部,它假设阅读器是一个子 XmlTextReader 对象及把传入的阅读器显式的转换成 XmlTextReader 类。如果你用 XmlNodeReader 或者自定义的阅读器器,程序在编译时会出错,运行时抛出一个异常。
** 节点阅读器 **
XML 阅读器提供一种增量式的方法(一个一个节点的读)来处理文档的内容。到目前为止,我们假设源文件是一个基于硬盘的流或者是一个字符串流,然而,我们不能保证在实际中会提供一个源文件的 XMLDOM 对象给我们。在这种情况下,我们需要一个带有特别的读方法的特别的类。对这种情况, .NET Framework 提供了 XmlNodeReader 类。
就像 XmlTextReader 访问指定 XML 流中所有节点一样, XmlNodeReader 类访问 XMLDOM 子树的所有节点。 XMLDOM 类(在 .NET Framework 中的 XmlDocument 类)支持基于 Xpath 的方法,例如 SelectNodes 方法和 SelectSingleNode 方法。这些方法的作用是把匹配的节点放在内存中。如果你需要处理子树中的所有节点,节点阅读器比用增量式方法处理节点的阅读器具有更高的效率:
// xmldomNode is the XML DOM node
XmlNodeReader nodeReader = new XmlNodeReader(xmldomNode);
while (nodeReader.Read())
{
// Do something here
}
当你要在配置文件(例如 web.cofig 文件)中引用自定义的数据时,先把这些数据填充到 XMLDOM 树中,然后用 XmlNodeReader 类与 XMLDOM 类结合处理这些数据。这也是高效的。