怎样快速从一个XML文件中查找信息

在网络时代,XML文件起到了一个保存和传输数据的作用。Soap协议通过Xml交流信息,数据库通过Xml文件存取等等。那么怎样快速的从一个XML文件中取得所需的信息呢?

我们知道,JAVA的JAXP中和Microsoft.Net都有Xml分析器,Microsoft.Net是边读边分析,而JAXP是读到内存中然后才进行分析(还有一种是事件机制去读),总而言之,是不利于快速读取。基于此,Microsoft.Net 和JAXP都提供了XPATH机制,来快速定位到XML文件中所需的节点。

例如有一个XML文件:booksort.xml:

 1<bookstore xmlns:bk='\"urn:samples\"'>
 2<book bk:isbn='\"1-861001-57-8\"' genre='\"novel\"' publicationdate='\"1997\"'>
 3<title>Pride And Prejudice</title>
 4<author>
 5<first-name>Jane</first-name>
 6<last-name>Austen</last-name>
 7</author>
 8<price>24.95</price>
 9</book>
10<book bk:isbn='\"1-861002-30-1\"' genre='\"novel\"' publicationdate='\"1992\"'>
11<title>The Handmaid\'s Tale</title>
12<author>
13<first-name>Margaret</first-name>
14<last-name>Atwood</last-name>
15</author>
16<price>29.95</price>
17</book>
18<book bk:isbn='\"1-861001-57-6\"' genre='\"novel\"' publicationdate='\"1991\"'>
19<title>Emma</title>
20<author>
21<first-name>Jane</first-name>
22<last-name>Austen</last-name>
23</author>
24<price>19.95</price>
25</book>
26<book bk:isbn='\"1-861001-45-3\"' genre='\"novel\"' publicationdate='\"1982\"'>
27<title>Sense and Sensibility</title>
28<author>
29<first-name>Jane</first-name>
30<last-name>Austen</last-name>
31</author>
32<price>19.95</price>
33</book>
34</bookstore>

如果我们想快速查找”last-name”等于”Austen”的所有标题名,可以通过以下方法可以得到:

XmlReaderSample.cs

//Corelib.net/System.Xml.Xsl/XPathDocument Class

//Author :Any

using System;

using System.IO;

using System.Xml;

using System.Xml.XPath;

public class XmlReaderSample

{

public static void Main()

{

XmlTextReader myxtreader = new XmlTextReader("booksort.xml");

XmlReader myxreader = myxtreader;

XPathDocument doc = new XPathDocument(myxreader);

XPathNavigator nav = doc.CreateNavigator();

XPathExpression expr;

expr = nav.Compile("descendant::book[author/last-name='Austen']");

//expr.AddSort("title", XmlSortOrder.Ascending, XmlCaseOrder.None, "", XmlDataType.Text);

XPathNodeIterator iterator = nav.Select(expr);

while (iterator.MoveNext())

{

XPathNavigator nav2 = iterator.Current;

nav2.MoveToFirstChild();

Console.WriteLine("Book title: {0}", nav2.Value);

}

}

}

运行这个程序,结果为:

Book title: Pride And Prejudice

Book title: Emma

Book title: Sense and Sensibility

可以看到查找正确。

利用XPATH中的一些功能,也可以实现简单的排序和简单运算。如在数据库中经常要对数据进行汇总,就可用XPATH实现。

如:

order.xml

 1<order>
 2<book isbn="\'10-861003-324\'">
 3<title>The Handmaid\'s Tale</title>
 4<price>19.95</price>
 5</book>
 6<cd isbn="\'2-3631-4\'">
 7<title>Americana</title>
 8<price>16.95</price>
 9</cd>
10</order>

和:books.xml

 1<bookstore>
 2<book cc='\"dd\"' genre='\"autobiography\"' isbn='\"1-861003-11-0\"' publicationdate='\"1981\"' xmlns:bk='\"urn:sample\"' xmlns:ns='\"http://www.Any.com\"'>
 3<title>The Autobiography of Benjamin Franklin</title>
 4<ns:author>
 5<first-name>Benjamin</first-name>
 6<last-name>Franklin</last-name>
 7</ns:author>
 8<price>8.99</price>
 9</book>
10<book genre='\"novel\"' isbn='\"0-201-63361-2\"' publicationdate='\"1967\"'>
11<title>The Confidence Man</title>
12<author>
13<first-name>Herman</first-name>
14<last-name>Melville</last-name>
15</author>
16<price>11.99</price>
17</book>
18<book genre='\"philosophy\"' isbn='\"1-861001-57-6\"' publicationdate='\"1991\"'>
19<title>The Gorgias</title>
20<author>
21<name>Plato</name>
22</author>
23<price>9.99</price>
24</book>
25</bookstore>

我们可以对该XML文件中的price求和,以得到价格总数。

Evaluate.cs

//Corelib.net/System.Xml.Xsl/XPathNavigator Class

//Author :Any

using System;

using System.IO;

using System.Xml;

using System.Xml.XPath;

public class EvaluateSample

{

public static void Main()

{

EvaluateSample myEvaluateSample = new EvaluateSample();

myEvaluateSample.test("books.xml");

}

public void test(String args)

{

try

{

//test Evaluate(String);

XPathDocument myXPathDocument = new XPathDocument(args);

XPathNavigator myXPathNavigator = myXPathDocument.CreateNavigator();

Console.WriteLine(myXPathNavigator.Evaluate("sum(descendant::book/price)"));

//testEvaluate(XPathExpression);

XmlDocument doc = new XmlDocument();

doc.Load("order.xml");

XPathNavigator nav = doc.CreateNavigator();

XPathExpression expr = nav.Compile("sum(//price/text())");

Console.WriteLine(nav.Evaluate(expr));

//testEvaluate(XPathExpression);

XPathNodeIterator myXPathNodeIterator = nav.Select("descendant::book/title");

expr = nav.Compile("sum(//price/text())");

Console.WriteLine(nav.Evaluate(expr,myXPathNodeIterator));

}

catch (Exception e)

{

Console.WriteLine ("Exception: {0}", e.ToString());

}

}

}

运行这个程序,结果如下:

30.97

36.9

36.9

我们可以看到,30.97是books.xml中所有price值的总和,而36.9则是order.xml中所有price值的总和。通过XPAH不仅可以快速查找信息,而且还可以对信息进行一些基本的处理。

Published At
Categories with Web编程
Tagged with
comments powered by Disqus