自己编写XPath练习器

这段时间在看XML,结果Asp.net中的XPath功能,写了一个小页面。一来可以学习Asp.Net中的操作XML文档的知识,二来更可以把这个页面当作以后来练习编写XPath表达式的工具。

在编写页面过程中,我们需要用到XmlDocument XmlNode XPathNavigator XPathExpression XPathNodeIterator等类。

XmlDocument类,在这里,我们用它来装载一个Xml文档,装载后,我们会使用Cache技术,将文档保存在内存中,避免重复装载相同的文档。
XPathNavigator类,在这个页面,它是主角了。XPathNavigator类是一个支持XPath的具有强大功能的类,这里,我们只用到它的几个主要属性和方法。首先,这个类的实例不是通过构造函数得到,而是通过XmlNode或XmlDocument的CreateNavigator方法得到。然后,你可以将一个XPath字符串交给XPathNavigator.Compile方法来得到一个XPathExpression类。接着,调用XPathNavigator.Select或XPathNavigator.Evaluate方法来完成XPath的运算过程,它们均接受一个XPathExpression参数。通常,为了让我们的程序具有较强的通用性或正确性,在调用XPathNavigator.Select或XPathNavigator.Evaluate方法之前,会先判断XPathExprssion实例在运算时的返回类型(它是一个XPathResultType枚举值),然后,根据返回类型的不同,进行相应的操作。它通过的类型有:
Any 任何一种 XPath 节点类型。
Boolean 布尔值 true 或 false。
Error 该表达式的计算结果不是正确的 XPath 类型。
Navigator 一个树片段。
NodeSet 一个节点集合。
Number 一个数值。
String 一个字符串值。
本程序中,我们只用到其中的一部分(稍后,在源程序中会看到)。
如果返回类型为NodeSet,我们则要用到XPathNodeIterator类,它是XPath运算结果集的迭代,通过MoveNext只读方法前移。
同时,对于返回多个结点的NodeSet的处理过程,我们还想得到具体的节点类型和它的内容。这时,我们通过((IHasXmlNode)XPathNodeIterator.Current).GetNode()方法得到迭代指针所指向的当前的XmlNode,通过XmlNode.NodeType和XmlNode.OuterXml得到较为详细的信息。

页面表单主要用到HtmlInputFile TextBox Button Label Span等控件或标记来完成文档上传和显示信息等工作。

详细的源代码如下:
< %@Page Debug="true"%>
< %@Import Namespace="System"%>
< %@Import Namespace="System.Xml"%>
< %@Import Namespace="System.Xml.XPath"%>
< %@Import Namespace="System.IO"%>

  1<script language="C#" runat="Server">   
  2  
  3protected XmlDocument myXmlDoc;   
  4protected XmlNode singleNode;   
  5protected XmlNodeList moreNodes;   
  6protected String strFileName;   
  7  
  8protected void DoXPath(Object sender,EventArgs e)   
  9{   
 10if ((fileXmlDoc.PostedFile.FileName=="")&&(Cache["strFileName"]==null))   
 11{   
 12lblMessage.Text = "你没有选择XML文档";   
 13return;   
 14}   
 15if (tbxExpression.Text==String.Empty)   
 16{   
 17lblMessage.Text = "XPath表达式不能为空";   
 18return;   
 19}   
 20try   
 21{   
 22LoadXmlDoc();   
 23  
 24XPathNavigator nav = myXmlDoc.CreateNavigator();   
 25XPathExpression expr = nav.Compile(tbxExpression.Text.ToString().Trim());   
 26  
 27lblResult.InnerHtml="<hr align='left' width='400'>";   
 28  
 29switch(expr.ReturnType)   
 30{   
 31case XPathResultType.NodeSet:   
 32//do返回节点集的情况   
 33{   
 34XPathNodeIterator iterator = nav.Select(expr);   
 35  
 36if (iterator.Count==0)   
 37{   
 38lblMessage.Text="当前没有可匹配的节点或属性";   
 39lblResult.InnerHtml=String.Empty;   
 40}   
 41else   
 42{   
 43lblMessage.Text="共匹配" + iterator.Count.ToString() + "个节点";   
 44}   
 45  
 46while(iterator.MoveNext())   
 47{   
 48XPathNavigator currentNode = iterator.Current;   
 49String strNodeName = (currentNode.Name==String.Empty)?"No Name":currentNode.Name;   
 50XmlNode xmlNode = (XmlNode)((IHasXmlNode)currentNode).GetNode();   
 51String strNodeValue = (Server.HtmlEncode(xmlNode.OuterXml)==String.Empty)?"No Conent":Server.HtmlEncode(xmlNode.OuterXml);   
 52String strNodeType = String.Empty;   
 53  
 54switch(currentNode.NodeType)   
 55{   
 56case XPathNodeType.Element:   
 57strNodeType = "当前匹配元素节点";   
 58break;   
 59case XPathNodeType.Attribute:   
 60strNodeType = "当前匹配属性节点";   
 61break;   
 62case XPathNodeType.Comment:   
 63strNodeType = "当前匹配注释节点";   
 64break;   
 65case XPathNodeType.Text:   
 66strNodeType = "当前匹配文本节点";   
 67break;   
 68case XPathNodeType.Root:   
 69strNodeType = "当前匹配根节点";   
 70break;   
 71}   
 72lblResult.InnerHtml += strNodeType + "
 73" + "<b>" + strNodeName + "</b>&nbsp;&nbsp;" + strNodeValue + "&nbsp;&nbsp;" + "<hr align='left' width='400'/>";   
 74}   
 75  
 76break;   
 77}   
 78case XPathResultType.Boolean:   
 79//do返回布尔值   
 80{   
 81lblMessage.Text = "当前匹配结果为布尔值";   
 82lblResult.InnerHtml += nav.Evaluate(expr).ToString()+"<hr align='left' width='400'/>";   
 83break;   
 84}   
 85case XPathResultType.Number:   
 86//do返回数值   
 87{   
 88lblMessage.Text = "当前匹配结果为数值";   
 89lblResult.InnerHtml += nav.Evaluate(expr).ToString()+"<hr align='left' width='400'/>";   
 90break;   
 91}   
 92case XPathResultType.String:   
 93//do返回字符串   
 94{   
 95lblMessage.Text = "当前匹配结果为字符串";   
 96lblResult.InnerHtml += nav.Evaluate(expr).ToString() + "<hr align='left' width='400'/>";   
 97break;   
 98}   
 99default:   
100{   
101lblMessage.Text="无法确定表达的返回结果类型";   
102lblResult.InnerHtml="";   
103break;   
104}   
105}   
106}   
107catch(Exception excep)   
108{   
109lblMessage.Text = excep.Message;   
110lblResult.InnerHtml="";   
111}   
112}   
113  
114protected void LoadXmlDoc()   
115{   
116strFileName = fileXmlDoc.PostedFile.FileName;   
117  
118//如果文件上传框的内容有改变,则重新装载文档。   
119//如果没有缓存文档,也要重新装载文档。   
120  
121if ( ((Cache["strFileName"]!=strFileName)&&(strFileName!=String.Empty)) ||   
122(Cache["strFileName"]==null) )   
123{   
124myXmlDoc = new XmlDocument();   
125myXmlDoc.Load(fileXmlDoc.PostedFile.InputStream);   
126  
127Cache["strFileName"] = strFileName;   
128Cache["myXmlDoc"] = myXmlDoc;   
129return;   
130}   
131else   
132{   
133myXmlDoc = (XmlDocument)Cache["myXmlDoc"];   
134return;   
135}   
136  
137  
138}   
139</script>
 1<html>
 2<form runat="server">
 3<h3>XPath Expression</h3>
 4<span style="font-size:8pt;background-color:#cccccc">提示:只要不关闭本页面,第一次提交的XML文档始终有效,直到你再次提交新的文档。</span>
 5<span style="font-size:10pt">Xml文件</span>
 6<input id="fileXmlDoc" runat="server" size="40" type="file" width="100px"/>
 7<span style="font-size:10pt">XPath表达式</span>
 8<asp:textbox bordercolor="Black" borderstyle="Inset" borderwidth="1px" font-size="10pt" id="tbxExpression" runat="server" size="40"></asp:textbox>
 9<asp:button font-size="10pt" id="btnExecuteXPath" onclick="DoXPath" runat="server" text="匹配表达式"></asp:button>
10<asp:label backcolor="#aaccee" bordercolor="Black" borderstyle="Inset" borderwidth="1px" font-size="10pt" id="lblMessage" runat="server" width="600"></asp:label>
11<table width="600px">
12<tr width="100%">
13<td>
14<span id="lblResult" name="lblResult" runat="server" style="font-size:10pt"></span>
15</td>
16<tr>
17</tr></tr></table>
18</form>
19</html>

上面的功能还比较粗糙,希望大家能多提建议或给出完善的方法。同时,我没有找到按缩进格式来显示XML片断的方法,希望能有朋友提供相应的方法。谢谢!

Published At
Categories with Web编程
Tagged with
comments powered by Disqus