Office2003 添加了许多实用而有趣的新功能,使用信息检索服务就是其中的一个,我在上个星期进“博客堂”中闲逛的时候发现开心就好发布了博客堂的全文检索服务,觉得这是一个很不错的功能,因此也下载了 office2003 的 sdk ,依葫芦画瓢自己开发了一个信息检索服务的范例,特此共享给大家。
信息检索服务可以让 office 中的所有工具使用网络上所有的信息检索功能(一种定制的 web 服务),作为用户,也可以开发或者添加其他的信息检索功能。
第一部分:安装和使用信息检索服务:
信息检索服务的截图:(这里我使用的是英文版的截图,与后面的截图稍有不同 :p )
1. 使用信息检索服务的系统要求:
安装了 office2003 ( beta 版本也可)的各种 windows 操作系统。
此功能适用于 office2003 的各个部件,包括在 word , excel , access 等工具中使用,在安装了 office2003 以后, IE 也可以使用这个功能。
2. 安装信息检索服务的步骤:
以微软中国 mvp 的博客网站为例,步骤如下:
打开 word2003 ,点击工具 -> 信息检索,此时 word 的右边会出现一个停靠栏,点击停靠栏下方的 “ 信息检索选项 ” ,将出现一个标题为 “ 信息检索选项 ” 的对话框,点击其左下的 “ 添加服务 ” 按钮,在地址栏内输入 “http://blog.joycode.com/research.asmx” ,点击 “ 添加 ” 按钮,并依次安装完就可以使用博客堂专用的信息检索服务了。
IE 中的位置是主菜单- >" 查看 "->" 浏览器栏 "->" 信息检索 ".
二.开发信息检索服务:
1 .开发一般的信息检索服务的系统要求:
微软 office2003 ;
.NET 框架 1.0 或后续版本;
.NET 框架 SDK1.0 或后续版本;
MS VS.NET2002 或后续版本;
IIS5.0 或后续版本。
Office2003 信息检索 sdk (作为参考) .
2 .建立 web 服务:
在 VS.NET 中建立一个 C# 的 web 服务应用程序,添加两个服务方法 :
[WebMethod]
public string Registration(string registrationXml)
{
}
[WebMethod]
public string Query(string queryXml)
{
}
注意:1)此服务类必须使用“urn:Microsoft.Search”的命名空间。
2)Registration方法和Query方法是必须的,其参数也必须按照上面的格式。
读取注册请求( Registration 方法的参数 registrationXml ):
注册请求为一个字符串,此字符串为调用信息检索服务的工具(如 word )发出,它实际上为一个 xml 文本,我们可以读取此字符串,也可以装载一个 xml 模板文件来实现。具体的格式可以参考 office2003 信息检索服务 sdk 。
写注册响应( Registration 方法的返回值)
有 3 种方式可供选择用来写注册响应,一种是使用 XmlTextWriter 等 Xml 处理对象写,第二种是使用 StringBuilder 对象写响应,第三种是装载一个 Xml 模板文件并适当的修改它作为注册响应。
简便起见,我使用的是第三种方法:
XmlDocument registrationResponse = new XmlDocument();
// 装载模板文件
registrationResponse.Load("e:\\test\\2ndResearch\\regResponse.xml");
XmlNamespaceManager nsm=new XmlNamespaceManager(registrationResponse.NameTable);
nsm.AddNamespace("ns", "urn:Microsoft.Search.Registration.Response");
// 返回注册响应
return registrationResponse.InnerXml.ToString();
注意: 在注册响应中,服务提供者( Provider )必须有唯一的 ID ,也就是说在返回给客户机的注册响应中服务提供者的 ID 不能与其他信息检索服务提供者的 ID 相同,否则此服务将注册失败。
读取检索请求( Query 方法中的参数 queryXml )。
类似的,检索请求也是一个可格式化为 xml 的字符串,其中包括了客户端检索工具的检索信息。我们仍然可以利用直接读取和装载模板文档这两种方式进行。
在这里我使用的是直接读取请求这种方法:
XmlDocument myDoc=new XmlDocument();
myDoc.Load(queryXml);
在已经格式化的 Xml 文档 myDoc 中,有几个节点值得注意,它们是:
QueryId 节点, OriginatorId 节点, QueryText 节点以及 Keyword 节点的内容。
QueryId 节点和 OriginatorId 节点的内容表示客户机信息检索请求的 ID ,而 QueryText 节点和 Keyword 节点的内容表示需检索的关键字信息。
下面用了一段代码来取出 QueryText 节点的内容 ( 其他节点的处理方法类似 ) :
XmlNamespaceManager xnm=new XmlNamespaceManager(myDoc.NameTable);
xnm.AddNamespace("urn","urn:Microsoft.Search.Query");
string searchWord=myDoc.SelectSingleNode("//urn:QueryText",xnm).InnerText;
写检索响应 (Query 方法的返回值 )
读取了检索请求之后便可以根据其信息写检索结果了,书写检索响应仍然可以按照类似于书写注册响应的三种方法进行,在这里我是混用了几种方法。
先装载模板文档:
XmlDocument queryResponse=new XmlDocument(); queryResponse.Load("e:\\test\\2ndResearch\\queryResult.xml");
然后添加一些内容使它变得完整:
在检索响应中将显示在客户机界面上的信息由 Range 节点的内容决定,因此我对 SQL Server 中的 Northwind 数据库作了一个简单的查询,此查询的功能是返回在 customer 表中客户名包含检索关键字的记录:
private DataSet FindInfo(string searchText)
{
SqlConnection conn=new SqlConnection("workstation id=localhost;packet size=4096;user id=sa;data source=localhost;persist security info=False;initial catalog=NorthWind");
SqlDataAdapter da=new SqlDataAdapter("select * from Customers where CompanyName like '%"+searchText+"%'",conn);
DataSet ds=new DataSet();
da.Fill(ds);
return ds;
}
生成检索结果的 Xml 文档:
public string CreateResult(DataSet ds)
{
StringWriter resultWriter=new StringWriter();
XmlTextWriter xmlCreator=new XmlTextWriter(resultWriter);
if(ds.Tables[0].Rows.Count>0)
{
for(int i=0;i<ds.Tables[0].Rows.Count;i++)
{
xmlCreator.WriteStartElement("Results");
// 中间略去 …….
xmlCreator.WriteEndElement();
}
}
&