在dot Net中开发基于office2003的信息检索服务

Office2003 添加了许多实用而有趣的新功能,使用信息检索服务就是其中的一个,我在上个星期进“博客堂”中闲逛的时候发现开心就好发布了博客堂的全文检索服务,觉得这是一个很不错的功能,因此也下载了 office2003 的 sdk ,依葫芦画瓢自己开发了一个信息检索服务的范例,特此共享给大家。

信息检索服务可以让 office 中的所有工具使用网络上所有的信息检索功能(一种定制的 web 服务),作为用户,也可以开发或者添加其他的信息检索功能。

第一部分:安装和使用信息检索服务:

信息检索服务的截图:(这里我使用的是英文版的截图,与后面的截图稍有不同 :p )

1. 使用信息检索服务的系统要求:

安装了 office2003 ( beta 版本也可)的各种 windows 操作系统。

此功能适用于 office2003 的各个部件,包括在 word , excel , access 等工具中使用,在安装了 office2003 以后, IE 也可以使用这个功能。

2. 安装信息检索服务的步骤:

以微软中国 mvp 的博客网站为例,步骤如下:

打开 word2003 ,点击工具 -> 信息检索,此时 word 的右边会出现一个停靠栏,点击停靠栏下方的 “ 信息检索选项 ” ,将出现一个标题为 “ 信息检索选项 ” 的对话框,点击其左下的 “ 添加服务 ” 按钮,在地址栏内输入 “http://blog.joycode.com/research.asmx” ,点击 “ 添加 ” 按钮,并依次安装完就可以使用博客堂专用的信息检索服务了。

IE 中的位置是主菜单- >" 查看 "->" 浏览器栏 "->" 信息检索 ".

二.开发信息检索服务:

1 .开发一般的信息检索服务的系统要求:

微软 office2003 ;

.NET 框架 1.0 或后续版本;

.NET 框架 SDK1.0 或后续版本;

MS VS.NET2002 或后续版本;

IIS5.0 或后续版本。

Office2003 信息检索 sdk (作为参考) .

2 .建立 web 服务:

在 VS.NET 中建立一个 C# 的 web 服务应用程序,添加两个服务方法 :

                    [WebMethod]


                    public string Registration(string registrationXml)


                    {


                    }


                    [WebMethod]


                    public string Query(string queryXml)


                    {


                    }


                    注意:1)此服务类必须使用“urn:Microsoft.Search”的命名空间。


                                 2)Registration方法和Query方法是必须的,其参数也必须按照上面的格式。

读取注册请求( Registration 方法的参数 registrationXml ):

注册请求为一个字符串,此字符串为调用信息检索服务的工具(如 word )发出,它实际上为一个 xml 文本,我们可以读取此字符串,也可以装载一个 xml 模板文件来实现。具体的格式可以参考 office2003 信息检索服务 sdk 。

写注册响应( Registration 方法的返回值)

有 3 种方式可供选择用来写注册响应,一种是使用 XmlTextWriter 等 Xml 处理对象写,第二种是使用 StringBuilder 对象写响应,第三种是装载一个 Xml 模板文件并适当的修改它作为注册响应。

简便起见,我使用的是第三种方法:

XmlDocument registrationResponse = new XmlDocument();

// 装载模板文件

registrationResponse.Load("e:\\test\\2ndResearch\\regResponse.xml");

XmlNamespaceManager nsm=new XmlNamespaceManager(registrationResponse.NameTable);

nsm.AddNamespace("ns", "urn:Microsoft.Search.Registration.Response");

// 返回注册响应

return registrationResponse.InnerXml.ToString();

注意: 在注册响应中,服务提供者( Provider )必须有唯一的 ID ,也就是说在返回给客户机的注册响应中服务提供者的 ID 不能与其他信息检索服务提供者的 ID 相同,否则此服务将注册失败。

读取检索请求( Query 方法中的参数 queryXml )。

类似的,检索请求也是一个可格式化为 xml 的字符串,其中包括了客户端检索工具的检索信息。我们仍然可以利用直接读取和装载模板文档这两种方式进行。

在这里我使用的是直接读取请求这种方法:

XmlDocument myDoc=new XmlDocument();

myDoc.Load(queryXml);

在已经格式化的 Xml 文档 myDoc 中,有几个节点值得注意,它们是:

QueryId 节点, OriginatorId 节点, QueryText 节点以及 Keyword 节点的内容。

QueryId 节点和 OriginatorId 节点的内容表示客户机信息检索请求的 ID ,而 QueryText 节点和 Keyword 节点的内容表示需检索的关键字信息。

下面用了一段代码来取出 QueryText 节点的内容 ( 其他节点的处理方法类似 ) :

XmlNamespaceManager xnm=new XmlNamespaceManager(myDoc.NameTable);

xnm.AddNamespace("urn","urn:Microsoft.Search.Query");

string searchWord=myDoc.SelectSingleNode("//urn:QueryText",xnm).InnerText;

写检索响应 (Query 方法的返回值 )

读取了检索请求之后便可以根据其信息写检索结果了,书写检索响应仍然可以按照类似于书写注册响应的三种方法进行,在这里我是混用了几种方法。

先装载模板文档:

XmlDocument queryResponse=new XmlDocument(); queryResponse.Load("e:\\test\\2ndResearch\\queryResult.xml");

然后添加一些内容使它变得完整:

在检索响应中将显示在客户机界面上的信息由 Range 节点的内容决定,因此我对 SQL Server 中的 Northwind 数据库作了一个简单的查询,此查询的功能是返回在 customer 表中客户名包含检索关键字的记录:

private DataSet FindInfo(string searchText)

{

SqlConnection conn=new SqlConnection("workstation id=localhost;packet size=4096;user id=sa;data source=localhost;persist security info=False;initial catalog=NorthWind");

SqlDataAdapter da=new SqlDataAdapter("select * from Customers where CompanyName like '%"+searchText+"%'",conn);

DataSet ds=new DataSet();

da.Fill(ds);

return ds;

}

生成检索结果的 Xml 文档:

public string CreateResult(DataSet ds)

{

StringWriter resultWriter=new StringWriter();

XmlTextWriter xmlCreator=new XmlTextWriter(resultWriter);

if(ds.Tables[0].Rows.Count>0)

{

for(int i=0;i<ds.Tables[0].Rows.Count;i++)

{

xmlCreator.WriteStartElement("Results");

// 中间略去 …….

xmlCreator.WriteEndElement();

}

}

&

Published At
Categories with Web编程
Tagged with
comments powered by Disqus