與 [Solr] 合作撰寫(http://lucene.apache.org/solr/)
介绍
Solr 是一个基于 Apache Lucene 的搜索引擎平台,用 Java 编写并使用 Lucene 库实现索引,可以使用各种 REST API,包括 XML 和 JSON。
- 先进的全文本搜索功能
- 优化用于高量网页流量
- 基于标准的开放接口 - XML、JSON 和 HTTP
- 全面的 HTML 管理接口
- JMX 上曝光的服务器统计数据用于监控
- 可线性扩展、自动索引复制、自动故障复制和恢复
- 实时近的索引
- 灵活且可适应的 XML 配置
- 可扩展的插件架构
在本文中,我们将使用其二进制分布来安装 Solr。
前提条件
要遵循本教程,您将需要:
- 1 GB Ubuntu 14.04 Droplet 最少,但所需的 RAM 量(https://wiki.apache.org/solr/SolrPerformanceProblems)取决于您的具体情况
- A sudo non-root user)。
第1步:安装Java
Solr 需要 Java,所以在这个步骤中,我们将安装它。
完整的 Java 安装过程在 本文中详细描述,但我们将使用稍微不同的过程。
首先,使用 apt-get 来安装python-software-properties
:
1sudo apt-get install python-software-properties
不要使用默认JDK
或默认JRE
包,我们会安装最新版本的Java 8。
1sudo add-apt-repository ppa:webupd8team/java
您需要按ENTER
来接受将存储库添加到您的索引中。
然後更新來源列表:
1sudo apt-get update
最后,使用 apt-get 安装 Java 8,您需要同意适用于 Java SE 平台产品和 JavaFX 的 Oracle 二进制代码许可协议。
1sudo apt-get install oracle-java8-installer
第2步:安装Solar
在本节中,我们将安装Solar 5.2.1. 我们将开始下载Solar发行版。
首先,在 [此页面] 找到合适的镜子(http://www.apache.org/dyn/closer.cgi/lucene/solr/5.2.1)。 然后,从镜子中复制 solr-5.2.1.tgz 的链接。 例如,我们会使用
http://apache.mirror1.spango.com/lucene/solr/5.2.1/`。
然后,在您的家庭目录中下载文件:
1cd ~
2wget http://apache.mirror1.spango.com/lucene/solr/5.2.1/solr-5.2.1.tgz
接下来,提取服务安装文件:
1tar xzf solr-5.2.1.tgz solr-5.2.1/bin/install_solr_service.sh --strip-components=2
然后安装 Solr 作为使用脚本的服务:
1sudo bash ./install_solr_service.sh solr-5.2.1.tgz
最后,检查服务器是否正在运行:
1sudo service solr status
您应该看到一个以此开始的输出:
1[label Solr status output]
2Found 1 Solr nodes:
3
4Solr process 2750 running on port 8983
5
6. . .
步骤三:创建收藏
在本节中,我们将创建一个简单的Solar收藏。
Solr 可以有多个集合,但对于本示例,我们只会使用一个。 若要创建一个新的集合,请使用以下命令。
1sudo su - solr -c "/opt/solr/bin/solr create -c gettingstarted -n data_driven_schema_configs"
在这个命令中,gettingstarted
是集合的名称,而-n
则指定了配置组。Solr提供的配置组有3个;在这种情况下,我们使用了一个是无方案的,这意味着任何字段都可以提供,任何名称,并且类型将被猜测。
您现在已经添加了收藏,并可以开始添加数据。默认方案只有一个必要的字段: id
. 它没有其他默认字段,只有动态字段。 如果您想查看该方案,其中一切都清楚地解释了,请查看文件 /opt/solr/server/solr/gettingstarted/conf/schema.xml
。
步骤 4 – 添加和查询文件
在本节中,我们将探索Solar Web接口,并将一些文档添加到我们的收藏中。
当您使用您的 Web 浏览器访问 http://your_server_ip:8983/solr
时,Solar Web 界面应显示:
网页界面包含大量有用的信息,可以用来纠正您在使用过程中遇到的任何问题。
集合分为核心,这就是为什么在 Web 界面中有很多引用核心的原因。 目前,集合gettingstarted
仅包含一个核心,名为gettingstarted
。
选择gettingstarted
核心后,选择 Documents. Documents 存储了 Solr 可搜索的真实数据. 由于我们使用了无计划配置,我们可以使用任何字段。
1{
2 "number": 1,
3 "president": "George Washington",
4 "birth_year": 1732,
5 "death_year": 1799,
6 "took_office": "1789-04-30",
7 "left_office": "1797-03-04",
8 "party": "No Party"
9}
点击 ** 提交文档** 将文档添加到索引中. 几分钟后,您将看到以下内容:
1[label Output after adding Document]
2Status: success
3Response:
4{
5 "responseHeader": {
6 "status": 0,
7 "QTime": 509
8 }
9}
您可以添加多个文档,具有相似或完全不同的结构,但您也可以继续只使用一个文档。
现在,选择左侧的 ** Query** 来查询我们刚刚添加的文档. 在此屏幕上的默认值下,点击 Execute Query 后,您将看到最多 10 个文档,取决于您添加了多少:
1[label Query output]
2{
3 "responseHeader": {
4 "status": 0,
5 "QTime": 58,
6 "params": {
7 "q": "*:*",
8 "indent": "true",
9 "wt": "json",
10 "_": "1436827539345"
11 }
12 },
13 "response": {
14 "numFound": 1,
15 "start": 0,
16 "docs": [
17 {
18 "number": [
19 1
20 ],
21 "president": [
22 "George Washington"
23 ],
24 "birth_year": [
25 1732
26 ],
27 "death_year": [
28 1799
29 ],
30 "took_office": [
31 "1789-04-30T00:00:00Z"
32 ],
33 "left_office": [
34 "1797-03-04T00:00:00Z"
35 ],
36 "party": [
37 "No Party"
38 ],
39 "id": "1ce12ed2-add9-4c65-aeb4-a3c6efb1c5d1",
40 "_version_": 1506622425947701200
41 }
42 ]
43 }
44}
结论
有更多的选项可用,但您现在已经成功安装了Solar,并可以开始为自己的网站使用它。