solr快速搭建

什么是solr

引用于维基百科

开发者 Apache软件基金会
稳定版本
6.6.0 (2017年6月6日,​11个月前 )
开发状态 活跃
编程语言 Java
操作系统 跨平台
类型 企业搜索服务器软件
许可协议 Apache许可证 2.0
网站 lucene.apache.org/solr/
源代码库 git.apache.org/lucene-solr.git
Solr(读作“solar”)是Apache Lucene项目的开源企业搜索平台。其主要功能包括全文检索、命中标示[1]、分面搜索、动态聚类、数据库集成,以及富文本(如Word、PDF)的处理。Solr是高度可扩展的,并提供了分布式搜索和索引复制。Solr是最流行的企业级搜索引擎,[2]Solr 4还增加了NoSQL支持。[3]
Solr是用Java编写、运行在Servlet容器(如Apache Tomcat或Jetty)的一个独立的全文搜索服务器。 Solr采用了Lucene Java搜索库为核心的全文索引和搜索,并具有类似REST的HTTP/XML和JSON的API。 Solr强大的外部配置功能使得无需进行Java编码,便可对其进行调整以适应多种类型的应用程序。Solr有一个插件架构,以支持更多的高级定制。
因为2010年Apache Lucene和Apache Solr项目合并,两个项目是由同一个Apache软件基金会开发团队制作实现的。提到技术或产品时,Lucene/Solr或Solr/Lucene是一样的。

搭建solr

  1. 进入Apache官网,找到solr下载,下载后的文件名为:solr-7.3.0.tgz(我的是7.3.0版本的solr)

  2. 解压文件solr-7.3.0.tgz,文件目录为

解压后的目录

  1. 进入目录/solr-7.3.0/bin,使用执行solr start,然后打开 localhost:{执行命令后显示的端口}

执行成功后的返回

创建collection

  1. 执行命令solr create -c {collection_name}(我的collection名称为listing_new)

  2. 然后我们进入/solr-7.3.0/srever/solr中,会找到我们刚刚创建的collection

collection设置

  1. 进入该collection目录里面的conf目录,会看到managed-schema文件,这个文件是用来定义导入solr的数据,数据定义部分如图所示

managed-schema文件内容

  1. 然后我们会退到{collection_name}目录下,创建solr-data-config.xmnl用于定义导入数据的一些操作

solr-data-config.xml

  1. 接着,我们进入{collection_name}/conf目录下,找到solrconfig.xml文件,打开并编辑,将我们刚刚创建的solr-data-config.xml文件导入到配置文件中去

solrconfig.xml

数据导入

  1. 数据导入方面我用的是传统关系型数据库MySQL,然后创建数据库-表,然后自己导入一些数据,等等这些数据将要被导入到solr中{如果是中文的话需要提前进行中文分词}。然后打开网页http://127.0.0.1:8983,然后在core的选项框中选中listing_new

core-listing_new

  1. 选中该collection之后,我们会看到DataImport这个选项,点击这个选项,会看到这个页面

DataImport

然后执行execute,等待最后数据导入成功

查看

在DataImport的同级目录下找到Query这个功能,接着你就可以在这里体验下你的搜索引擎了

Query

哔哩哔哩视频演示

solr搜索引擎初识