什么是solr
引用于维基百科
开发者 Apache软件基金会
稳定版本
6.6.0 (2017年6月6日,11个月前 )
开发状态 活跃
编程语言 Java
操作系统 跨平台
类型 企业搜索服务器软件
许可协议 Apache许可证 2.0
网站 lucene.apache.org/solr/
源代码库 git.apache.org/lucene-solr.git
Solr(读作“solar”)是Apache Lucene项目的开源企业搜索平台。其主要功能包括全文检索、命中标示[1]、分面搜索、动态聚类、数据库集成,以及富文本(如Word、PDF)的处理。Solr是高度可扩展的,并提供了分布式搜索和索引复制。Solr是最流行的企业级搜索引擎,[2]Solr 4还增加了NoSQL支持。[3]
Solr是用Java编写、运行在Servlet容器(如Apache Tomcat或Jetty)的一个独立的全文搜索服务器。 Solr采用了Lucene Java搜索库为核心的全文索引和搜索,并具有类似REST的HTTP/XML和JSON的API。 Solr强大的外部配置功能使得无需进行Java编码,便可对其进行调整以适应多种类型的应用程序。Solr有一个插件架构,以支持更多的高级定制。
因为2010年Apache Lucene和Apache Solr项目合并,两个项目是由同一个Apache软件基金会开发团队制作实现的。提到技术或产品时,Lucene/Solr或Solr/Lucene是一样的。
搭建solr
进入Apache官网,找到solr下载,下载后的文件名为:solr-7.3.0.tgz(我的是7.3.0版本的solr)
解压文件
solr-7.3.0.tgz
,文件目录为
- 进入目录
/solr-7.3.0/bin
,使用执行solr start
,然后打开 localhost:{执行命令后显示的端口}
创建collection
执行命令
solr create -c {collection_name}
(我的collection名称为listing_new)然后我们进入
/solr-7.3.0/srever/solr
中,会找到我们刚刚创建的collection
collection设置
- 进入该collection目录里面的conf目录,会看到
managed-schema
文件,这个文件是用来定义导入solr的数据,数据定义部分如图所示
- 然后我们会退到{collection_name}目录下,创建
solr-data-config.xmnl
用于定义导入数据的一些操作
- 接着,我们进入{collection_name}/conf目录下,找到solrconfig.xml文件,打开并编辑,将我们刚刚创建的
solr-data-config.xml
文件导入到配置文件中去
数据导入
- 数据导入方面我用的是传统关系型数据库MySQL,然后创建数据库-表,然后自己导入一些数据,等等这些数据将要被导入到solr中{如果是中文的话需要提前进行中文分词}。然后打开网页
http://127.0.0.1:8983
,然后在core
的选项框中选中listing_new
- 选中该collection之后,我们会看到DataImport这个选项,点击这个选项,会看到这个页面
然后执行execute,等待最后数据导入成功
查看
在DataImport的同级目录下找到Query
这个功能,接着你就可以在这里体验下你的搜索引擎了