网上一堆复制文件、修改文件的搭建教程,看完一顿懵,总觉得瞎复制文件不安全,容易出乱子。今天看了官方文档做下笔记,使用内嵌的 jetty 和 自己的 zookeeper 启动集群,希望能给网友一些帮助.
环境:最好有两台 ubuntu 16 的虚拟机. 只有一台的话应该可以起两个端口不一样的 solr 实例, 自己折腾试试
安装 jdk
apt update
apt install openjdk-8-jdk
安装 zookeeper
这里只安装单机版, zookeeper集群高可用按下不表, 主要研究 solr
wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/zookeeper-3.4.9/zookeeper-3.4.9.tar.gz
tar zxvf zookeeper-3.4.9.tar.gz
cd zookeeper-3.4.9/conf
cp zoo_sample.cfg zoo.cfg
cd ../bin/
./zkServer.sh start
安装 solr
wget https://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/6.4.2/solr-6.4.2.tgz
tar zxvf solr-6.4.2.tgz && cd solr-6.4.2
单机启动
说明:加 -force
是因为solr不允许使用 root 进行操作的,其他账户可不加
./solr start -force
启动后可以直接访问 ip:8983 即可看到 solr web 版的控制台
单机创建库
./solr create -c test_core -force
上面这条命令创建了一个名为 test_core
的 solr 库,专业名词叫 core
, 集群版叫 collection
. 关于 solr 的术语可上网搜索参考其他文章.
集群配置
集群中的每台机器都要按照以下说明进行配置启动
首先到 solr 安装目录的 bin 下,编辑 solr.in.sh 文件
搜索 SOLR_HOST
, 取消注释, 设置成自己的 ip
搜索 SOLR_TIMEZONE
, 取消注释, 设置成 UTC+8
SOLR_HOST="10.4.81.19"
SOLR_TIMEZONE="UTC+8"
注意:SOLR_HOST 如果不是生产环境不推荐设置成主机名,我复制虚拟机实验的时候由于主机名相同经历了一些很深的坑.
集群启动
./solr start -cloud -z 10.4.81.19:2181 -p 8983 -force
-cloud 参数告诉 solr 集群方式启动,可简写为 -c
-z 参数的值换成自己 zookeeper 的地址和端口
-p 指定 solr web 启动的端口(默认 8983)
-force 上文已经解释过
集群中每台机器都可以使用以上命令启动
live_nodes 节点可查看注册到集群中的 solr 实例
集群创建库
创建库只在集群的一台机子上操作即可
./solr create_collection -c test_collection -shards 2 -replicationFactor 3 -force
-c 指定库(collection)名称
-shards 指定分片数量,可简写为 -s ,索引数据会分布在这些分片上
-replicationFactor 每个分片的副本数量
-force 上文已说明
每个分片上的副本数据是一致的,leader挂掉后如果不加shards.tolerant=true
会导致库的读写都不可用,待重新选举出 leader 后会恢复, 默认3分钟,可以配置.
修改选举时间
修改 solr 安装目录的 server/solr/solr.xml
文件
在<solrcloud>
节点内添加一下内容,单位是毫秒
<str name="leaderVoteWait">${leaderVoteWait:10000}</str>
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。