solr集群java代码 solr schema

java web 怎么用solr

我们下载的Solr包后，进入Solr所在的目录，我们可以看到以下几个目录：build、client、dist、example、lib、site、src。下面分别对其进行介绍。

沈阳网站建设公司创新互联,沈阳网站设计制作，有大型网站制作公司丰富经验。已为沈阳近1000家提供企业网站建设服务。企业网站搭建\成都外贸网站建设要多少钱，请找那个售后服务好的沈阳做网站的公司定做！

1) build：该目录是在ant build过程中生成的，其中包含了未被打包成jar或是war的class文件以及一些文档文件。

2) client：该目录包含了特定语言的Solr客户端API，使得使用其他语言的用户能通过HTTP用XML与Solr进行通话。现在该目录里面虽然包含javascript、python、ruby三个子目录，但是到目前为止只包含一部分的ruby的代码，其他语言仍是空的。另外，Solr的Java客户端称为SolrJ，其代码位于src/solrj目录下面。在之后的文章中我会详细介绍Solr客户端的使用。

3) dist：该目录包含build过程中产生的war和jar文件，以及相关的依赖文件。还记得上一篇文章中，我们在build 1.4版本的Solr源代码后需要部署example吗？其实就是将该目录下面的apache-solr-1.4.war部署到Jetty上面去，并重命名为solr.war。

4) example：这个目录实际上是Jetty的安装目录。其中包含了一些样例数据和一些Solr的配置。

其中一些子目录也比较重要，这里也对它们稍作介绍。

l example/etc：该目录包含了Jetty的配置，在这里我们可以将Jetty的默认端口从8983改为80端口。

l 将其中的8983端口换成80端口。注意更改端口后启动Jetty可能会提示你没有权限，你需要使用sudo java -jar start.jar来运行。

l example/multicore：该目录包含了在Solr的multicore中设置的多个home目录。在之后的文章中我会对其进行介绍。

l example/solr：该目录是一个包含了默认配置信息的Solr的home目录。

详见下面的“solr home说明”

l example/webapps：Jetty的webapps目录，该目录通常用来放置Java的Web应用程序。在Solr中，前面提到的solr.war文件就部署在这里。

5) lib：该目录包含了所有Solr的API所依赖的库文件。其中包括Lucene，Apache commons utilities和用来处理XML的Stax库。

6) site：该目录仅仅包含了Solr的官网的网页内容，以及一些教程的PDF文档。

7) src：该目录包含了Solr项目的整个源代码。这里对其各个子目录也做相应的介绍。

l src/java：该目录存放的是Solr使用Java编写的源代码。

l src/scripts：该目录存放的是配置Solr服务器的Unix BashShell脚本，在后面介绍多服务器配置中将会有重要的作用。

l src/solrj：前面提到过该目录存放的是Solr的Java版本的客户端代码。

l src/test：该目录存放的是测试程序的源代码和测试文件。

l src/webapp：该目录存放的是管理Solr的Web页面，包括Servlet和JSP文件，其构成了前面提到的WAR文件。管理Solr的JSP页面在web/admin目录下面，如果你有兴趣折腾Solr可以找到相应的JSP的页面对其进行设置

1.4.2 Solr home说明

所谓的Solr home目录实际上是一个运行的Solr实例所对应的配置和数据（Lucene索引）。在上一篇文章中我提到过在Solr的example/solr目录就是一个Solr用做示例的默认配置home目录。实际上example/multicore也是一个合法的Solr home目录，只不过是用来做mult-core设置的。那么我们来看看example/solr这个目录里面都有些什么。

example/solr目录下主要有以下一些目录和文件：

1) bin：如果你需要对Solr进行更高级的配置，该目录建议用来存放Solr的复制脚本。

2) conf ：该目录下面包含了各种配置文件，下面列出了两个最为重要的配置文件。其余的.txt和.xml文件被这两个文件所引用，如用来对文本进行特殊的处理。

l conf/schema.xml：该文件是索引的schema，包含了域类型的定义以及相关联的analyzer链。

l conf/solrconfig.xml：该文件是Solr的主配置文件。

l conf/xslt：该目录包含了各种XSLT文件，能将Solr的查询响应转换成不同的格式，如：Atom/RSS等。

3) data：包含了Lucene的二进制索引文件。

4) lib：该目录是可选的。用来放置附加的Java JAR文件，Solr在启动时会自动加载该目录下的JAR文件。这就使得用户可以对Solr的发布版本（solr.war）进行扩展。如果你的扩展并不对Solr本身进行修改，那么就可以将你的修改部署到JAR文件中放到这里。

Solr是如何找到运行所需要的home目录的呢？

Solr首先检查名为solr.solr.home的Java系统属性，有几种不同的方式来设置该Java系统属性。一种不管你使用什么样的Java应用服务器或Servlet引擎都通用的方法是在调用Java的命令行中进行设置。所以，你可以在启动Jetty的时候显式地指定Solr的home目录java -Dsolr.solr.home=solr/ -jar start.jar。另一种通用的方法是使用JNDI，将home目录绑定到java:comp/env/solr/home。并向src/webapp/web/WEB-INF/web.xml添加以下一段代码：

1 env-entry

2 env-entry-namesolr/home/env-entry-name

3 env-entry-valuesolr//env-entry-value

4 env-entry-typejava.lang.String/env-entry-type

5 /env-entry

实际上这段XML在web.xml文件中已经存在，你只需要把原来注释掉的xml取消注释，添加你所要指向的home目录即可。因为修改了web.xml文件，所以你需要运行antdist-war来重新打包之后再部署WAR文件。

最后，如果Solr的home目录既没有通过Java系统属性指定也没有通过JNDI指定，那么他将默认指向solr/。

在产品环境中，我们必须设置Solr的home目录而不是让其默认指向solr/。而且应该使用绝对路径，而不是相对路径，因为你有可能从不同的目录下面启动应用服务器。

注：Jetty 是一个开源的servlet容器，它为基于Java的web内容，例如JSP和servlet提供运行环境。Jetty是使用Java语言编写的，它的API以一组JAR包的形式发布。开发人员可以将Jetty容器实例化成一个对象，可以迅速为一些独立运行（stand-alone）的Java应用提供网络和web连接。

我们先从使用者的角度出发，最先看到的当然是servlet,因为Solr本身是个独立的网络应用程序，需要在Servlet容器中运行来提供服务，所以servlet是用户接触的最外层。我们看看org.apache.solr.servlet包。这个包很简单，只有两个类：SolrServlet和SolrUpdateServlet.我们很容易从类名中猜出这两个类的用途。

SolrServlet类继承HttpServlet类，只有四个方法：

· init()

· destroy()

· doGet()

· doPost()

SolrServlet类中除了普通的Java类对象（包括Servlet相关的）外，有四个Solr本身的类，还有一个Solr本身的异常。其中两个类和一个异常属于org.apache.solr.core包，两个类属于org.apache.solr.request包。属于core包的有：

· Config:

· SolrCore:

属于request包的有：

· SolrQueryResponse:

· QueryResponseWriter:

分析一下这个SolrServlet类。首先servlet会调用init()方法进行初始化：通过Context查找java:comp/env/solr/home来确定Solr的主目录（home），接着调用Config.setInstanceDir(home)方法设置这个实例的目录。然后通过SolrCore.getSolrCore()来获得一个SolrCore实例。destroy()方法将会在Servlet对象销毁时调用，仅仅调用core.close()关闭SolrCore实例。

当用户请求进来时doPost()简单地将任务交给doGet()完成，主要的任务由doGet()完成。分析一下doGet()方法：

1) 使用SolrCore和doGet()参数request生成一个SolrServletRequest对象(注意：这个SolrServletRequest类不是公开类，位于org.apache.solr.servlet包中，继承了SolrQueryRequestBase类，仅仅接受SolrCore和HttpServletRequest对象作为参数)

2) 然后SolrCore执行execute()方法（参数为SolrServletRequest和SolrQueryResponse）

由此可见，真正的处理核心是SolrCore的execute方法

Java框架solr用哪个版本的好？

solr-4.10.2，当下几个出名的分词器IKAnalyzer已支持该版本。现在开发的产品需要使用搜索功能，lucene是首选，于是再度研究了一翻，没有多大难度。同时也不在直接使用lucene库，而是使用solr，大大简化了创建索引与查询索引的难度。solr这种分布式索引方式对性能的控制更加有把握，因为它支持多核、复制功能，我们还可以写代码实现读写分离等性能扩展功能。itJob

solr是怎么调用zookeeper

zookeeper配置

（1）解压为zookeepertar -xf -C /home/myuser/zookeeper/

复制zookeeper文件夹3份，分别重名名为zookeeperA，zookeeperB，zookeeperC。并且创建数据快照以及日志存放文件夹，命名为zooA，zooB，zooC。（2）编辑对应的zookeeper配置文件，复制zookeeperconf下zoo_sample.cfg为zoo.cfgcd /home/myuser/zookeeperA/conf

cp zoo_sample.cfg zoo.cfg

（3）修改zoo.cfg# The number of milliseconds of each tick

tickTime=2000

# The number of ticks that the initial

# synchronization phase can take

initLimit=10

# The number of ticks that can pass between

# sending a request and getting an acknowledgement

syncLimit=5

# the directory where the snapshot is stored.

# do not use /tmp for storage, /tmp here is just

# example sakes.

dataDir=/home/myuser/zooA/data

# the port at which the clients will connect

clientPort=2181

# ZooKeeper server and its port no. # ZooKeeper ensemble should know about every other machine in the ensemble # specify server id by creating 'myid' file in the dataDir # use hostname instead of IP address for convenient maintenance

server.1=127.0.0.1:2888:3888

server.2=127.0.0.1:2988:3988

server.3=127.0.0.1:2088:3088

# Be sure to read the maintenance section of the

# administrator guide before turningtickTime：心跳时间，为了确保连接存在的，以毫秒为单位，最小超时时间为两个心跳时间initLimit：多少个心跳时间内，允许其他server连接并初始化数据，如果ZooKeeper管理的数据较大，则应相应增大这个值clientPort：服务的监听端口dataDir：用于存放内存数据库快照的文件夹，同时用于集群的myid文件也存在这个文件夹里（注意：一个配置文件只能包含一个dataDir字样，即使它被注释掉了。）dataLogDir：用于单独设置transaction log的目录，transaction log分离可以避免和普通log还有快照的竞争

syncLimit：多少个tickTime内，允许follower同步，如果follower落后太多，则会被丢弃。

（4）创建myid文件cd /home/myuser/zooA/data

sudo sh -c 'echo "1" myid'

其他文件夹类似创建myid文件，zookeeperB为2，zookeeperC为3（5）启动zookeepercd /home/myuser/zookeeperA/bin

sudo sh zkServer.sh start

查看zookeeper状态[root@weibo bin]# sh zkServer.sh status

JMX enabled by default

Using config: /home/weibo/zookeeperA/bin/../conf/zoo.cfg

Mode: follower

启动OK，依次启动另外两台zookeeper，启动第一台zookeeper后，你可以观察bin下的zookeeper.out可以看到报错，connection refused，没有关系，zookeeper需要等待其他另个节点的加入，全部启动之后就正常了。（6）客户端连接zookeeper[root@weibo bin]# sh zkCli.sh

Connecting to localhost:2181

2013-05-10 15:00:25,363 [myid:] - INFO [main:Environment@100] - Client environment:zookeeper.version=3.4.5-1392090, builtconfigs：保存上传的配置文件信息clusterstate.json：集群状态jsonaliases：别名jsonlive_node：当solr服务器启动的时候，会注册到这里overseer：保存shard信息overseer_elect：节点选举collections：所有的collection

Solr及Tomcat安装配置

（1）下载solr4.2，把solr-4.2.1\example\solr\collection1\conf 目录下的配置文件上传的zookeeper（2）上传solr配置文件到zookeeperJava -classpath .:/home/weibo/tomcat_solr_/webapps/solr/WEB-INF/lib/* org.apache.solr.cloud.ZkCLI -cmd upconfig -zkhost 127.0.0.1:2181,127.0.0.1:2281,127.0.0.1:2381 -confdir /home/weibo/solr-config -confname weiboconfig

（3）把配置文件和目标collection联系起来java -classpath .:/home/weibo/tomcat_solr_/webapps/solr/WEB-INF/lib/* org.apache.solr.cloud.ZkCLI -cmd linkconfig -collection weibocollection -confname weiboconfig -zkhost 127.0.0.1:2181,127.0.0.1:2281,127.0.0.1:2381

（4）复制3个tomcat，在conf/Catalina/localhost创建solr.xml（如果目录不存在，请自行创建），内容如下?xml version="1.0" encoding="utf-8"?

Context docBase="/home/weibo/solr-/solr.war" debug="0" corssContext="false"

Environment name="solr/home" type="java.lang.String" value="/home/weibo/solr-/" override="true"/

/Context

crossContext不能设置为true，这里注意（5）在你的solr home目录创建solr.xml?xml version="1.0" encoding="UTF-8" ?

solr persistent="true"

cores adminPath="/admin/cores" zkClientTimeout="20000" hostPort="8080"

/cores

/solr

其他tomcat对应设置对应的端口号（6）编辑tomcat bin/catalina.sh（Windows下catalina.bat），加入JAVA_OPTS='-DzkHost=127.0.0.1:2181,127.0.0.1:2281,127.0.0.1:2381'

这里就是solr和zookeeper交互的地方了（7）依次启动tomcat，创建core及shard，访问solr

当前文章：solr集群java代码 solr schema
标题链接：http://hbruida.cn/article/ddgshic.html

solr集群java代码 solr schema

java web 怎么用solr

Java框架solr用哪个版本的好？

solr是怎么调用zookeeper

其他资讯