solr自动聚类怎么实现

这篇文章主要讲解了“solr自动聚类怎么实现”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“solr自动聚类怎么实现”吧!

创新互联建站主打移动网站、网站建设、做网站、网站改版、网络推广、网站维护、域名注册、等互联网信息服务,为各行业提供服务。在技术实力的保障下,我们为客户承诺稳定,放心的服务,根据网站的内容与功能再决定采用什么样的设计。最后,要实现符合网站需求的内容、功能与设计,我们还会规划稳定安全的技术方案做保障。

Solr 使用Carrot2完成了聚类功能,能够把检索到的内容自动分类, Carrot2聚类示例:

       要想Solr支持聚类功能,首选要把Solr发行包的中的dist/ solr-clustering-4.2.0.jar, 复制到\solr\contrib\analysis-extras\lib下.然后打开solrconfig.xml进行添加配置:

        

   

                      enable="${solr.clustering.enabled:true}"

   

                      class="solr.clustering.ClusteringComponent" >

   

   

   

        default

   

        org.carrot2.clustering.lingo.LingoClusteringAlgorithm

   

        30

   

         0.70

   

         0

   

         org.carrot2.clustering.lingo.SimpleLabelAssigner

   

          1.5

   

         8

   

         8

    
   

         HIGH

   

         

   

         org.carrot2.matrix.factorization.NonnegativeMatrixFactorizationEDFactory

   

         37500

   

         2.0

   

         0.9

   

         

   

         org.carrot2.text.vsm.TfTermWeighting

   

         CHINESE_SIMPLIFIED

   

         org.carrot2.text.clustering.MultilingualClustering.LanguageAggregationStrategy.FLATTEN_MAJOR_LANGUAGE   

   

         true

   

         true

   

         true

   

         true

   

         true

   

         true

   

         true

   

         0.65

   

         false

   

         2

   

         true

   

         1

   

         1

   

         clustering/carrot2

   

         id

   

   

   

     

    
   

    

       配好了聚类组件后,下面配置requestHandler:

        

     

                  startup="lazy"

   

                     enable="${solr.clustering.enabled:true}"

   

                     class="solr.SearchHandler">

   

   

   

    explicit

   

    true

   

    default

   

    true

   

    category_s

   

    content        

   

    path

   

    true

   

  

   

  

   

    clustering

   

  

   

  

    
   

       有两个参数要注意carrot.title,carrot.snippet是聚类的比较计算字段,这两个参数必须是stored="true".carrot.title的权重要高于carrot.snippet,如果只有一个做计算的字段carrot.snippet可以去掉(是去掉不是值为空).设完了用下面的URL就可以查询了

http://localhost:8080/skyCore/clustering?q=*%3A*&wt=xml&indent=true

感谢各位的阅读,以上就是“solr自动聚类怎么实现”的内容了,经过本文的学习后,相信大家对solr自动聚类怎么实现这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!


网页名称:solr自动聚类怎么实现
网站URL:http://hbruida.cn/article/iisieg.html