2790次浏览
本书以图文并茂的形式、通俗易懂的语言讲解了Solr使用中的各个知识点,能够帮助对Solr感兴趣的读者快速了解Solr。由于目前有关Solr相关技术的书籍全部都是英文版的,所以对于英文不太好而又极其需要快速学会使用Solr的读者来说,这是一个福音。下卷:主要针对中高端读者,重点介绍了关于Solr查询、SolrJ、SolrCloud、Solr性能优化等的相关知识。对于Solr查询,下卷主要针对的是高阶知识部分,包括使用游标实现高效的深度分页查询、实现对查询返回的查询结果集进行自定义排序、使用相关性权重来提高查询返回结果集的相关性、FunctionQuery的使用方法、FunctionQuery的自定义方法等;对于SolrJ、SolrCloud的介绍,则均是从基础概念开始,逐步深入到具体的使用和管理方法;对于Solr性能优化,则主要集中在注意事项、具体建议等实操部分的介绍。在全书后,还单独利用一章对之前没涉及的零散内容进行集中介绍,包括版本升级、自定义伪域、自定义Redis缓存、流式处理等内容。序 言 第11章Solr高级查询 1 11.1Solr函数查询 2 11.1.1Function语
3279次浏览
本书以图文并茂的形式、通俗易懂的语言讲解了Solr使用中的各个知识点,能够帮助对Solr感兴趣的读者快速了解Solr。由于目前有关Solr相关技术的书籍全部都是英文版的,所以对于英文不太好而又极其需要快速学会使用Solr的读者来说,这是一个福音。下卷:主要针对中高端读者,重点介绍了关于Solr查询、SolrJ、SolrCloud、Solr性能优化等的相关知识。对于Solr查询,下卷主要针对的是高阶知识部分,包括使用游标实现高效的深度分页查询、实现对查询返回的查询结果集进行自定义排序、使用相关性权重来提高查询返回结果集的相关性、FunctionQuery的使用方法、FunctionQuery的自定义方法等;对于SolrJ、SolrCloud的介绍,则均是从基础概念开始,逐步深入到具体的使用和管理方法;对于Solr性能优化,则主要集中在注意事项、具体建议等实操部分的介绍。在全书后,还单独利用一章对之前没涉及的零散内容进行集中介绍,包括版本升级、自定义伪域、自定义Redis缓存、流式处理等内容。序言 第1章 初识Solr 1 1.1 Solr是什么 1 1.2 Solr的历史 2 1.3 为
3685次浏览
解密搜索引擎技术实战:Lucene&Java精华版(第3版)是猎兔搜索开发团队的软件研发和教学实践的经验汇总。本书总结搜索引擎相关理论与实际解决方案,并给出了Java实现,其中利用了流行的开源项目Lucene和Solr,而且还包括原创的实现。本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现及在搜索引擎中的应用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍,并总结了实现方法。在全文检索部分,结合Lucene介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的应用方法,包括完整的搜索实现过程:从完成索引到搜索用户界面的实现。第1章 搜索引擎总体结构 11.1 搜索引擎基本模块 11.2 开发环境 21.3 搜索引擎工作原理 31.3.1 网络爬虫 41.3.2 全文索引结构与Lucene实现 41
3339次浏览
《Lucene搜索引擎开发进阶实战》结合笔者的实际开发经验,总结了一些新的开发技巧和开发思路,并对网上流传的一些错误技术点和代码进行验证,同时给出正确的思路,旨在给开发者提供一本清晰、完整、易懂的指导手册。本书既可为零起点的Lucene初学者提供系统全面的学习指导,也可帮助有相关经验的开发者解决在开发过程中遇到的一些难题和疑惑。《Lucene搜索引擎开发进阶实战》共12章,分为四部分,第一部分首先介绍网络爬虫和Web搜索,然后讲述Lucene的概念和架构;第二部分通过一个小实例,并结合为文本创建索引来讲解其中的一些方法和类;第三部分主要基于数据库搜索创建搜索引擎实例,阐述技术疑难问题,讨论如何建立工程类的索引,如何使用分词技术等,并对创建索引过程中的jar包进行解析,然后介绍搜索引擎开发中关键的查询方法和高亮显示技术,以及查询结果排序和词频统计的相关知识,最后概述性能优化(包括代码优化、索引优化以及备份和恢复)等相关知识;第四部分总结目前的一些技术,并对未来的一些技术发展进行展望。前 言第1章 网络爬虫策略 11.1 信息时代的飞跃 11.1.1 搜索引擎的出现 11.1.2 搜索之网
4252次浏览
《Solr实战》介绍了当下最流行的开源搜索技术解决方案Solr。在搜索引擎视域下,循序渐进地介绍了Solr是什么、Solr能做什么,以及如何更好地使用Solr进行开发。在搜索基础层,《Solr实战》从Solr的快速搭建入手,介绍了Solr背后的信息检索基本概念,之后重点讲解了构建一个搜索引擎所需的核心模块:索引构建、文本分析、执行搜索及处理搜索结果。在搜索功能层,详细介绍了Solr的四大增强型搜索功能:分面搜索、搜索结果高亮、查询建议、搜索结果分组等。在搜索研究的进阶层,介绍了SolrCloud、多语种搜索及复杂查询操作等。最后,围绕搜索引擎的本质核心问题“相关度”展开了讨论与展望。《Solr实战》适合搜索技术工程师、搜索应用设计者以及对搜索引擎技术感兴趣的读者阅读,也可作为高校计算机专业信息技术方向、信息管理与信息系统专业等的课程参考资料。第1部分 初识Solr 11 Solr 入门 21.1 为什么需要搜索引擎 31.1.1 管理以文本为中心的数据 31.1.2 常见的搜索引擎用例 61.2 Solr 是什么 81.2.1 信息检索引擎 91.2.2 灵活的模式管理 111.2.3
4005次浏览
《从Lucene到Elasticsearch:全文检索实战》循序渐进介绍了信息检索、布尔检索、向量空间模型、tf-idf、BM25排序算法、Lucene架构、Lucene创建索引、Lucene查询、Lucene项目实战、Elasticsearch安装与配置、Elasticsearch插件安装、REST API数据操作、映射与模板、索引别名、Elasticsearch基本和高级搜索、Elasticsearch同步数据库、Elasticsearch集群管理、项目实战等内容。阅读《从Lucene到Elasticsearch:全文检索实战》,读者能够掌握信息检索的核心概念,应用Lucene库处理全文检索业务,掌握Elasticsearch分布式搜索引擎的使用方法与技巧。《从Lucene到Elasticsearch:全文检索实战》基于Lucene 6.0和Elasticsearch 5.4.0进行讲解,技术先进,示例丰富适合想学习信息检索技术的初学者和相关专业的大学生、研究生学习,也很适合大数据及云计算平台构建人员以及有一定基础的IT开发人员使用。目 录第1章 信息检索模型 11.1 信息检索概
9025次浏览
本书主要展示如何使用Elasticsearch构建可扩展的搜索应用程序。书中覆盖了Elasticsearch的主要特性,从使用不同的分析器和查询类型进行相关性调优,到使用聚集功能进行实时性分析,还有地理空间搜索和文档过滤等更多吸引人的特性。全书共分两个部分,第一部分解释了核心特性,内容主要涉及Elasticsearch的介绍,数据的索引、更新和删除,数据的搜索,数据的分析,使用相关性进行搜索,使用聚集来探索数据,文档间的关系等;第二部分介绍每个特性工作的更多细节及其对性能和可扩展性的影响,以便对核心功能进行产品化,内容主要涉及水平扩展和性能提升等。此外,本书还有6个附录(网上下载),提供了读者应该知道的特性,展示了关于地理空间搜索和聚集,如何管理Elasticsearch插件,学习在搜索结果中如何高亮查询单词,在生产环境中用来协助管理Elasticsearch的第三方的监控工具有哪些,如何使用Percolator过滤为多个查询匹配少量文档,如何使用不同的建议器来实现自动完成的功能。第一部分第1章 Elasticsearch介绍 21.1 用Elasticsearch解决搜索问题 31.
6355次浏览
Michael McCandless的《Lucene实战(第2版)》基于Apache的Lucene 3.0,从Lucene核心、Lucene应用、案例分析3个方面详细系统地介绍了Lucene,包括认识Lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用tika提取文本、Lucene的高级扩展、使用其他编程语言访问Lucene、Lucene管理和性能调优等内容,最后还提供了三大经典成功案例,为读者展示了一个奇妙的搜索世界。 《Lucene实战(第2版)》适合于已具有一定Java编程基本的读者,以及希望能够把强大的搜索功能添加到自己的应用程序中的开发人员。本书对于从事搜索引擎工作的工程技术人员,以及在Java平台上进行各类软件开发的人员和编程爱好者,也具有很好的学习参考价值。第1部分 lucene核心第1章 初识lucene1.1 应对信息爆炸1.2 lucene是什么1.2.1 lucene能做些什么1.2.2 lucene的历史1.3 lucene和搜索程序组件1.3.1 索引组件1.3.2 搜索组件1.3.3 搜索程序的其他模块1.3.4 lucene与应用程
10294次浏览
ES是一个分布式可扩展的实时搜索和分析引擎;使用场景:全文搜索,结构化数据,统计,查询定位,地理定位,自动完成,查找提示等。Introduction1. 入门1.1. 是什么1.2. 安装1.3. API1.4. 文档1.5. 索引1.6. 搜索1.7. 聚合1.8. 小结1.9. 分布式1.10. 结语2. 分布式集群2.1. 空集群2.2. 集群健康2.3. 添加索引2.4. 故障转移2.5. 横向扩展2.6. 更多扩展2.7. 应对故障3. 数据3.1. 文档3.2. 索引3.3. 获取3.4. 存在3.5. 更新3.6. 创建3.7. 删除3.8. 版本控制3.9. 局部更新3.10. Mget3.11. 批量3.12. 结语4. 分布式增删改查4.1. 路由4.2. 分片交互4.3. 新建、索引和删除4.4. 检索4.5. 局部更新4.6. 批量请求4.7. 批量格式5. 搜索5.1. 空搜索5.2. 多索引和多类型5.3. 分页5.4. 查询字符串6. 映射和分析6.1. 数据类型差异6.2. 确切值对决全文6.3. 倒排索引6.4. 分析6.5. 映射6.6. 复合类型7