拥有 Lucene 标签的文章 共 6 条数据

Lucene搜索引擎开发权威经典 于天恩著 PDF下载
编程书籍

Lucene搜索引擎开发权威经典 于天恩著 PDF下载

2418次浏览 0条评论

《Lucene搜索引擎开发权威经典》基于Lucene的当前最新版本(2.1)精解了Lucene搜索引擎的相关知识,从基础知识到应用开发,精练简洁,恰到好处《Lucene搜索引擎开发权威经典》共包括16章,分为6部分。第1部分Lucene基础。介绍了Lucene的基础知识,包括Lucene的历史和发展情况、使用Lucene创建索引和执行搜索的基本方法以及中文分词的应用,最后做了两个应用项目。第2部分:数据解析。介绍解析不同格式数据(如Word、PDF等)的方法,包括常用的数据解析组件、Lucene自身的数据解析机制和Lius类库。第3部分:索引的高级知识。介绍了 Lucene建立索引的过程,索引的查看和删除,索引的同步,索引的合并和优化等内容。第4部分:搜索的高级知识。介绍使用不同的Query对象构建搜索请求,使用QueryParser解析用户的搜索请求,搜索结果的过滤和排序等内容。第5部分:Lucene应用实例。应用本节介绍的所有知识构建一个桌面搜索引擎和一个Web搜索引擎。这部分作为对前面所有内容的总结。第6部分:Nutch搜索引擎框架。介绍了基于Lucene的完整搜索引擎Nutch

解密搜索引擎技术实战:Lucene&Java精华版(第3版) 完整扫描版PDF下载
编程书籍

解密搜索引擎技术实战:Lucene&Java精华版(第3版) 完整扫描版PDF下载

3327次浏览 0条评论

解密搜索引擎技术实战:Lucene&Java精华版(第3版)是猎兔搜索开发团队的软件研发和教学实践的经验汇总。本书总结搜索引擎相关理论与实际解决方案,并给出了Java实现,其中利用了流行的开源项目Lucene和Solr,而且还包括原创的实现。本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现及在搜索引擎中的应用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍,并总结了实现方法。在全文检索部分,结合Lucene介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的应用方法,包括完整的搜索实现过程:从完成索引到搜索用户界面的实现。第1章  搜索引擎总体结构 11.1  搜索引擎基本模块 11.2  开发环境 21.3  搜索引擎工作原理 31.3.1  网络爬虫 41.3.2  全文索引结构与Lucene实现 41

孔浩老师 lucene视频教程 全50讲教程下载
视频教程

孔浩老师 lucene视频教程 全50讲教程下载

2021次浏览 0条评论

01_lucenc简介和创建索引初步02_lucene简介和搜索初步03_lucene索引_创建_域选项04_lucene索引_的删除和更新05_lucene索引_加权操作和Luke的简单演示06_对日期和数字进行索引07_IndexReader的设计08_Directory的几种操作方式09_lucene的搜索_TermRange等基本搜索10_lucene的搜索_其他常用Query搜索11_lucene的搜索_基于QueryParser的搜索12_lucene的搜索_复习和再查询分页搜索13_lucene的搜索_基于searchAfter的实现14_lucene的分词_分词器的原理讲解15_lucene的分词_通过TokenStream显示分词16_lucene分词_通过TokenStream显示分词的详细信息17_lucene的分词_中文分词介绍18_lucene的分词_实现自定义同义词分词器_思路分析19_lucene的分词_实现自定义同义词分词器_实现分词器20_lucene的分词_实现自定义同义词分词器_实现分词器(良好设计方案)21_lucene的自定义排序22_luce

Lucene搜索引擎开发进阶实战 成龙著 PDF下载
编程书籍

Lucene搜索引擎开发进阶实战 成龙著 PDF下载

2933次浏览 0条评论

《Lucene搜索引擎开发进阶实战》结合笔者的实际开发经验,总结了一些新的开发技巧和开发思路,并对网上流传的一些错误技术点和代码进行验证,同时给出正确的思路,旨在给开发者提供一本清晰、完整、易懂的指导手册。本书既可为零起点的Lucene初学者提供系统全面的学习指导,也可帮助有相关经验的开发者解决在开发过程中遇到的一些难题和疑惑。《Lucene搜索引擎开发进阶实战》共12章,分为四部分,第一部分首先介绍网络爬虫和Web搜索,然后讲述Lucene的概念和架构;第二部分通过一个小实例,并结合为文本创建索引来讲解其中的一些方法和类;第三部分主要基于数据库搜索创建搜索引擎实例,阐述技术疑难问题,讨论如何建立工程类的索引,如何使用分词技术等,并对创建索引过程中的jar包进行解析,然后介绍搜索引擎开发中关键的查询方法和高亮显示技术,以及查询结果排序和词频统计的相关知识,最后概述性能优化(包括代码优化、索引优化以及备份和恢复)等相关知识;第四部分总结目前的一些技术,并对未来的一些技术发展进行展望。前 言第1章 网络爬虫策略 11.1 信息时代的飞跃 11.1.1 搜索引擎的出现 11.1.2 搜索之网

从Lucene到Elasticsearch:全文检索实践 PDF下载
编程书籍

从Lucene到Elasticsearch:全文检索实践 PDF下载

3593次浏览 0条评论

《从Lucene到Elasticsearch:全文检索实战》循序渐进介绍了信息检索、布尔检索、向量空间模型、tf-idf、BM25排序算法、Lucene架构、Lucene创建索引、Lucene查询、Lucene项目实战、Elasticsearch安装与配置、Elasticsearch插件安装、REST API数据操作、映射与模板、索引别名、Elasticsearch基本和高级搜索、Elasticsearch同步数据库、Elasticsearch集群管理、项目实战等内容。阅读《从Lucene到Elasticsearch:全文检索实战》,读者能够掌握信息检索的核心概念,应用Lucene库处理全文检索业务,掌握Elasticsearch分布式搜索引擎的使用方法与技巧。《从Lucene到Elasticsearch:全文检索实战》基于Lucene 6.0和Elasticsearch 5.4.0进行讲解,技术先进,示例丰富适合想学习信息检索技术的初学者和相关专业的大学生、研究生学习,也很适合大数据及云计算平台构建人员以及有一定基础的IT开发人员使用。目 录第1章 信息检索模型 11.1 信息检索概

《Lucene实战(第2版)》  Lucene In Action 高清PDF下载
编程书籍

《Lucene实战(第2版)》 Lucene In Action 高清PDF下载

5790次浏览 1条评论

Michael McCandless的《Lucene实战(第2版)》基于Apache的Lucene 3.0,从Lucene核心、Lucene应用、案例分析3个方面详细系统地介绍了Lucene,包括认识Lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用tika提取文本、Lucene的高级扩展、使用其他编程语言访问Lucene、Lucene管理和性能调优等内容,最后还提供了三大经典成功案例,为读者展示了一个奇妙的搜索世界。 《Lucene实战(第2版)》适合于已具有一定Java编程基本的读者,以及希望能够把强大的搜索功能添加到自己的应用程序中的开发人员。本书对于从事搜索引擎工作的工程技术人员,以及在Java平台上进行各类软件开发的人员和编程爱好者,也具有很好的学习参考价值。第1部分 lucene核心第1章 初识lucene1.1 应对信息爆炸1.2 lucene是什么1.2.1 lucene能做些什么1.2.2 lucene的历史1.3 lucene和搜索程序组件1.3.1 索引组件1.3.2 搜索组件1.3.3 搜索程序的其他模块1.3.4 lucene与应用程