解密搜索引擎技术实战(附光盘Lucene & Java精华版第3版全新升级) 电子书下载
本书主要包括总体介绍部分,爬虫部分,自然语言处理部分,全文检索部分以及相关案例分析.爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法.自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现及在搜索引擎中的应用等细节,同时对文档排重,文本分类,自动聚类,句法分析树,拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍,并总结了实现方法.在全文检索部分,结合Lucene介绍了搜索引擎的原理与进展.用简单的例子介绍了Lucene的最新应用方法,包括完整的搜索实现过程:从完成索引到搜索用户界面的实现.此外还进一步介绍了实现准实时搜索的方法,展示了Solr的用法以及实分布式搜索服务集群的方法.最后介绍了在地理信息系统领域和户外活动搜索领域的应用.
尊敬的读者:
欢迎您访问我们的网站。本站的初衷是为大家提供一个共享学习资料、交换知识的平台。每位用户都可以将文件上传至网盘并分享。
然而,随着用户上传的资料增多,我们发现部分不宜或版权问题的书籍被分享到了本站。
为此,我们已经关闭了分享入口,并进行了多次书籍审查,但仍有部分内容未能彻底审查到位。
在此,我们恳请广大读者与我们共同监督,如发现任何不宜内容,请 点击此处 进行举报,我们会第一时间处理并下架相关内容。
希望我们能共建一个文明社区!感谢您的理解与支持!
猜你喜欢
- 《将心注入》霍华德·舒尔茨中文修订版 电子书下载
- Learning SPARQL - Bob DuCharme 电子书下载
- 《裸猿三部曲》德斯蒙德·莫利斯 电子书下载
- 《拜占庭帝国史》A.A.瓦西列夫文字版 电子书下载
- 《上海中考总动员:物理(2018版全真模拟版)》贺平文字版 电子书下载
- 《时间的质量》艾伦·柏狄克全新版 电子书下载
- 《疲劳自救手册》玛丽?伯吉斯全新修订版 电子书下载
- 《纸上动物园》夏洛特·斯莱 / 大英图书馆 电子书下载
- Mobile JavaScript Application Development - Adrian Kosmaczewski 电子书下载
- 《零基础学数据结构 第2版》陈锐文字版 电子书下载
- 《灭火:美国金融危机及其教训》[美] 本·伯南克 / [美] 蒂莫西·盖特纳 / [美] 亨利·保尔森中文版 电子书下载
- 《PPT高手之路》李栋文字版 电子书下载