自制搜索引擎
内容简介
《自制搜索引擎》聚焦于Google和Yahoo!等Web搜索服务幕后的搜索引擎系统,首先讲解了搜索引擎的基础知识和原理,接着以现实中的开源搜索引擎Senna/Groonga为示例,使用该引擎的源代码引导读者亲自体验搜索引擎的开发过程。这部分讲解涉及了倒排索引的制作和压缩、检索的处理流程以及搜索引擎的优化等内容。又简单介绍了一些更加专业的搜索引擎的知识和要点,为读者今后进一步学习打下了基础。本...
作者简介
山田浩之(作者)
信息工程学博士。先后于日本IBM、雅虎从事分布式搜索引擎的研发工作。目前在东京大学生产技术研究所从事高性能并行数据库的研发工作。
末永匡(作者)
开源搜索引擎Senna/Groonga的开发者。每天都在奋斗,梦想着能创建一个更加自由、更加无拘无束的,而不是一家独大的应用程序平台。
胡屹(译者)
多年从事W...
目录
文章试读
本节讲解的是用于快速进行全文搜索的索引结构。在讲解广泛应用于全文搜索的、名为倒排索引的索引结构之前,让我们先来梳理一下全文搜索的方法。 全文搜索的两种方法 全文搜索大致上可以分为两种方法,一种是利用全扫描进行全文搜索,一种是利用索引进行全文搜索。 利用全扫描进行全文搜索 第一种方法是从头到尾扫描作为检索对象的文档,以此来搜索要检索的字符串。由于Unix 的字符串检索命令“g...
该书热门标签
- 最新
- 热门
- 最新
- 热门
-
快速了解搜索引擎核心实现的一本读物
0有用 ginobefun 2017-04-26
1.第一章“搜索引擎是如何工作的”是我感觉收获最多的一部分,把倒排说明说得比较清楚,通过一些插图能容易理解倒排索引对于搜索的核心作用;2.本书是通过C语言来实现一个小型的搜索引擎,代码量比较少而且都比... 查看全部>>
-
快速了解搜索引擎核心实现的一本读物
0有用 ginobefun 2017-04-26
1.第一章“搜索引擎是如何工作的”是我感觉收获最多的一部分,把倒排说明说得比较清楚,通过一些插图能容易理解倒排索引对于搜索的核心作用;2.本书是通过C语言来实现一个小型的搜索引擎,代码量比较少而且都比... 查看全部>>
评价“自制搜索引擎”