# 入門
Elasticsearch 是一個實時的分布式搜索和分析引擎。它可以幫助你用前所未有的速度去處理大規(guī)模數(shù)據(jù)。
它可以用于全文搜索,結(jié)構(gòu)化搜索以及分析,當(dāng)然你也可以將這三者進行組合
-
維基百科使用 Elasticsearch 來進行全文搜索并高亮顯示關(guān)鍵詞,以及提供search-as-you-type、did-you-mean等搜索建議功能。
-
英國衛(wèi)報使用 Elasticsearch 來處理訪客日志,以便能將公眾對不同文章的反應(yīng)實時地反饋給各位編輯。
-
StackOverflow 將全文搜索與地理位置和相關(guān)信息進行結(jié)合,以提供more-like-this相關(guān)問題的展現(xiàn)。
-
GitHub 使用 Elasticsearch 來檢索超過1300億行代碼。
-
每天,Goldman Sachs 使用它來處理5TB數(shù)據(jù)的索引,還有很多投行使用它來分析股票市場的變動。
但是Elasticsearch并不只是面向大型企業(yè)的,它還幫助了很多類似 DataDog 以及 Klout 的創(chuàng)業(yè)公司進行了功能的擴展。Elasticsearch 可以運行在你的筆記本上,也可以部署到成千上萬的服務(wù)器上,處理PB級別的數(shù)據(jù)。
Elasticsearch 每一個獨立的部分都不是新創(chuàng)的。比如全文搜索早就已經(jīng)被實現(xiàn),統(tǒng)計系統(tǒng)和分布式數(shù)據(jù)庫也早已存在。但是革命之處在于能將這些獨立的功能結(jié)合成一個連貫、實時處理的整體。對于新用戶,它的門檻也很低,當(dāng)然他也會因為你的強大而變得更強大。
你之所以拿起這本書,就是因為你眼前有很多的數(shù)據(jù),但是你并不知道如何使用他們,接下來我們將開始探討有關(guān)處理數(shù)據(jù)的事情。
很不幸的是,目前的大部分?jǐn)?shù)據(jù)庫在提取數(shù)據(jù)方面都是非常的薄弱的。雖然它們可以通過精準(zhǔn)的時間戳或者確切的數(shù)值來進行內(nèi)容的篩選,但是它們可以在全文搜索時做到同義詞或者相關(guān)性搜索嗎?他們可以匯總相同內(nèi)容數(shù)據(jù)嗎?最重要的是,每對如此巨大的數(shù)據(jù)量,它們能做到實時處理嗎?
這便是 Elasticsearch 如此突出的理由:Elasticsearch 可以幫助你瀏覽并利用已經(jīng)快要爛在數(shù)據(jù)庫里的那些極難查詢的數(shù)據(jù)。
> ### Elasticsearch 將會成為你一生的小伙伴。
- Introduction
- 入門
- 初識
- 安裝
- API
- 文檔
- 索引
- 搜索
- 匯總
- 小結(jié)
- 分布式
- 本章總結(jié)
- 分布式集群
- 空集群
- 集群健康
- 添加索引
- 容錯移轉(zhuǎn)
- 橫向擴展
- 擴展
- 故障恢復(fù)
- 索引
- 文檔
- Get
- 存在
- 更新
- 創(chuàng)建
- 刪除
- 版本控制
- 局部更新
- Mget
- Bulk
- 總結(jié)
- 分布式文檔存儲
- 路由
- 主從互通
- 創(chuàng)建索引刪除
- 獲取
- 局部更新
- 批量請求
- 批量格式
- 搜索
- 空白搜索
- 多索引多類型
- 分頁
- 查詢語句
- 映射與統(tǒng)計
- Exact_vs_full_text
- Inverted_index
- Analysis
- Mapping
- Complex_datatypes
