Instant Apache Solr for Indexing Data How-to
暫譯: 即時 Apache Solr 數據索引實用指南

Alexandre Rafalovitch

  • 出版商: Packt Publishing
  • 出版日期: 2013-06-18
  • 售價: $1,020
  • 貴賓價: 9.5$969
  • 語言: 英文
  • 頁數: 90
  • 裝訂: Paperback
  • ISBN: 1782164847
  • ISBN-13: 9781782164845
  • 相關分類: 全文搜尋引擎 Full-text-search
  • 海外代購書籍(需單獨結帳)

商品描述

Nobody pretends indexing data with Apache Solr is a walk in the park, but this book eases the path with plain language explanations and involving projects. Perfect for developers with sophisticated indexing ambitions.

Overview

  • Learn something new in an Instant! A short, fast, focused guide delivering immediate results
  • Take the most basic schema and extend it to support multi-lingual, multi-field searches
  • Make Solr pull data from a variety of existing sources
  • Discover different pathways to acquire and normalize data and content

In Detail

Content and data searching is a very important part of the modern user experience, and before something can be searched, it has to be indexed. Indexing is a hidden part of the process that has a surprisingly strong impact on the overall user experience. From speed, to faceting, to multilingual support, everything depends on correct indexing.

Instant Apache Solr for Indexing Data How-to is an example-driven guide that will take you on a journey from the basic collection of data to a multi-lingual, multi-field, multi-type schema. By the end of the book, you will know how to get your data ready for searches and how to tune the process to achieve the required search use-cases.

Instant Apache Solr for Indexing Data How-to is a friendly, practical guide that will show you how to index your data with Solr. This book will explain how Solr’s basic blocks actually work and fit together. You will then explore additional settings, pipelines, and configuration changes to achieve ever more complex goals. You will then cover how to push data into Solr and when to get Solr to pull the data. You will then master indexing textual and binary context before enabling multilingual content to be searched.

What you will learn from this book

  • Produce a basic Solr schema ready for experimentation and exploration
  • Run several collections on one Solr server
  • Import, search, and facet simple and multi-valued fields
  • Create your own field type analyzer chains for ultimate indexing flexibility
  • Detect, index, and partition multi-lingual content
  • Use CSV, XML, JSON, and binary formats to get data into Solr
  • Pull data from external files and databases using DataImportHandler
  • Write a Java client using the SolrJ library in both remote and embedded mode
  • Change data already indexed using atomic updates
  • Reshape incoming data with UpdateRequestProcessors
  • Control the visibility of data with soft and hard commits

Approach

Filled with practical, step-by-step instructions and clear explanations for the most important and useful tasks. This book is written in a friendly, practical manner with recipes covering important indexing techniques and methods using Apache Solr.

Who this book is written for

This book is for developers who want to dive deeper into Solr. Regardless of whether you are just starting with Solr or have already built your first collection by copying and modifying examples, this book will take you through the complicated steps of indexing your data with Solr.

商品描述(中文翻譯)

沒有人會假裝使用 Apache Solr 進行資料索引是一件輕而易舉的事,但這本書以簡單的語言解釋和引人入勝的專案來簡化這個過程。非常適合有高級索引需求的開發者。

概述

  • 瞬間學習新知!一本短小、快速、專注的指南,提供立即的結果
  • 從最基本的架構開始,擴展以支持多語言、多欄位的搜尋
  • 讓 Solr 從各種現有來源提取資料
  • 探索獲取和標準化資料及內容的不同途徑

詳細內容

內容和資料搜尋是現代使用者體驗中非常重要的一部分,在某些東西可以被搜尋之前,必須先進行索引。索引是這個過程中隱藏的一部分,對整體使用者體驗有著意想不到的強大影響。從速度、切面到多語言支持,一切都依賴於正確的索引。

《瞬間學會使用 Apache Solr 進行資料索引》是一本以範例為導向的指南,將帶領你從基本的資料收集進入多語言、多欄位、多類型的架構。到書的結尾,你將知道如何準備你的資料以供搜尋,以及如何調整過程以達成所需的搜尋使用案例。

《瞬間學會使用 Apache Solr 進行資料索引》是一本友好且實用的指南,將向你展示如何使用 Solr 進行資料索引。本書將解釋 Solr 的基本組件如何實際運作並相互配合。接著,你將探索額外的設定、管道和配置變更,以達成越來越複雜的目標。然後,你將學習如何將資料推送到 Solr 以及何時讓 Solr 提取資料。接下來,你將掌握索引文本和二進位內容,然後啟用多語言內容的搜尋。

你將從這本書中學到什麼

  • 產生一個基本的 Solr 架構,準備進行實驗和探索
  • 在一個 Solr 伺服器上運行多個集合
  • 導入、搜尋和切面簡單及多值欄位
  • 創建自己的欄位類型分析器鏈,以獲得最佳的索引靈活性
  • 檢測、索引和分區多語言內容
  • 使用 CSV、XML、JSON 和二進位格式將資料導入 Solr
  • 使用 DataImportHandler 從外部檔案和資料庫提取資料
  • 使用 SolrJ 庫編寫 Java 客戶端,支持遠端和嵌入模式
  • 使用原子更新更改已索引的資料
  • 使用 UpdateRequestProcessors 重新塑造進來的資料
  • 通過軟性和硬性提交控制資料的可見性

方法

本書充滿了實用的逐步指導和對最重要和有用任務的清晰解釋。這本書以友好、實用的方式撰寫,包含使用 Apache Solr 的重要索引技術和方法的食譜。

本書的讀者對象

這本書是為希望深入了解 Solr 的開發者而寫的。無論你是剛開始接觸 Solr,還是已經通過複製和修改範例建立了你的第一個集合,這本書都將引導你完成使用 Solr 進行資料索引的複雜步驟。