Natural Language Processing with Spark Nlp: Learning to Understand Text at Scale
暫譯: 使用 Spark NLP 的自然語言處理:學習大規模理解文本

Thomas, Alex

  • 出版商: O'Reilly
  • 出版日期: 2020-08-04
  • 售價: $2,840
  • 貴賓價: 9.5$2,698
  • 語言: 英文
  • 頁數: 350
  • 裝訂: Quality Paper - also called trade paper
  • ISBN: 1492047767
  • ISBN-13: 9781492047766
  • 相關分類: SparkText-mining
  • 海外代購書籍(需單獨結帳)

買這商品的人也買了...

商品描述

Want to build an application that uses natural language text, but aren't sure where to start or what tools to use? This practical book gets you started with natural language processing from the basics to powerful modern techniques. Data scientists will learn how to build enterprise-quality NLP applications using deep learning and the Apache Spark distributed processing framework.

This guide includes concrete examples, practical and theoretical explanations, and hands-on exercises for NLP on Spark. You'll understand why these techniques work from machine learning, linguistic, and practical points of view.

This book shows you how to:

  • Process text in a distributed environment using Spark-NLP, a production-ready library for NLP built on Spark
  • Create, tune, and deploy your own word embeddings
  • Adapt your NLP applications to multiple languages
  • Use text in machine learning and deep learning

商品描述(中文翻譯)

想要建立一個使用自然語言文本的應用程式,但不確定從何開始或使用哪些工具?這本實用的書籍將從基礎到強大的現代技術,幫助你入門自然語言處理。數據科學家將學習如何使用深度學習和 Apache Spark 分散式處理框架來構建企業級的 NLP 應用程式。

本指南包含具體的範例、實用和理論的解釋,以及針對 Spark 的 NLP 實作練習。你將從機器學習、語言學和實際應用的角度理解這些技術為何有效。

這本書將教你如何:

- 在分散式環境中使用 Spark-NLP 處理文本,這是一個基於 Spark 的生產就緒 NLP 函式庫
- 創建、調整和部署你自己的詞嵌入
- 將你的 NLP 應用程式適應多種語言
- 在機器學習和深度學習中使用文本

作者簡介

Alex Thomas is a data scientist at Indeed. He has used natural language processing (NLP) and machine learning with clinical data, identity data, and now employer and jobseeker data. He has worked with Apache Spark since version 0.9, and has worked with NLP libraries and frameworks including UIMA and OpenNLP.

作者簡介(中文翻譯)

亞歷克斯·托馬斯(Alex Thomas)是Indeed的一名數據科學家。他曾使用自然語言處理(NLP)和機器學習處理臨床數據、身份數據,現在則處理雇主和求職者數據。他自Apache Spark 0.9版本以來便開始使用該技術,並且曾使用過包括UIMA和OpenNLP在內的NLP庫和框架。

最後瀏覽商品 (20)