Modeling the Internet and the Web: Probabilistic Methods and Algorithms (Hardcover)
暫譯: 網際網路與網頁建模:機率方法與演算法 (精裝版)

Pierre Baldi, Paolo Frasconi, Padhraic Smyth

  • 出版商: Wiley
  • 出版日期: 2003-07-07
  • 售價: $1,007
  • 語言: 英文
  • 頁數: 306
  • 裝訂: Hardcover
  • ISBN: 0470849061
  • ISBN-13: 9780470849064
  • 相關分類: Algorithms-data-structures
  • 已絕版

買這商品的人也買了...

商品描述

The World Wide Web is growing in size at a remarkable rate.  It is a huge evolving system and its data are rife with uncertainties.  Probability and statistics are the fundamental mathematical tools that enable us to model, reason and infer meaningful results from such data.  Modelling the Internet and the Web covers the most important aspects of modeling the Web using a modern mathematical and probabilistic treatment.  It focuses on the information and application layers, as well as some of the merging properties of the Internet.
  • Provides a comprehensive introduction to the modeling of the Internet and Web at the information  level.
  • Takes a modern approach based on mathematical, probabilistic and graphical modeling.
  • Provides an integrated presentation of theory, examples, exercies and applications.
  • Covers key topics such as text analysis, link analysis, crawling techniques, human behaviour, and commerce on the Web.

Interdisciplinary in nature, Modeling the Internet and the Web will be of interest to students and researchers from a variety of disciplines including computer science, machine learning, engineering, statistics, economics, business and the social sciences.

Table of Contents

Preface.

1 Mathematical Background.
1.1 Probability and Learning from a Bayesian Perspective.
1.2 Parameter Estimation from Data.
1.3 Mixture Models and the Expectation Maximization Algorithm.
1.4 Graphical Models.
1.5 Classification.
1.6 Clustering.
1.7 Power-Law Distributions.
1.8 Exercises.

2 Basic WWW Technologies.
2.1 Web Documents.
2.2 Resource Identifiers: URI, URL, and URN.
2.3 Protocols.
2.4 Log Files.
2.5 Search Engines.
2.6 Exercises.

3 Web Graphs.
3.1 Internet and Web Graphs.
3.2 Generative Models for theWeb Graph and Other Networks.
3.3 Applications.
3.4 Notes and Additional Technical References.
3.5 Exercises.

4 Text Analysis.
4.1 Indexing.
4.2 Lexical Processing.
4.3 Content-Based Ranking.
4.4 Probabilistic Retrieval.
4.5 Latent Semantic Analysis.
4.6 Text Categorization.
4.7 Exploiting Hyperlinks. 4.8 Document Clustering.
4.9 Information Extraction.
4.10 Exercises.

5 Link Analysis.
5.1 Early Approaches to Link Analysis.
5.2 Nonnegative Matrices and Dominant Eigenvectors.
5.3 Hubs and Authorities: HITS.
5.4 PageRank.
5.5 Stability.
5.6 Probabilistic Link Analysis.
5.7 Limitations of Link Analysis.

6 Advanced Crawling Techniques.
6.1 Selective Crawling.
6.2 Focused Crawling.
6.3 Distributed Crawling.
6.4 Web Dynamics.

7 Modeling and Understanding Human Behavior on the Web.
7.1 Introduction.
7.2 Web Data and Measurement Issues.
7.3 Empirical Client-Side Studies of Browsing Behavior.
7.4 Probabilistic Models of Browsing Behavior.
7.5 Modeling and Understanding Search Engine Querying.
7.6 Exercises.

8 Commerce on the Web: Models and Applications.
8.1 Introduction.
8.2 Customer Data on theWeb.
8.3 Automated Recommender Systems.
8.4 Networks and Recommendations.
8.5 Web Path Analysis for Purchase Prediction.
8.6 Exercises.

Appendix A Mathematical Complements.
A.1 Graph Theory.
A.2 Distributions.
A.3 Singular Value Decomposition.
A.4 Markov Chains.
A.5 Information Theory.

Appendix B List of Main Symbols and Abbreviations.

References.

Index.

商品描述(中文翻譯)

全球資訊網的規模正在以驚人的速度增長。這是一個龐大的不斷演變的系統,其數據充滿了不確定性。概率和統計是使我們能夠對這些數據進行建模、推理和推導有意義結果的基本數學工具。《建模互聯網與網路》涵蓋了使用現代數學和概率方法建模網路的最重要方面。它專注於資訊層和應用層,以及互聯網的一些合併特性。

- 提供對互聯網和網路在資訊層建模的全面介紹。
- 採用基於數學、概率和圖形建模的現代方法。
- 提供理論、範例、練習和應用的綜合呈現。
- 涵蓋關鍵主題,如文本分析、連結分析、爬蟲技術、人類行為和網路商務。

《建模互聯網與網路》具有跨學科的特性,將吸引來自計算機科學、機器學習、工程、統計學、經濟學、商業和社會科學等多個學科的學生和研究人員。

**目錄**

**前言。**

**1 數學背景。**
1.1 從貝葉斯觀點看概率與學習。
1.2 從數據中進行參數估計。
1.3 混合模型與期望最大化算法。
1.4 圖形模型。
1.5 分類。
1.6 聚類。
1.7 幂律分佈。
1.8 練習。

**2 基本WWW技術。**
2.1 網頁文件。
2.2 資源標識符:URI、URL和URN。
2.3 協議。
2.4 日誌文件。
2.5 搜尋引擎。
2.6 練習。

**3 網路圖。**
3.1 互聯網和網路圖。
3.2 網路圖和其他網絡的生成模型。
3.3 應用。
3.4 註釋和其他技術參考。
3.5 練習。

**4 文本分析。**
4.1 索引。
4.2 詞彙處理。
4.3 基於內容的排名。
4.4 概率檢索。
4.5 潛在語義分析。
4.6 文本分類。
4.7 利用超連結。
4.8 文檔聚類。
4.9 資訊擷取。
4.10 練習。

**5 連結分析。**
5.1 早期的連結分析方法。
5.2 非負矩陣和主特徵向量。
5.3 中樞和權威:HITS。
5.4 PageRank。
5.5 穩定性。
5.6 概率連結分析。
5.7 連結分析的局限性。

**6 進階爬蟲技術。**
6.1 選擇性爬蟲。
6.2 專注爬蟲。
6.3 分散式爬蟲。
6.4 網路動態。

**7 在網路上建模和理解人類行為。**
7.1 介紹。
7.2 網路數據和測量問題。
7.3 瀏覽行為的實證客戶端研究。
7.4 瀏覽行為的概率模型。
7.5 建模和理解搜尋引擎查詢。
7.6 練習。

**8 網路商務:模型和應用。**
8.1 介紹。
8.2 網路上的客戶數據。
8.3 自動推薦系統。
8.4 網絡和推薦。
8.5 購買預測的網路路徑分析。
8.6 練習。

**附錄A 數學補充。**
A.1 圖論。
A.2 分佈。
A.3 奇異值分解。
A.4 馬可夫鏈。
A.5 資訊理論。

**附錄B 主要符號和縮寫列表。**

**參考文獻。**

**索引。**

最後瀏覽商品 (20)