DeepSeek核心技術揭秘

盧菁,戴志仕

  • 出版商: 電子工業
  • 出版日期: 2025-05-01
  • 售價: $474
  • 語言: 簡體中文
  • ISBN: 7121501244
  • ISBN-13: 9787121501241
  • 尚未上市,歡迎預購

商品描述

本書深入剖析DeepSeek的核心技術,介紹了提示詞的原理與高級應用,對DeepSeek的模型架構、訓練框架,以及MoE優化、MLA、思維鏈、GRPO算法、獎勵模型等技術細節進行了探討。此外,本書對DeepSeek給人工智能行業格局帶來的影響及DeepSeek的開源貢獻進行了分析,對大模型的發展趨勢進行了展望。

本書適合人工智能研究人員、開發人員及大模型相關技術愛好者閱讀,也為關註人工智能領域技術發展的從業人員提供了參考與借鑒。

作者簡介

盧菁,北京科技大學博士,北京大學博士後,B站、視頻號優秀科技博主。曾任職於騰訊、愛奇藝等知名因特網公司,主要從事人工智能技術的應用和研發工作,主要研究方向為大模型、多模態、自然語言處理、知識圖譜、推薦系統等。著有《速通機器學習》《速通深度學習數學基礎》。

戴志仕,資深AI架構師,“寒武紀人工智能”公眾號的創立者。2024年CCF國際AIOps挑戰賽優秀獎獲得者。擁有十餘年人工智能算法研究和產業落地經驗,成功實施過多個人工智能項目。