庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
   
二樓書籍分類
 
全面掌握DeepSeek:LLM微調、生成式AI、企業級應用開發

全面掌握DeepSeek:LLM微調、生成式AI、企業級應用開發

沒有庫存
訂購需時10-14天
9786264250658
未來智慧實驗室 代晶
張成龍
碁峰
2025年5月15日
200.00  元
HK$ 180  






ISBN:9786264250658
  • 規格:平裝 / 448頁 / 17 x 23 x 2 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣


  • 電腦資訊 > 概論/科技趨勢 > 人工智慧/機器學習

















      本書基於 DeepSeek-V3,並涵蓋最新版 DeepSeek-R1 解析與應用。

      結合最新研究與實戰經驗,深入解析生成式 AI 技術,內容實用、操作簡單,

      讓你立即掌握 DeepSeek 真實戰力!



      DeepSeek 是一種基於 Transformer 的生成式 AI(Artificial Intelligence)大模型,融合了 MoE 架構、混合精度訓練、分散式優化等先進技術,具備強大的文本生成、多模態處理以及任務客製化能力。



      本書系統性地介紹了開源大模型 DeepSeek-V3 的核心技術及其在實際開發中的深度應用,並收錄最新版 DeepSeek-R1 推論大模型架構詳解,帶您緊跟技術發展的脈動。



      • 核心技術拆解:從混合專家模型(MoE)、FP8 混合精度訓練,到上下文管理與 API 整合,掌握大模型關鍵技術。



      • 應用實例豐富:涵蓋 NLP、程式生成、數學推理、多模態輸出等,案例詳實步驟清楚,學完即可實作。



      • 進階提示技巧:教您運用對話前綴、FIM 生成、JSON 輸出等技巧,引導模型高效生成精準內容。



      透過深入講解與實用案例,幫助讀者理解 DeepSeek 模型從原理到開發的完整流程,

      無論你是剛踏入大語言模型世界的 AI 新手,還是正著手將生成式 AI 落地專案的技術開發者,

      本書都能成為你實戰導入、快速上手的最佳攻略。現在就翻開本書,讓 DeepSeek 成為你的 AI 強力助手!


     





    【Part I 生成式 AI 的理論基礎與技術架構】

    Chapter 1 Transformer 與注意力機制的核心原理


    1.1 Transformer 的基本結構

    1.2 注意力機制的核心原理

    1.3 Transformer 的擴充與最佳化

    1.4 上下文視窗

    1.5 訓練成本與運算效能的平衡

    1.6 本章小結



    Chapter 2 DeepSeek-V3 核心架構及其訓練技術詳解

    2.1 MoE 架構及其核心概念

    2.2 FP8 混合精度訓練的優勢

    2.3 DualPipe 演算法與通訊最佳化

    2.4 大模型的分散式訓練

    2.5 快取機制與Token 管理

    2.6 DeepSeek 系列模型

    2.7 本章小結



    Chapter 3 基於 DeepSeek-V3 模型的開發導論

    3.1 大模型應用場景

    3.2 DeepSeek-V3 的優勢與應用方向

    3.3 Scaling Laws 研究與實踐

    3.4 模型部署與整合

    3.5 開發中的常見問題與解決方案

    3.6 本章小結



    【Part II 生成式AI 的專業應用與 Prompt 設計】

    Chapter 4 DeepSeek-V3 大模型初體驗


    4.1 對話生成與語意理解能力

    4.2 數學推理能力

    4.3 輔助程式設計能力

    4.4 本章小結



    Chapter 5 DeepSeek 開放平台與 API 開發詳解

    5.1 DeepSeek 開放平台簡介

    5.2 DeepSeek API 的基礎操作與 API 介面詳解

    5.3 API 效能最佳化與安全策略

    5.4 本章小結



    Chapter 6 對話生成、程式碼補全與客製化模型開發

    6.1 對話生成的基本原理與實作

    6.2 程式碼補全的實作邏輯與最佳化

    6.3 基於 DeepSeek 的客製化模型開發

    6.4 本章小結



    Chapter 7 對話前綴續寫、FIM 與 JSON 輸出開發詳解

    7.1 對話前綴續寫的技術原理與應用

    7.2 FIM 生成模式解析

    7.3 JSON 格式輸出的設計與生成邏輯

    7.4 本章小結



    Chapter 8 函式回呼與上下文硬碟快取

    8.1 函式回呼機制與應用場景

    8.2 上下文硬碟快取的基本原理

    8.3 函式回呼與快取機制的結合應用

    8.4 本章小結



    Chapter 9 DeepSeek 提示庫:探索 Prompt 的更多可能

    9.1 程式碼相關應用

    9.2 內容生成與分類

    9.3 內角色扮演

    9.4 文學創作

    9.5 文案與宣傳

    9.6 模型提示詞與翻譯專家

    9.7 本章小結



    【Part III 實戰與進階整合應用】

    Chapter 10 整合實戰 1:基於 LLM 的 Chat 類客戶端開發


    10.1 Chat 類客戶端概述及其功能特點

    10.2 DeepSeek API 的配置與整合

    10.3 多模型支援與切換

    10.4 本章小結



    Chapter 11 整合實戰 2:AI 助理開發

    11.1 AI 助理:AI 時代的啟動器

    11.2 DeepSeek API 在 AI 助理中的配置與應用

    11.3 智慧助手功能的實作與最佳化

    11.4 本章小結



    Chapter 12 整合實戰 3:以 VSCode 為基礎的輔助程式設計外掛開發

    12.1 輔助程式設計外掛概述及其核心功能

    12.2 在 VS Code 中整合 DeepSeekAP

    12.3 程式碼自動補全與智慧建議的實作

    12.4 使用輔助程式設計外掛提升開發效率

    12.5 本章小結



    Appendix A DeepSeek-R1 推論大模型架構詳解

    A.1 DeepSeek-R1 整體架構解析

    A.2 DeepSeek-R1 推論機制與高效運算

    A.3 DeepSeek-R1 API 初步開發指南

    A.4 DeepSeek-R1 在推論任務中的應用

    A.5 DeepSeek-R1 的局限性與未來最佳化方向

    A.6 本章小結









      全書分為三個部分,共12章,涵蓋理論解析、技術實現與應用實務。



      第一部分從理論入手,詳細解析Transformer與注意力機制、DeepSeek-V3的核心架構與訓練技術等內容,並探討Scaling Laws及其在模型優化中的應用。



      第二部分聚焦於DeepSeek-V3大模型的初步體驗、開放平台與API開發、對話生成、客製化模型開發、對話前綴續寫、FIM與JSON輸出、函式回呼與快取優化,以及DeepSeek提示庫等主題,幫助讀者快速掌握關鍵技術的基礎理論與落地實務。



      第三部分則透過實際案例剖析DeepSeek在Chat客戶端、智慧型AI助理、VS Code(Visual Studio Code)程式設計外掛等多領域中的整合開發,展示開源大模型技術在工業與商業場景中的全面應用。



      本書以 DeepSeek-V3 為藍本編寫,隨著DeepSeek-R1 的推出,讀者只需將書中程式碼中的model=deepseek-v3 改為 model=deepseek-reasoner,即可輕鬆切換至 DeepSeek-R1 版本,進而享受其更強的推理能力與效能最佳化。




    其 他 著 作