庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
   
成為賈伯斯:天才巨星的挫敗與孕成
  • 定價217.00元
  • 8 折優惠:HK$173.6
  • 放入購物車
二樓書籍分類
 
塞爆 128G GPU 記憶體,Nvidia DGX Spark,影音圖生成、微調、預訓練 Agent 全面玩透

塞爆

沒有庫存
訂購需時10-14天
9786267889206
胡嘉璽
深智數位
2026年5月19日
360.00  元
HK$ 306  






ISBN:9786267889206
  • 規格:平裝 / 784頁 / 23 x 17 x 3.92 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣


  • 電腦資訊 > 概論/科技趨勢 > 人工智慧/機器學習















    ?128 GB 統一記憶體,桌上跑 120B 大型語言模型,不需要雲端

    ?七大推論引擎完整實測:Ollama、vLLM、TRT-LLM、SGLang、NIM、llama.cpp、LM Studio

    ?實作 Andrej Karpathy 的 Autoresearch 架構

    ?ComfyUI 圖片影片生成、語音合成、AI 音樂,多媒體 AI 全部本機完成

    ?五種微調框架實戰比較:LoRA、QLoRA、Unsloth、LLaMA Factory、NeMo

    ?從零預訓練 BERT、GPT、Embedding 模型,走過語言模型訓練全流程

    ?RAG、知識圖譜、多代理聊天、AI Agent 沙箱,企業級應用完整部署

    ?RAPIDS 加速資料科學、JAX、金融最佳化、基因體分析,跨領域一台搞定

    ?全書用 Claude Code 操作,自然語言驅動 AI 超級電腦

    ?跑本地端OpenClaw,NV專屬NemoClaw

    ?完整覆蓋 NVIDIA 官方全部 Playbook,每章附實測與程式碼

    ?

    【書籍簡介】

    NVIDIA DGX Spark 是第一台放在桌上的 AI 超級電腦。Grace Blackwell 超級晶片搭配 128 GB 統一記憶體,讓過去只能在資料中心執行的 AI 工作負載,現在一個人就能在書桌上完成。本書從開箱、系統建置開始,帶你一步步把這台機器的所有能力都發揮出來。全書 25 章、7 大篇、5 個附錄,完整覆蓋 NVIDIA 官方提供的所有 Playbook,每一章都有實際在 DGX Spark 上執行的程式碼和操作記錄。從第 5 章開始,所有操作都透過 Claude Code 用自然語言完成,展示 AI 時代的全新開發方式。

    ?

    前三篇涵蓋七大推論引擎的完整實測。從最簡單的 Ollama 一行指令跑模型,到 vLLM 的高吞吐量服務、TensorRT-LLM 的 NVIDIA 原生加速、SGLang 的推測性解碼,再到 NIM 企業級微服務,每個引擎都在 128 GB 記憶體上做了極限測試。第四篇進入多媒體生成,用 ComfyUI 跑 FLUX 和 Wan 2.2 生成圖片與影片,用 Qwen3-TTS 做語音合成,用 ACE-Step 生成音樂。第五篇是微調與預訓練,從 LoRA、QLoRA、Unsloth、LLaMA Factory 到 NeMo,五種框架完整比較,還包含從零預訓練 BERT 和 GPT 模型的完整流程。

    ?

    後兩篇聚焦在進階應用和系統擴展。多模態推論結合視覺語言模型做即時影像理解,RAG 和知識圖譜讓模型能讀你的文件,AI Agent 搭配安全沙箱在本機自主執行任務。RAPIDS 和 JAX 把 GPU 加速帶到資料科學和數值計算領域,金融最佳化和單細胞基因體分析展示跨領域的應用潛力。最後,透過 200GbE 高速網路把多台 DGX Spark 串聯成叢集,用 256 GB 以上的記憶體跑 235B 參數的超大模型做分散式推論。無論你是 AI 研究者、軟體工程師還是資料科學家,這本書都能幫你把 DGX Spark 的每一分效能轉化為實際的生產力。









    ?




     












    序言

      2024 年底,我在 NVIDIA 的發表會上第一次看到 DGX Spark 的實機。一台比鞋盒大不多少的機器,裡面塞著 Grace Blackwell 超級晶片和 128 GB 統一

    記憶體。當時我心裡想的是:如果這東西放在我書桌上,我還需要雲端 GPU 嗎?

    答案是,大部分情況下不需要了。

    過去三年,AI 的發展速度讓所有人都措手不及。GPT-4 證明了大型語言模型的能力,Stable Diffusion 讓每個人都能生成圖片,Sora 和 Wan 把影片生成從科幻變成現實。但這些技術有一個共同的門檻:你需要一張夠大的 GPU。消費級顯示卡的 24 GB 記憶體,連一個 70B 的模型都塞不下。想跑 120B ?請上雲端,按小時計費。

    DGX Spark 改變了這個局面。128 GB 的統一記憶體,不是 CPU 和 GPU 各自獨立的 128 GB,而是兩者共享的同一塊記憶體。這代表一個 120B 參數的語言模型可以完整載入,不需要做模型分片、不需要量化到面目全非、不需要把一半權重放在 CPU 上慢慢搬。Blackwell 架構的 NVFP4 量化更是把可用的模型範圍再往上推了一個等級。

    這 128 GB 帶來的不只是「能跑更大的模型」這麼簡單。它讓一整類過去只存在於資料中心的工作流程,變成你在書桌上就能完成的事:用 Ollama 跑 Qwen3.5 122B 和人對話, 回答品質不輸雲端 API。用ComfyUI 跑 FLUX 12B 生成圖片,再用 Wan 2.2 14B 生成影片,全部在本機完成。用 Unsloth 微調一個 8B 模型,從準備資料到推論測試不到一小時。

    用 vLLM 部署推論服務,PagedAttention 讓多人同時使用也不會爆記憶體。用RAPIDS cuDF 處理 8 GB 的資料集,速度比 pandas 快幾十倍。甚至可以從零開始預訓練一個小型語言模型,看著 loss 曲線一路往下掉。

    兩台 DGX Spark 用一條 QSFP 傳輸線直連,就有 256 GB 和 200Gbps 的節點間頻寬。這足以跑 235B 參數的模型做分散式推論,而整個「叢集」就放在你書桌上,功耗不到 500W。

    這本書記錄了我在 DGX Spark 上實際操作的每一個步驟。從第 5 章開始,所有操作都透過 Claude Code 完成,不手動編輯設定檔、不手動下載模型、不手動寫 Docker Compose。你告訴 Claude Code 你要做什麼,它幫你搞定。這不是偷懶,而是 2026 年寫程式和部署 AI 服務的正確方式。

    NVIDIA 為 DGX Spark 提供了完整的官方 Playbook,涵蓋從系統設定到多機互連的所有操作。本書的 25 章完整覆蓋了每一個 Playbook,並且加入了大量實測截圖和效能數據。如果你拿到一台 DGX Spark,翻開這本書,從頭到尾跟著做,就能把這台機器的每一分能力都發揮出來。

    最後要感謝的是 AI 本身。這本書的寫作過程大量使用了 Claude Code,從章節規劃、內容撰寫、程式碼測試到截圖生成,都有 AI 的參與。這不是為了炫技,而是親身示範本書的核心主張:AI 不是取代人,而是讓人能做到原本做不到的事。一個人加上一台 DGX Spark 加上 Claude Code,就能完成過去需要一整個團隊才能處理的工作量。

    這就是 128 GB 放在桌上的意義。



    ?


    Josh Hu

    2026 年 4 月,台北














    ?






    其 他 著 作
    1. 工作學習生活一手包辦 - Claude Cowork 31 個超好用範例實作
    2. 勝過 AI 的技能 - 玩熟 Mermaid 做出最專業的圖表
    3. Coding Agent 大神 - Google Antigravity 最強實戰指南
    4. Sutskever 大神推薦 - 建構AI世界最重要的30篇論文:用PyTorch完整實作
    5. 玩爆你的龍蝦 — 最強 OpenClaw 安裝設定應用實機演練
    6. Vibe Coding CLI 頂級開發:Claude Code 前瞻菁英育成手冊
    7. Vibe Coding:Cursor教戰手冊
    8. 專業聚焦 Computer Knowledge Today (第二版)
    9. 瘦身級之 OpenStack:oVirt / KVM 虛擬技術輕鬆學
    10. 區塊鍊與大數據:打造智慧經濟