Gemini 3×NotebookLM領軍: Nano Banana Pro×Veo×Whisk×Flow×Gem-Google多模態AI工作流 | 誠品線上

Gemini 3×NotebookLM領軍: Nano Banana Pro×Veo×Whisk×Flow×Gem-Google多模態AI工作流

作者 洪錦魁
出版社 聯合發行股份有限公司
商品描述 Gemini 3×NotebookLM領軍: Nano Banana Pro×Veo×Whisk×Flow×Gem-Google多模態AI工作流:https://youtu.be/aCXqTqqQzVYGemini3xNotebookLM領軍NanoBananaProxVeoxWhiskxFlow

內容簡介

內容簡介 https: youtu.be aCXqTqqQzVYGemini 3 x NotebookLM 領軍Nano Banana Pro x Veo x Whisk x Flow x GemGoogle 多模態 AI 工作流本書內容☆★☆從 Gemini 3 到 NotebookLM,打造個人 AI 知識引擎與創作☆★☆☆★☆內容最新(2026年1月)、最豐富(416頁) ☆★☆☆★☆全面整合 Google Workspace 與 Gemini 生態系 AI 工具☆★☆☆★☆圖像、語音、影片、研究與文件的多模態一次到位☆★☆☆★☆讓 AI 成為真正的工作夥伴,而非只會聊天的助手☆★☆☆★☆一次掌握「行動 + 桌面 + 雲端」的 Gemini 3 全平台☆★☆導讀語 當多數人仍停留在「和 AI 聊天」,Gemini 3 已經進化成能驅動搜尋、文件、影像、影片與知識引擎的智慧核心。本書以實務導向為核心,從 Gemini 3 的基礎操作出發,逐步深入 Google Workspace、Chrome AI 搜尋、Canvas、Deep Research、Gem、Storybook,一直到 Nano Banana Pro、Veo、Whisk 與 Flow 所構成的多媒體創作環境。 壓軸的 NotebookLM,更完整展現 AI 如何從「資料來源」轉化為「可對話、可摘要、可視覺化、可教學」的知識引擎,真正改變學習與研究方式。 無論你是想提升效率的辦公室人士、創意工作者、行銷專家、教育工作者,或希望用 AI 展開第二職涯的自媒體創作者,這本書都會讓你擁有一位「全能的 AI 夥伴」。本書值得閱讀的十二大亮點1. Gemini 3 全新世代完整解析 全面整合 Gemini、Canvas、Nano Banana Pro、Veo、Whisk、Flow、Gem、Storybook、NotebookLM、Gemini Live 等十大 AI 平台,建立多模態工作流的第一本中文專書。2. 從聊天到研究的多層次學習路徑 第1 ~ 3章由淺入深介紹 Gemini 操作、聊天技巧與輸出格式控制,讓新手快速具備 AI 對話邏輯與結構思考力。3. 跨應用場景的實務操作 旅遊、媒體、Workspace 三大應用章節(第4 ~ 5章),示範如何整合 Google 地圖、航班、YouTube、YouTube Music、Gmail、Docs、Calendar 等工具,打造 AI 辦公室自動化流程。 Gemini整合SynthID內容識別技術,保護創作者、大眾與平台。4. Chrome x Gemini 的 AI 搜尋革命 – 獨家內容 第6章介紹「AI 搜尋」,關鍵轉變是:「使用者不再必須搜尋資訊,而是讓資訊主動整理好給使用者」。 不只找資料,直接生成比較表、簡報與決策建議。展現「查詢 → 分析 → 產出 → 視覺化」的完整能力。5. 多模態資料上傳與分析實戰 第7章介紹文字、音訊、圖像三大資料型態上傳與智慧解析,展現 Gemini 3在辦公與研究領域的強大應用潛力。例如: ◎ 文字文件:摘要重點、生成簡報。 ◎ 音訊檔案:會議記錄、專訪內容轉文字稿。教學錄音生成講義與摘要。 ◎ 圖像檔案:物品辨識、場景分析與意境解讀。6. Canvas:讓文件活起來,把 AI 思考變成可編輯成果 第8章的Gemini Canvas ,跳脫聊天環境的結構化創作方式,協助「把想法梳理清楚」、「把內容組織起來」、「把成果保存與再利用」。同時也協助使用者將靈感轉化為「網頁」、「資訊圖表」、「測驗」、「學習卡」與「語音摘要」。 ◎ Canvas也具備輕量化程式設計功能,是初學Vibe Coding最佳平台。 ◎ 獨家內容Canvas整合NotebookLM筆記。7. Deep Research:AI 查證與引用透明化 第9章的Deep Research章節,教你如何利用多來源比對與長時推理,生成可驗證、可追溯的研究結果,適合學生、學者與記者。 有了他,使用者將從「零碎資訊的消費者」轉變為「結構化知識的獲取者」。8. 引導式學習:AI 線上導師正式上線 第10章的引導式學習,Gemini 在此學習場景中,扮演的不僅是「知識提供者」,更是「智慧學習夥伴」。透過引導式學習、語音互動與測驗生成,Gemini 能協助使用者以更有效率、更符合個人需求的方式學習,無論是語言、專業技能,還是跨領域知識,都能快速上手。9. Gem 與 Storybook:建立專屬 AI 助理與導師 第11章的探索Gem,驗證了 AI 的能力不再只是「即時對話」,而是能被模組化、保存、重複使用。本章用「英文學習卡Gem」與「電商客服Gem」,完整說明建立專屬「AI 助理」。 第12章介紹強大的Storybook,此功能把知識、流程、理念轉化為生動的故事。不論是「客服助理」、「語言學習」、還是「行銷與品牌故事」,Storybook 都能讓 AI 助理的角色更具象化、故事化,幫助使用者更快吸收並建立情感連結。10. Nano Banana Pro:AI 驅動智慧圖像成為核心能力 第13 ~ 14章AI驅動的智慧圖像生成、搭配Google網站與AI搜尋整合協作,圖像生成包含封面、插圖、資訊圖、漫畫、地圖全面實作。 ◎ AI 圖像創作部分:健康圖表、教學情境圖、心智圖、旅遊動線地圖、路線圖、資訊圖表(概念、流程、比較、架構、KPI)、漫畫、四格與多格故事。 ◎ 即時資訊視覺化:天氣預報圖、股市走勢圖、交通與人潮預估圖。 ◎ 圖像編輯:圖像一致化、超寫實3D、科幻公仔、場景變換與多圖融合。 ◎ 獨家內容 – Nano Banana Pro驅動 AI 塗鴉。11. Veo x Whisk x Flow:AI 影片創作新紀元 ◎ Veo:文字或圖像建立音效影片,創建「能量覺醒 – 電光英雄」影片。 ◎ Whisk:Google實驗工具,圖片創作為核心元素,創作以台北101大樓為背景,「騎乘老鷹」的語音影片「Happy New Year 2026」。 ◎ Flow:Google實驗工具,從腳本設計、單一片段到完整敘事短片的生成流程。創作長達20秒、電影等級含音效與文字的故事短片「奈米香蕉人誕生記」。12. NotebookLM:AI 知識庫與學習革命 這是本書壓軸,從「資料來源 → 對話 → 工作室」完整展示 NotebookLM 的知識引擎與多模態輸出。 ◎語音摘要:NotebookLM 將知識「說給你聽」的功能。 ◎影片摘要:NotebookLM 不再只是文字與語音的工具,透過影片形式,知識更容易被理解、分享與傳播,特別適合課程教學與團隊協作。 ◎報告:NotebookLM 不只是學習輔助,更能成為「知識成果輸出機器」。它能將同一份來源轉化為不同風格的報告,滿足學術、教學與商務場景的多重需求。 ◎心智圖:NotebookLM組織「一眼可看全局」的知識。它將分散在來源文件裡的概念,轉化為清晰的結構圖,幫助使用者更快理解、比較與應用。 ◎智慧學習卡:NotebookLM 超越了單純的「知識整合工具」,它把整理後的知識轉化為問答練習,幫助使用者主動回憶與檢測,達到更深層的學習效果。 ◎互動測驗:NotebookLM 不再只是「筆記整理器」,而是透過多題型測驗來檢視學習成果的「智慧教練」。測驗可檢驗理解深度,幫助知識內化並長期記憶。 ◎資訊圖表:將 Notebook 中較為複雜、抽象或篇幅較長的內容,轉換為一眼就能理解的視覺化重點整理。 ◎簡報:將 Notebook 中的知識內容,自動整理為條理清楚、可直接展示的簡報架構。 ◎資料表(獨家新功能):NotebookLM 不再只是閱讀與摘要工具,透過 AI 的語意理解能力,原本分散在文件、筆記與研究資料中的內容,得以快速轉換為清楚的表格形式,協助使用者建立可比較、可延伸應用的資料基礎。

作者介紹

作者介紹 洪錦魁 畢業於明志工專(現今明志科技大學),跳級留學美國University of Mississippi計算機系研究所。 2023~2025年連續3年獲選博客來10大暢銷華文作家,多年來唯一電腦書籍作者獲選,也是一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家,下列是他在各時期的代表作品。 ► DOS時代:「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。 ► Windows時代:「Windows Programming 使用C、Visual Basic」。 ► Internet時代:「網頁設計使用HTML」。 ► 大數據時代:「R 語言邁向Big Data之路、Python王者歸來」。 ► AI時代:「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。 ► 通用AI時代:「ChatGPT、Gemini、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術」。 ► Vibe Coding 時代:「寫程式的 AI 戰友 – VS Code x GitHub Copilot」。 ► 國內第 1 本「多模態 AI - ChatGPT 5」、「Nano Banana 藝術宇宙」作者。 ► 國內第 1 本「AI 健康養生長壽書」作者。 作品曾被翻譯為簡體中文、馬來西亞文,英文,近年來作品則是在北京清華大學和台灣深智同步發行。 他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,不同時期暢銷排行榜第1 名,他的著作特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做說明,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。

產品目錄

產品目錄 ▌第1 章 認識與快速上手Gemini 1-1 Gemini 是什麼 1-1-1 Gemini 3 的主要功能與特色 1-1-2 Gemini 如何改變工作模式 1-1-3 總結 - 為什麼 Gemini 3 已成為必備的職場技能 1-2 認識不同版本的 Gemini 1-2-1 基礎觀念 1-2-2 Gemini 3 vs. Gemini 2.5 升級功能總覽 1-3 登入與認識Gemini 操作環境 1-3-1 認識聊天環境 1-3-2 展開或收合選單 1-3-3 「新的對話」與「臨時對話」 1-3-4 主題 - 介面色彩 1-3-5 快捷版本 1-3-6 升級 1-4 與Gemini 聊天 – 展現Google AI 的特色 1-4-1 一般聊天測試 1-4-2 回覆下方的功能圖示 1-4-3 結合「Google 地圖」的聊天測試 1-4-4 結合Google 搜尋 1-4-5 分行輸入 - Shift + Enter 鍵 1-5 生成與操作聊天主題 1-5-1 生成聊天標題 1-5-2 釘選 1-6 分享對話 - 分享聊天內容 1-6-1 分享聊天的應用情境 1-6-2 分享內容 1-6-3 刪除分享連結 1-7 匯出到文件 – Google 文件 與 Gmail 1-7-1 匯出到文件 1-7-2 在Gmail 建立草稿 1-8 閱讀網址內容生成摘要報告 1-8-1 閱讀Youtube 網站產生中文摘要 1-8-2 閱讀中文網站生成摘要 1-8-3 生成表格式的報告 1-9 查核Gemini 回應資料的正確性 1-10 活動紀錄 1-11 搜尋功能 1-12 個人化建議 1-12-1 功能1 - 你與Gemini 的對話記錄 1-12-2 功能2 - 給Gemini 指令 1-12-3 功能整合理解 1-12-4 新增功能 1-12-5 測試「個人化建議」 - Gemini 推薦筆者適合寫作的地方 ▌第2 章 語音輸入與朗讀輸出 - 外語隨身教練 2-1 語音輸入與朗讀輸出 2-1-1 語音輸入的應用場景 2-1-2 Gemini 會徵求我們的同意 2-1-3 語音輸入與朗讀輸出 2-1-4 語音輸入的其他應用 2-2 學習外語的隨身教練 2-2-1 「說 → 看 → 聽」的學習教練 2-2-2 實際範例 ▌第3 章 聊天技巧與輸出格式的規則 3-1 聊天技巧 3-1-1 明確化需求 3-1-2 分步驟提問 3-1-3 善用上下文與範例 3-1-4 指定角色與視角 3-1-5 持續修正與迭代 3-2 如何讓Gemini 用您指定的格式回應 3-2-1 為什麼格式控制很重要? 3-2-2 常見的格式控制方式 3-2-3 語法指令補充技巧 3-2-4 總結 3-3 條列式、Q&A、表格輸出控制 3-3-1 條列式輸出(List Format) 3-3-2 問與答格式(Q&A) 3-3-3 表格輸出(Table Format) 3-3-4 總結 3-4 限制字數與加入實例 3-4-1 限制字數(Length Limitation) 3-4-2 加入實例(Include Examples) ▌第4 章 Gemini x Google 服務 - 把 AI 變成你的日常生活助理 4-1 Google 地圖 - 智慧導覽與資訊查詢 4-1-1 地點查詢 4-1-2 路線規劃 4-1-3 附近探索 4-2 Google 航班 機票 - 智慧查詢與比價 4-2-1 航班查詢 4-2-2 票價比對 4-2-3 轉機資訊 4-2-4 彈性搜尋 4-3 Google 飯店 - 智慧查詢與比價 4-3-1 旅遊住宿規劃 4-3-2 價格比較 4-3-3 評價篩選 4-3-4 地點便利性 4-4 結合地圖、航班或飯店的旅遊規劃 4-4-1 Gemini 的旅遊規劃方式 4-4-2 5 天4 夜自由行 4-5 YouTube 應用 4-5-1 影片搜尋 4-5-2 影片摘要 ▌第5 章 Gemini 應用程式 - Google Workspace 5-1 認識「應用程式」 5-1-1 展開「應用程式」項目 5-1-2 啟動應用程式 5-2 Gmail 應用 - 智慧郵件操作 5-2-1 智慧郵件摘要 - 快速擷取重點內容 5-2-2 自動回覆建議 - 撰寫更有效率 5-2-3 郵件分類與搜尋 - Gemini 輔助高精準過濾 5-3 Google 日曆 - 時間管理 5-3-1 認識Chrome 視窗的Google 日曆 5-3-2 從無到有 - Gemini 協助生成行程 5-4 Google Keep - 雲端筆記 5-4-1 認識Chrome 視窗的Google Keep 5-4-2 從無到有 - Gemini 協助生成筆記 5-5 Google Tasks - 建立待辦清單系統 5-5-1 認識Chrome 視窗的Google Tasks 5-5-2 建立待辦事項 5-5-3 待辦清單轉成Calendar 5-6 Google 文件 – 生成與摘要 5-6-1 認識Chrome 視窗的Google 文件 5-6-2 Gemini 輔助快速建立草稿 5-6-3 Gemini 視窗編輯Google 文件 5-7 Google 雲端硬碟 5-7-1 認識Chrome 視窗的Google 雲端硬碟 5-7-2 摘要檔案內容 5-8 YouTube Music 應用 5-8-1 歌曲搜尋 5-8-2 播放清單推薦 5-8-3 探索新音樂 5-9 Gemini 應用程式中的 SynthID 功能說明 5-9-1 Gemini 中 SynthID 的三大功能 5-9-2 為何 Gemini 要整合 SynthID ▌第6 章 Chrome 的AI 搜尋 6-1 AI Overview 入門 - 讓搜尋直接告訴你答案 6-1-1 什麼是 AI Overview 6-1-2 AI Overview 什麼時候會出現 6-1-3 AI Overview 與傳統搜尋的差異 6-1-4 AI Overview 最適合的使用情境 6-1-5 AI Overview 回答的來源從哪裡來 6-2 Gemini 如何驅動 Chrome 的 AI 搜尋系統 6-2-1 AI 搜尋的核心 - Gemini 模型 6-2-2 Gemini 在 AI 搜尋中的運作流程 6-2-3 AI 搜尋能做推論的原因 - 多模態能力 6-2-4 Chrome x Gemini - 搜尋與對話模式的融合 6-3 進入Chrome 的AI 搜尋 6-4 實作AI 搜尋 6-4-1 搜尋公司 6-4-2 產品比較 – 製作比較表 6-4-3 推薦產品建議 – 製作簡報 ▌第7 章 文字、音訊與圖像檔案上傳 - 智慧分析 7-1 檔案上傳與分析的核心價值 7-1-1 與傳統辦公軟體的差異 7-1-2 實務操作 7-2 文件型檔案分析(Word、PDF) 7-2-1 文字摘要 7-2-2 將檔案轉簡報 7-2-3 其他摘要Prompt 實例 7-3 音訊檔案轉文字稿 7-4 AI 視覺 - 上傳圖像,理解圖像內容 7-4-1 物品識別 7-4-2 場景分析 7-4-3 文字識別與抽取 7-4-4 圖像意境解讀 7-4-5 跨模態互動 ▌第8 章 Gemini 的Canvas 功能 8-1 Canvas 功能概覽 8-1-1 定位 - AI 輔助的知識與專案工作板 8-1-2 與純文字對話的差異(線性 vs 結構化) 8-1-3 Canvas 在工作與學習中的角色 8-2 建立Canvas 文案 8-2-1 啟動Canvas 8-2-2 文字或段落編輯 8-2-3 變更文案長度 8-2-4 變更語氣 8-2-5 提出修改建議 8-2-6 問問Gemini 8-3 讓文件活起來 - Canvas「 建立」應用 8-3-1 建立網頁(Web Page) 8-3-2 建立資訊圖表(Infographics) 8-3-3 測驗(Quiz) 8-3-4 建立學習卡 8-3-5 語音摘要(Audio Summary) 8-4 用Canvas 檢視或摘要檔案 8-5 輸入指令或上傳檔案 – Canvas 生成簡報 8-5-1 上傳檔案生成簡報 8-5-2 用Prompt 生成簡報 8-5-3 評論Canvas 的簡報 8-6 Canvas 設計帕斯卡三角形遊戲 8-6-1 帕斯卡三角形遊戲設計 8-6-2 可能的遊戲成果 1 8-6-3 遊戲成果 2 ▌第9 章 Deep Research 深度研究 9-1 Deep Research 功能概覽 9-1-1 定義與核心定位 - 與傳統搜尋或摘要的差異 9-1-2 四大特色 - 多來源比對、分層分析、長時推理、引用透明 9-2 操作流程 9-2-1 啟動Deep Research 9-2-2 自然語言提問 9-2-3 「目錄」、「分享及匯出」 9-2-4 建立 9-2-5 探討Deep Research 輸出形式 9-3 實際應用情境 ▌第10 章 AI 導師上線 - 體驗Gemini 的引導式學習 10-1 引導式學習 10-1-1 功能定位與應用情境 10-1-2 啟用引導式學習 10-1-3 Prompt 範例 10-2 語音互動學習 10-2-1 語音學習與情境說明 10-2-2 語音互動學習實例 ▌第11 章 探索Gem – 建立專屬AI 助理 11-1 什麼是 Gem 11-1-1 定義與核心理念 11-1-2 與一般 Prompt 的差異 11-1-3 Gem 的生態定位 11-2 認識與建立Gem 環境 11-3 英文學習卡 Gem 11-3-1 建立畫面 11-3-2 測試「英文學習卡」 11-3-3 儲存與觀察 11-3-4 Gem 列表與分享 11-4 電商客服 Gem 11-4-1 填寫名稱和使用說明 11-4-2 上傳Gem 的知識背景 - 相關資訊 11-4-3 Prompts 的測試 11-5 我可以稱Gem 是打造「專屬AI Agent 嗎」 ▌第12 章 AI 助理Storybook 12-1 什麼是 Storybook 12-1-1 定義與基本功能 12-1-2 與一般 Gemini 對話的差異 12-1-3 為什麼適合用於創意與學習 12-2 建立 Storybook 的流程 12-2-1 啟用 Storybook 功能 12-2-2 撰寫提示(輸入主題或情境) 12-3 Storybook 的應用場景 12-3-1 客服助理培訓 12-3-2 語言學習助理 12-3-3 行銷與品牌故事 12-3-4 小結 ▌第13 章 AI 圖像創作 - Nano Banana Pro 13-1 文字生成圖像的時代來臨 13-1-1 Nano Banana Pro 名稱緣由 13-1-2 圖像生成從附屬功能變成核心能力 13-1-3 Nano Banana Pro 在 Gemini 3 生態中的定位 13-1-4 為何「文字 → 圖像」是創作者最大的突破 13-2 文字 → 圖像 - Nano Banana Pro 的關鍵功能 13-2-1 啟動Nano Banana Pro 繪圖模式 13-2-2 單純文字 prompt 生成圖像(Text-to-Image) 13-2-3 控制光線、相機角度、構圖、比例 13-2-4 控制背景、氛圍、材質、動作 13-2-5 中文、英文多語 prompt 的差異與應用 13-3 實際應用 - 用文字生成真正能用的專業圖像 13-3-1 書籍封面(含排版、主視覺、情境背景) 13-3-2 書內插圖、示意圖、健康圖表、教學情境圖 13-3-3 角色插畫、公仔風格 13-3-4 行銷海報、Banner、活動宣傳 13-3-5 用文字生成專業級企業資訊圖 13-4 企業導入AI 專題 - 用資訊圖快速建立共同語言 13-4-1 AI 導入藍圖(四階段資訊圖) 13-4-2 AI 能力成熟度模型(AI Maturity Model) 13-4-3 AI 導入角色與責任圖 13-4-4 AI 導入所需的三大能力(人才教育版) 13-5 學校導入 AI 教育的資訊圖 13-5-1 概念圖 - AI 教育的核心能力(Key Competencies) 13-5-2 流程圖 - 學校 AI 課程導入流程 13-5-3 比較圖 - 傳統課程 vs AI 教育課程 13-5-4 架構模型圖 - AI 跨科課程整合模型(AI Curriculum Framework) 13-5-5 數據可視化圖 - 學生 AI 學習成果與參與度 13-6 繪製心智圖(AI-Generated Mind Maps) 13-6-1 企業心智圖 - AI 導入策略藍圖 13-6-2 學校心智圖 - AI 素養課程地圖(AI Literacy Map) 13-7 製作 AI 旅遊地圖與情境地圖 13-7-1 旅遊地圖 13-7-2 故事 小說 遊戲地圖 13-7-3 旅遊動線 x Google 地點資訊(AI + Maps) 13-8 從資料到圖像 - 即時資訊可視化應用 13-8-1 天氣預報圖 13-8-2 股市走勢圖 13-8-3 交通狀況與人潮預測圖 13-9 漫畫與多格漫畫創作中的應用 13-9-1 單幅漫畫 13-9-2 四格漫畫 13-9-3 多格故事漫畫 13-9-4 虛構故事漫畫 13-9-5 小結 13-10 Gemini x Nano Banana Pro 驅動Google 文件 13-10-1 進入Google 文件 13-10-2 Gemini 輸入需求,建立Google 文件 13-10-3 文件插入圖像 13-11 Gemini x Nano Banana Pro 驅動Google簡報 13-11-1 進入Google 簡報 13-11-2 建立圖文並茂的投影片 13-11-3 建立資訊圖表 13-12 Gemini x Nano Banana Pro 圖像塗鴉 ▌第14 章 AI 圖像編輯 - Nano Banana Pro 14-1 AI 圖像編輯的核心功能 14-1-1 圖生圖 14-1-2 多圖融合 - 人物移動 14-1-3 多圖融合 - 合成新圖像 14-1-4 世界知識加成 - 自動融入合理的背景元素 14-2 官網展示實例 14-2-1 Nano Banana 官方網站展示實例 14-2-2 官方來源的示範 Prompt 連結 14-2-3 Nano Banana Pro 的書籍推薦 ▌第15 章 AI 影片生成新紀元 – Veo x Whisk x Flow 15-1 Veo 的定位與特點 15-2 Veo 的操作流程 15-3 文字生成影片 15-4 圖片生成影片 15-5 文字 + 圖片 - 飛翔的英雄 15-6 建立含語音的影片 - 電光英雄 15-7 以圖片為提示的實驗性視覺生成工具Whisk 15-7-1 進入Whisk 15-7-2 Whisk 的 Experiment 定位與Google Labs 設計思維 15-7-3 Whisk 的核心操作 - 用圖片取代文字提示 15-7-4 Whisk 實例 - Happy New Year 2026 15-8 實驗性創作工具Flow - 從生成片段走向完整影片製作 15-8-1 為什麼 Google 要做 Flow,而不只是 Veo 15-8-2 Flow 的核心定位 - AI 影片創作環境 15-8-3 Flow 的雙核心能力 - 影像生成 x 影片生成 15-8-4 進入Flow 15-8-5 奈米香蕉人誕生記 - 用 Flow 組合一支敘事短片 ▌第16 章 Gemini App - 手機上的隨身 AI助手 16-1 安裝與登入 16-2 操作介面導覽 16-2-1 聊天視窗與輸入方式 16-2-2 功能表欄與選單介紹 16-2-3 與電腦版的差異 16-2-4 小結 16-3 Gemini App 行動體驗特色 16-3-1 語音輸入與即時翻譯 - 快速口語互動,適合旅行或會議 16-3-2 相機拍照辨識 - 上傳照片、即時理解圖像內容 16-3-3 多模態查詢 - 文字 + 圖像結合提問 16-3-4 小結 16-4 Gemini Live 16-4-1 功能特色 16-4-2 操作方式 16-4-3 視訊 16-4-4 直播 16-4-5 暫停 ▌第17 章 NotebookLM AI 驅動的智慧筆記與學習夥伴 17-1 NotebookLM 的定位與演變 17-1-1 背景與發展簡史 17-1-2 與傳統筆記 知識管理工具相比之處 17-1-3 NotebookLM 在 Gemini 生態中的角色定位 17-2 NotebookLM 視窗與筆記操作環境 17-2-1 NotebookLM 主視窗 17-2-2 筆記本的存取權限 – Reader Owner 17-2-3 設定 17-2-4 NotebookLM 筆記操作環境 17-2-5 查看檔案細節 17-2-6 返回NotebookLM 主視窗 17-3 建立NotebookLM 的知識引擎 17-3-1 來源檔案的格式與限制 17-3-2 專題實作 - 建立「AI 的歷史與未來」的知識引擎 17-3-3 建立新的筆記 17-3-4 Deep Research 17-3-5 新增記事 17-4 智慧「對話」 - 與 NotebookLM 的互動中樞 17-4-1 「對話」功能說明 17-4-2 實作練習 - Prompt 範例操作 17-4-3 儲存到記事 17-5 工作室 - 多模態輸出的創作空間 17-5-1 語音摘要(Audio Overviews) 17-5-2 影片摘要(Video Overviews) 17-5-3 報告生成(Reports) 17-5-4 心智圖概覽(Mind Maps) 17-5-5 智慧學習卡(Flashcards) 17-5-6 互動測驗(Quizzes) 17-5-7 資訊圖表(Infographics) 17-5-8 簡報(Presentations) 17-6 我的筆記本 17-7 Gemini 整合NotebookLM 筆記 17-7-1 在 Gemini 的Canvas 上傳NotebookLM 筆記的優點 17-7-2 在 Gemini 聊天環境上傳NotebookLM 筆記的優點 17-8 筆者操作NotebookLM 的感想

商品規格

書名 / Gemini 3×NotebookLM領軍: Nano Banana Pro×Veo×Whisk×Flow×Gem-Google多模態AI工作流
作者 / 洪錦魁
簡介 / Gemini 3×NotebookLM領軍: Nano Banana Pro×Veo×Whisk×Flow×Gem-Google多模態AI工作流:https: youtu.be aCXqTqqQzVYGemini3xNotebookLM領軍NanoBananaProxVeoxWhiskxFlow
出版社 / 聯合發行股份有限公司
ISBN13 / 9786267757727
ISBN10 /
EAN / 9786267757727
誠品26碼 / 2683069323006
頁數 / 416
裝訂 / P:平裝
語言 / 1:中文 繁體
尺寸 / 17X23X2.4CM
級別 / N:無

試閱文字

自序 : §序
人工智慧的發展,正從「會回答問題的對話系統」,正式邁入「能參與工作流程、引導創作與組織知識的智慧協作夥伴」階段。Gemini 3 的出現,不僅是模型能力的升級,更象徵 Google 多模態 AI 生態系完成一次關鍵性的整合與轉向,「AI 不再只是工具,而是成為貫穿學習、工作與創作流程的核心引擎」。
在 Gemini 3 架構下,文字、語音、圖像、影片與資料不再各自為政,而是能在同一個對話與專案脈絡中彼此轉換與補強。透過 Nano Banana Pro 的專業級圖像生成與編輯、Veo 的高品質影片生成、Whisk 與 Flow 的實驗性視覺與敘事創作,以及NotebookLM 所建構的智慧知識引擎與工作室輸出環境,Google 已逐步形塑出一套真正可落地的「多模態 AI 工作流」。
本書即是在這樣的背景下誕生,並以「Gemini 3 x NotebookLM 領軍邁向 Google多模態 AI 工作流」為核心主軸,系統性整理 Gemini 3 世代的完整能力版圖。內容涵蓋從快速上手、聊天技巧、格式控制,到 Chrome AI 搜尋、Google Workspace 深度整合;從檔案上傳分析、Canvas 專案式創作、Deep Research 深度研究,到 Gem、Storybook等引導式 AI 助理的建立;並進一步深入圖像、影片與跨模態創作領域,完整呈現 AI 如何從「輔助思考」進化為「共同創作」。
在本書中,讀者將實際體驗:
● Gemini 3 如何改變搜尋、寫作、規劃與決策的工作模式。
● Canvas 與 NotebookLM 如何將零散對話轉化為可持續發展的專案成果。
● Nano Banana Pro 如何讓文字直接生成可用於出版、簡報與行銷的專業圖像。
● Veo、Whisk 與 Flow 如何串聯成新一代 AI 影音創作流程。
● Gemini App 與 Gemini Live 如何把多模態 AI 帶入行動與即時互動場景。
本書並非單純介紹功能,而是試圖回答一個更關鍵的問題:在 AI 已能理解世界、生成內容、協助推理的時代,人應該如何與 AI 協作,才能真正放大自己的能力,而非被技術牽著走?
AI 的價值,從來不在於展示它能做多少事,而在於它是否能幫助我們想得更清楚、學得更有效率、創作得更有方向。這也是本書一以貫之的核心精神:「將 Gemini 3 與其生態系,轉化為日常可實踐、可累積、可進化的智慧工作方法」。
期盼讀者在閱讀本書後,不僅能熟練操作 Gemini 3 與 NotebookLM 的各項功能,更能建立屬於自己的多模態 AI 工作流思維,並將其實際應用於學習、研究、職場與創意創作之中。當 AI 成為思考與創作的長期夥伴,未來不再只是即將到來,而是正在我們每一次對話與每一個專案中,逐步成形。
本書編寫雖力求完善,然疏漏與不足仍在所難免,尚祈讀者不吝指正、賜教,讓這本《Gemini 3 x NotebookLM 領軍邁向 Google 多模態 AI 工作流》能持續修正、持續進化,陪伴你一同前行。
洪錦魁 2025/12/31
編號:311/361/500
[email protected]

臉書粉絲團
歡迎加入:王者歸來電腦專業圖書系列
歡迎加入:iCoding 程式語言讀書會
歡迎加入:MQTT 與AIoT 整合運用
歡迎加入:深度機器學習線上讀書會
讀者資源說明
本書籍的所有Prompt 和資源實例可以在深智公司網站下載。

最佳賣點

最佳賣點 : Gemini 3 x NotebookLM 領軍
Nano Banana Pro x Veo x Whisk x Flow x Gem
Google 多模態 AI 工作流

活動