Gemini×NotebookLM領軍: Nano Banana×Imagen×Veo×Gem×Gemini Live-Google多模態AI工作流 | 誠品線上

Gemini×NotebookLM領軍: Nano Banana×Imagen×Veo×Gem×Gemini Live-Google多模態AI工作流

作者 洪錦魁
出版社 聯合發行股份有限公司
商品描述 Gemini×NotebookLM領軍: Nano Banana×Imagen×Veo×Gem×Gemini Live-Google多模態AI工作流:https://youtu.be/VlCfKywn5mcGeminixNotebookLM領軍NanoBananaxImagenxVeoxGemxG

內容簡介

內容簡介 https: youtu.be VlCfKywn5mcGemini x NotebookLM 領軍Nano Banana x Imagen x Veo x Gem x Gemini LiveGoogle 多模態 AI 工作流本書內容☆★☆從 Gemini 到 NotebookLM,打造個人知識與創作☆★☆☆★☆Nano Banana 輔助建立影片摘要☆★☆☆★☆整合 Google Workspace全系列 AI 工具☆★☆☆★☆圖像、語音、影片與文件的多模態☆★☆☆★☆讓 AI 真的成為你的工作夥伴,而非只會聊天的助手☆★☆☆★☆一次搞懂「行動 + 桌面 + 雲端」的 Gemini全平台☆★☆導讀語在生成式 AI 快速發展的時代,Gemini 不只是聊天模型,而是能整合 Google 全生態工具的多模態中樞。從語音輸入、文件摘要、圖像生成,到 NotebookLM 的知識引擎與 Veo 的影片創作,本書完整揭示如何打造屬於你的 AI 工作流與創作引擎。這是第一本真正整合 Gemini + Google Workspace + Imagen + Nano Banana + Veo + Storybook + Gem + NotebookLM 的中文專書。無論你是想提升效率的辦公室人士、創意工作者、行銷專家、教育工作者,或希望用 AI 展開第二職涯的自媒體創作者,這本書都會讓你擁有一位「全能的 AI 夥伴」。本書值得閱讀的十大亮點1. Google 全生態 AI 教學首創整合書全面整合 Gemini、Nano Banana、Imagen、Veo、Gem、Storybook、NotebookLM、Gemini Live 等八大 AI 平台,建立多模態工作流的第一本中文專書。2. 從聊天到研究的多層次學習路徑第1 ~ 3章由淺入深介紹 Gemini 操作、聊天技巧與輸出格式控制,讓新手快速具備 AI 對話邏輯與結構思考力。3. 跨應用場景的實務操作旅遊、媒體、Workspace 三大應用章節(第4 ~ 6章),示範如何整合 Google 地圖、航班、YouTube、Gmail、Docs、Calendar 等工具,打造 AI 辦公室自動化流程。4. 多模態資料上傳與分析實戰第7章介紹文字、音訊、圖像三大資料型態上傳與智慧解析,展現 Gemini 在辦公與研究領域的強大應用潛力。5. Canvas:讓 AI 思維具象化第8章揭示 Gemini Canvas 的結構化創作方式,協助使用者將靈感轉化為資訊圖表、測驗與網頁。6. Deep Research:AI 查證與引用透明化第9章教你如何利用多來源比對與長時推理,生成可驗證、可追溯的研究結果,適合學生、學者與記者。7. Gem 與 Storybook:建立專屬 AI 助理與導師第10 ~ 12章示範如何設計具角色與任務導向的 AI 助理,並以 Storybook 進行創意與學習引導。8. Imagen x Nano Banana x Veo:影像與影片生成三部曲第13 ~ 15章構成全書的多媒體創作核心,從繪圖、融合、動畫到影片生成,呈現 AI 跨模態創作新時代。9. Gemini App 與 Live:AI 隨身工作夥伴第16章完整介紹手機端 Gemini 的語音、鏡頭、即時翻譯、視訊與直播應用,展現行動 AI 實力。10. NotebookLM:AI 知識庫與學習革命第17章是本書壓軸,從「資料來源 → 對話 → 工作室」完整展示 NotebookLM 的知識引擎與多模態輸出(語音摘要、影片摘要、報告、心智圖、學習卡與測驗)。11. 【獨家新增】Nano Banana輔助建立具視覺吸引力的影片摘要 (深智官網下載電子書)「知識影像化」時代來了。

作者介紹

作者介紹 洪錦魁 畢業於明志工專(現今明志科技大學),跳級留學美國University of Mississippi計算機系研究所。 2023年和2024年連續2年獲選博客來10大暢銷華文作家,多年來唯一電腦書籍作者獲選,也是一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家,下列是他在各時期的代表作品。 ► DOS時代:「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。 ► Windows時代:「Windows Programming 使用C、Visual Basic」。 ► Internet時代:「網頁設計使用HTML」。 ► 大數據時代:「R 語言邁向Big Data之路、Python王者歸來」。 ► AI時代:「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。 ► 通用AI時代:「ChatGPT、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術」。 ► Vibe Coding 時代:「寫程式的 AI 戰友 – VS Code x GitHub Copilot」。 作品曾被翻譯為簡體中文、馬來西亞文,英文,近年來作品則是在北京清華大學和台灣深智同步發行。 他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,不同時期暢銷排行榜第1 名,他的著作特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做說明,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。

產品目錄

產品目錄 ▌第1 章 認識與快速上手Gemini1-1 Gemini 是什麼1-2 認識不同版本的 Gemini1-3 登入與認識Gemini( 基本版) 操作環境1-3-1 認識聊天環境1-3-2 展開或收合選單1-3-3 「新的對話」與「臨時對話」1-3-4 主題 - 介面色彩1-3-5 2.5 Flash 版本1-3-6 升級1-3-7 Nano Banana1-4 與Gemini 聊天 – 展現Google AI 的特色1-4-1 一般聊天測試1-4-2 回覆下方的功能圖示1-4-3 結合「Google 地圖」的聊天測試1-4-4 結合Google 搜尋1-4-5 分行輸入 - Shift + Enter 鍵1-5 生成與操作聊天主題1-5-1 生成聊天標題1-5-2 釘選1-6 共用 - 分享聊天內容1-6-1 分享聊天的應用情境1-6-2 分享內容1-6-3 刪除分享連結1-7 匯出文件 - 傳送到 Word 與 Gmail1-7-1 匯出文件到Word1-7-2 在Gmail 建立草稿1-8 閱讀網址內容生成摘要報告1-8-1 閱讀Youtube 網站產生中文摘要1-8-2 閱讀中文網站生成摘要1-8-3 生成表格式的報告1-9 查核Gemini 回應資料的正確性1-10 活動紀錄1-11 搜尋功能1-12 已儲存的資訊1-12-1 功能定位1-12-2 可以儲存的內容1-12-3 啟用已儲存資訊1-12-4 測試已儲存資訊 - Gemini 推薦筆者適合寫作的地方▌第2 章 語音輸入與朗讀輸出- 外語隨身教練2-1 語音輸入與朗讀輸出2-1-1 語音輸入的應用場景2-1-2 Gemini 會徵求我們的同意2-1-3 語音輸入與朗讀輸出2-1-4 語音輸入的其他應用2-2 學習外語的隨身教練2-2-1 「說 → 看 → 聽」的學習教練2-2-2 實際範例▌第3 章 聊天技巧與輸出格式的規則3-1 聊天技巧3-1-1 明確化需求3-1-2 分步驟提問3-1-3 善用上下文與範例3-1-4 指定角色與視角3-1-5 持續修正與迭代3-2 如何讓Gemini 用您指定的格式回應3-2-1 為什麼格式控制很重要?3-2-2 常見的格式控制方式3-2-3 語法指令補充技巧3-2-4 總結3-3 條列式、Q&A、表格輸出控制3-3-1 條列式輸出(List Format)3-3-2 問與答格式(Q&A)3-3-3 表格輸出(Table Format)3-3-4 總結3-4 限制字數與加入實例3-4-1 限制字數(Length Limitation)3-4-2 加入實例(Include Examples)▌第4 章 Gemini 應用程式 – 旅遊類4-1 認識「應用程式」4-1-1 展開「應用程式」項目4-1-2 輸入「@」啟用應用程式4-2 Google 地圖 - 智慧導覽與資訊查詢4-2-1 當地圖應用未啟用時 - Gemini 如何回答4-2-2 地點查詢4-2-3 路線規劃4-2-4 附近探索4-3 Google 航班 機票 - 智慧查詢與比價4-3-1 航班查詢4-3-2 票價比對4-3-3 轉機資訊4-3-4 彈性搜尋4-4 Google 飯店 - 智慧查詢與比價4-4-1 旅遊住宿規劃4-4-2 價格比較4-4-3 評價篩選4-4-4 地點便利性4-5 結合地圖、航班或飯店的旅遊規劃4-5-1 Gemini 的旅遊規劃方式4-5-2 5 天4 夜自由行▌第5 章 Gemini 應用程式 - 媒體類5-1 YouTube YouTube Music 功能概覽5-1-1 三大核心功能5-1-2 適用情境5-2 YouTube 應用5-2-1 影片搜尋5-2-2 影片摘要5-3 YouTube Music 應用5-3-1 歌曲搜尋5-3-2 播放清單推薦5-3-3 探索新音樂▌第6 章 Gemini 應用程式 - Google Workspace6-1 Gmail 應用 - 智慧郵件操作6-1-1 智慧郵件摘要 - 快速擷取重點內容6-1-2 自動回覆建議 - 撰寫更有效率6-1-3 郵件分類與搜尋 - Gemini 輔助高精準過濾6-2 Google Calendar - 時間管理6-2-1 認識Chrome 視窗的Google Calendar6-2-2 從無到有 - Gemini 協助生成行程6-3 Google Keep - 雲端筆記6-3-1 認識Chrome 視窗的Google Keep6-3-2 從無到有 - Gemini 協助生成筆記6-4 Google Tasks - 建立待辦清單系統6-4-1 認識Chrome 視窗的Google Tasks6-4-2 建立待辦事項6-4-3 待辦清單轉成Calendar6-5 Google 文件 – 生成與摘要6-5-1 認識Chrome 視窗的Google 文件6-5-2 Gemini 輔助快速建立草稿6-5-3 Gemini 視窗編輯Google 文件6-6 Google 雲端硬碟6-6-1 認識Chrome 視窗的Google 雲端硬碟6-6-2 摘要檔案內容▌第7 章 文字、音訊與圖像檔案上傳 - 智慧分析7-1 檔案上傳與分析的核心價值7-1-1 與傳統辦公軟體的差異7-1-2 實務操作7-2 文件型檔案分析(Word、PDF) - 語音摘要7-2-1 文字摘要7-2-2 語音摘要7-2-3 其他摘要Prompt 實例7-3 音訊檔案轉文字稿7-4 AI 視覺 - 上傳圖像,理解圖像內容7-4-1 物品識別7-4-2 場景分析7-4-3 文字識別與抽取7-4-4 圖像意境解讀7-4-5 跨模態互動▌第8 章 Gemini 的 Canvas 功能8-1 Canvas 功能概覽8-1-1 定位 - AI 輔助的知識與專案工作板8-1-2 與純文字對話的差異(線性 vs 結構化)8-1-3 Canvas 在工作與學習中的角色8-2 建立Canvas 文案8-2-1 啟動Canvas8-2-2 文字或段落編輯8-2-3 變更文案長度8-2-4 變更語氣8-2-5 提出修改建議8-2-6 問問Gemini8-3 讓文件活起來 - Canvas「 建立」應用8-3-1 建立網頁(Web Page)8-3-2 建立資訊圖表(Infographics)8-3-3 測驗(Quiz)8-3-4 語音摘要(Audio Summary)8-4 Canvas 設計帕斯卡三角形遊戲8-4-1 帕斯卡三角形遊戲設計8-4-2 可能的遊戲成果 18-4-3 遊戲成果 2▌第9 章 Deep Research 深度研究9-1 Deep Research 功能概覽9-1-1 定義與核心定位 - 與傳統搜尋或摘要的差異9-1-2 四大特色 - 多來源比對、分層分析、長時推理、引用透明9-2 操作流程9-2-1 啟動Deep Research9-2-2 自然語言提問9-2-3 「目錄」、「匯出」9-2-4 建立9-2-5 探討Deep Research 輸出形式9-3 實際應用情境▌第10 章 AI 導師上線 - 體驗Gemini 的引導式學習10-1 引導式學習10-1-1 功能定位與應用情境10-1-2 啟用引導式學習10-1-3 Prompt 範例10-2 語音互動學習10-2-1 語音學習與情境說明10-2-2 語音互動學習實例▌第11 章 探索Gem – 建立專屬AI 助理11-1 什麼是 Gem11-1-1 定義與核心理念11-1-2 與一般 Prompt 的差異11-1-3 Gem 的生態定位11-2 認識與建立Gem 環境11-3 英文單字學習卡片 Gem11-3-1 建立畫面11-3-2 測試「英文單字學習卡片」11-3-3 儲存與觀察11-3-4 Gem 列表與分享11-4 網路電商客服 Gem11-4-1 填寫名稱和使用說明11-4-2 上傳Gem 的知識背景 - 相關資訊11-4-3 Prompts 的測試11-5 我可以稱Gem 是打造「專屬AI Agent 嗎」▌第12 章 AI 助理Storybook12-1 什麼是 Storybook12-1-1 定義與基本功能12-1-2 與一般 Gemini 對話的差異12-1-3 為什麼適合用於創意與學習12-2 建立 Storybook 的流程12-2-1 啟用 Storybook 功能12-2-2 撰寫提示(輸入主題或情境)12-3 Storybook 的應用場景12-3-1 客服助理培訓12-3-2 語言學習助理12-3-3 行銷與品牌故事12-3-4 小結▌第13 章 AI 圖像創作 - Imagen13-1 什麼是 Imagen13-1-1 Imagen 的技術背景與定位13-1-2 與 Gemini 的整合方式13-1-3 小結13-2 撰寫 Prompt 的技巧13-2-1 如何撰寫清晰有效的描述13-2-2 加入風格、細節、色彩元素的方法13-2-3 利用角色、場景、氛圍提升畫面效果13-2-4 避免模糊或誤導性的指令13-2-5 小結13-3 Imagen 的繪畫入門與創作風格13-3-1 啟動Imagen13-3-2 童話風格13-3-3 科幻未來感13-3-4 寫實攝影風13-3-5 教育與學習風格13-3-6 行銷與品牌風格13-3-7 圖像大小與比例的選擇13-3-8 繪製4 格漫畫13-3-9 迭代繪圖13-4 Imagen 的應用場景13-5 Imagen 與Gem 結合 - 設計品牌行銷Gem13-5-1 架構化繪圖 Gem 的觀念13-5-2 品牌視覺行銷 Gem13-5-3 「運動鞋」和「太陽牌衛星手機」品牌宣傳▌第14 章 Nano Banana Gemini 2.5 Flash Image14-1 什麼是 Nano Banana14-1-1 名稱由來與正式名稱(Gemini 2.5 Flash Image)14-1-2 發展背景 - 從 Gemini 2.0 Flash Image過渡到 2.514-1-3 與 Imagen 的核心差異初探14-1-4 小結14-2 Nano Banana 的核心功能14-2-1 圖生圖14-2-2 多圖融合 - 人物移動14-2-3 多圖融合 - 合成新圖像14-2-4 世界知識加成 - 自動融入合理的背景元素14-3 官網展示實例14-3-1 官方網站展示實例14-3-2 GitHub 網站有關Nano Banana的應用14-4 Google AI Studio 的Nano Banana14-4-1 認識Google AI Studio 的定位14-4-2 進入Nano Banana 環境▌第15 章 AI 影片生成新紀元 - Veo15-1 Veo 的定位與特點15-2 Veo 的操作流程15-3 文字生成影片15-4 圖片生成影片15-5 文字 + 圖片 -「公仔化身飛翔的超級英雄」15-6 Google AI Studio 的Veo▌第16 章 Gemini App - 手機上的隨身 AI 助手16-1 安裝與登入16-2 操作介面導覽16-2-1 聊天視窗與輸入方式16-2-2 功能表欄與選單介紹16-2-3 與電腦版的差異16-2-4 小結16-3 Gemini App 行動體驗特色16-3-1 語音輸入與即時翻譯 - 快速口語互動,適合旅行或會議16-3-2 相機拍照辨識 - 上傳照片、即時理解圖像內容16-3-3 多模態查詢 - 文字 + 圖像結合提問16-3-4 小結16-4 Gemini Live16-4-1 功能特色16-4-2 操作方式16-4-3 視訊16-4-4 直播16-4-5 暫停▌第17 章 NotebookLM - AI 驅動的智慧筆記與學習夥伴17-1 NotebookLM 的定位與演變17-1-1 背景與發展簡史17-1-2 與傳統筆記 知識管理工具相比之處17-1-3 NotebookLM 在 Gemini 生態中的角色定位17-2 NotebookLM 視窗與筆記操作環境17-2-1 NotebookLM 主視窗17-2-2 筆記本的存取權限 – Reader Owner17-2-3 設定17-2-4 NotebookLM 筆記操作環境17-2-5 查看檔案細節17-2-6 返回NotebookLM 主視窗17-3 建立NotebookLM 的知識引擎17-3-1 來源檔案的格式與限制17-3-2 專題實作 - 建立「AI 的歷史與未來」的知識引擎17-3-3 建立新的筆記17-3-4 探索(Discover)17-3-5 新增記事17-4 智慧「對話」 - 與 NotebookLM 的互動中樞17-4-1 「對話」功能說明17-4-2 實作練習 - Prompt 範例操作17-4-3 儲存到記事17-5 工作室 - 多模態輸出的創作空間17-5-1 語音摘要(Audio Overviews)17-5-2 影片摘要(Video Overviews)17-5-3 報告生成(Reports)17-5-4 心智圖概覽(Mind Maps)17-5-5 智慧學習卡(Flashcards)17-5-6 互動測驗(Quizzes)17-6 我的筆記本17-7 筆者操作NottebookLM 的感想▌附錄A Nano Banana 在 NotebookLM 影片摘要的應用 (官網下載電子書)

商品規格

書名 / Gemini×NotebookLM領軍: Nano Banana×Imagen×Veo×Gem×Gemini Live-Google多模態AI工作流
作者 / 洪錦魁
簡介 / Gemini×NotebookLM領軍: Nano Banana×Imagen×Veo×Gem×Gemini Live-Google多模態AI工作流:https: youtu.be VlCfKywn5mcGeminixNotebookLM領軍NanoBananaxImagenxVeoxGemxG
出版社 / 聯合發行股份有限公司
ISBN13 / 9786267757451
ISBN10 /
EAN / 9786267757451
誠品26碼 / 2683017488009
頁數 / 336
裝訂 / P:平裝
語言 / 1:中文 繁體
尺寸 / 17X23X1.93CM
級別 / N:無

試閱文字

自序 : §序

在人工智慧的演進歷程中,從單一文字對話到多模態整合,代表的不只是技術的突破,更是人類工作與生活方式的根本轉變。Google 以 Gemini 為核心,串聯NotebookLM、Imagen、Nano Banana、Veo、Gem 等工具,再加上隨時隨地可用的Gemini Live,構築出一個前所未有的智慧工作流生態。這套生態系不僅能理解文字,更能同時處理聲音、影像、影片與資料,將 AI 從輔助角色推升為真正的「智慧夥伴」。
本書以「Gemini × NotebookLM 領軍邁向多模態 AI 工作流」為主軸,系統化介紹了從基礎操作到進階應用的全貌。讀者將循序漸進地學習如何:
► 認識並掌握 Gemini 的各種版本與操作技巧,善用聊天、匯出、分享、摘要等功能。
► 透過語音輸入與朗讀輸出,打造隨身外語教練,將 AI 融入學習日常。
► 善用聊天技巧與輸出格式規則,讓 Gemini 成為結構化資訊的最佳生成器。
► 搭配 Google Maps、航班、飯店等應用程式,完成智慧旅遊規劃。
► 與 YouTube、Google Workspace 等工具無縫整合,提升媒體與辦公效率。
► 上傳文字、音訊與圖像檔案,讓 Gemini 進行智慧分析與跨模態解讀。
► 在 Canvas 中組織與延伸 AI 生成的內容,將靈感轉化為專案成果。
► 體驗 Deep Research 的深度研究功能,展現多來源、多層次的資料洞察力。
► 使用 Gem、Storybook、Imagen、Nano Banana 與 Veo,展開專屬 AI 助理、圖像創作與影片生成的新世代體驗。
► 在行動裝置上啟用 Gemini App 與 Gemini Live,實現即時、互動的全方位 AI 助手。
► 結合 NotebookLM,打造「影音摘要」、「影片摘要」、「智慧筆記」、「心智圖」、「學習卡」與「互動測驗」,將知識管理與學習推升至全新境界。
AI 工具的價值,不在於炫目的技術,而在於如何幫助我們「想得更清楚、學得更快、做得更好」。這本書的核心精神,即是將 Gemini 與其生態系應用,化為日常可用的智慧工作術。
希望讀者能藉由本書,不僅熟悉操作步驟,更能領悟多模態 AI 背後的思維轉變,並進一步應用於學習、研究、職場與創意創作之中。當 AI 成為我們的思考與創作夥伴時,未來已不再遙遠,而是正在我們手中發生。本書編寫雖然力求完善,但疏漏或謬誤在所難免,還請讀者不吝指正、賜教,讓這本「Gemini × NotebookLM 領軍邁向Google 多模態 AI 工作流」 能持續進化,陪伴你一同前行。
洪錦魁 2025/10/9
編號:307/357/500
[email protected]

臉書粉絲團
歡迎加入:王者歸來電腦專業圖書系列
歡迎加入:iCoding 程式語言讀書會
歡迎加入:MQTT 與AIoT 整合運用
歡迎加入:深度機器學習線上讀書會

讀者資源說明
本書籍的所有Prompt 和資源實例可以在深智公司網站下載。

最佳賣點

最佳賣點 : Gemini x NotebookLM 領軍
Nano Banana x Imagen x Veo x Gem x Gemini Live
Google 多模態 AI 工作流

活動