AI Vision×LLM電腦視覺應用聖經: OpenCV×YOLO×Ollama解鎖多模態全攻略

作者	陳會安
出版社	旗標科技股份有限公司
商品描述	AI Vision×LLM電腦視覺應用聖經: OpenCV×YOLO×Ollama解鎖多模態全攻略：內容介紹:⛧⛦一本搞定LLM看圖說故事與即時影像分析⛦⛧⛧⛦十款熱門模型實際解決生活中AIVision問

內容簡介

內容簡介內容介紹: ⛧⛦ 一本搞定 LLM 看圖說故事與即時影像分析 ⛦⛧ ⛧⛦ 十款熱門模型實際解決生活中 AI Vision 問題 ⛦⛧ ⛧⛦ 用「自己的」資料集在本地端訓練 YOLO 模型 ⛦⛧ ⛧⛦ 無痛設計 Web 互動介面，輕鬆部署 AI 模型 ⛦⛧ 『AI Vision × LLM』劃開多模態應用的新時代從輸入文字生成圖片，到上傳照片讓 LLM 看圖說故事，AI 電腦視覺技術結合 LLM 的多模態應用正席捲全球。但這些令人驚豔的應用背後，其實倚賴多項核心技術——包含物體偵測、人臉辨識、情緒與年齡分析、或是影像文字識別，以及對於文字的理解與生成，這才賦予 AI 真正「看懂」影像內容的能力。實際解決現實生活中的 AI Vision 問題帶領讀者以多款熱門模型如 YOLO、OpenCV DNN、MediaPipe、CVZone 3D、DeepFace、Dlib、LiteRT、EasyOCR，打造刷臉門禁系統、即時口罩偵測、微笑自拍、手勢操控投影片、AI 健身教練、車牌辨識、結帳櫃台人流與高速公路車流分析等多項實用專案，讓讀者親身體驗 AI Vision 在真實場景中的應用價值。不僅會用，還能自行訓練專屬 AI 模型讓你不只會活用現成的模型，還能自己動手標註資料並訓練屬於你的 YOLO 模型。並且透過 Streamlit 設計 Web 互動介面，將訓練成果部署為具備即時偵測與辨識功能的 Web 應用程式，實現從標註資料、模型訓練到應用上線的完整流程。親手打造多模態 AI 應用，收穫滿滿成就感整合前述 AI Vision 技術與大型語言模型（LLM），或運用 Ollama 的多模態工具 Llama-Vision，再搭配 Streamlit，即可實作出讓 LLM 分析影像內容或情境的 Web 智慧應用，例如路況分析或圖片描述，讓 AI 真正具備視覺理解與語意回應的能力。零基礎也能無痛入門本書主打「從做中學」的實作導向，即使沒有深厚的理論基礎，也能快速掌握 Python 的 AI 模型與實用套件。至於不熟悉的語法、函式用法、AI 模型原理，或是特定功能的程式碼編寫與修改，則交由 ChatGPT 給予我們即時協助，讓學習更有效率。無論你是 AI 初學者還是開發者，本書都能帶你輕鬆入門、快速上手，從零開始打造專屬的 AI 專案，成為 AI Vision × LLM 的超酷玩家！🎉 本書特色: ➢ 精選多款熱門 AI 模型，打造貼近生活情境的 AI Vision 實務應用 ➢ 提供客製化 WinPython 可攜式套件，快速建立與書中一致的開發環境 ➢ 支援 CPU GPU，完整教學從資料標註到訓練與測試你自己的 YOLO 物體辨識模型 ➢ 使用 LabelImg 工具，以人性化的方式進行影像資料集的標註作業 ➢ 透過 Streamlit 快速打造 Web 互動介面，無需前端技能即可部署 AI 模型 ➢ 整合 Llama-Vision，讓 LLM 在 Web 介面中看圖說故事、回答問題或分析影像內容 ➢ 搭配 OpenCV 電腦視覺套件，實作物體、人臉、文字、車牌等偵測與辨識 ➢ 探索 Mediapipe × CVZone 3D，實現 3D 視角的手勢辨識與姿態評估

作者介紹

作者介紹作者簡介: 陳會安學歷：美國猶他州州立大學電腦碩士經歷：多所大專院校企業講師、松崗電腦產品經理、美商 PH 出版經理、專業電腦書作者國內知名資訊技術作家，已出版逾 100 本電腦著作，包括：程式設計、網頁設計、資料庫、系統分析、資料結構等各種不同主題。近年研究人工智慧、機器學習深度學習、資料科學、網路爬蟲、大數據分析和物聯網相關課程與圖書寫作，也熱衷利用 Raspberry Pi、Arduino、ESP8266 ESP32 和 Micro:bit 等開發板製作創客作品，投入創客領域的教學與寫作。

產品目錄

產品目錄目錄: ▍第 1 章使用 Python 虛擬環境建立開發環境1-1 建立與管理 Python 虛擬環境1-2 使用 Python 虛擬環境建立本書的開發環境1-3 安裝本書客製化的 WinPython 可攜式套件1-4 使用 Thonny 的 Python IDE1-5 使用 VS Code 的 Python IDE▍第 2 章 OpenCV 基本使用與 Numpy2-1 OpenCV 安裝與基本使用2-2 OpenCV 影像處理2-3 OpenCV 視訊處理與 Webcam2-4 OpenCV 影像資料：NumPy 陣列2-5 OpenCV 影像處理：負片和馬賽克效果▍第 3 章 OpenCV DNN電腦視覺與文字識別3-1 OpenCV 哈爾特徵層級式分類器3-2 OpenCV DNN 模組與預訓練模型3-3 OpenCV DNN 影像分類與人臉偵測3-4 OpenCV DNN 物體偵測與文字區域偵測3-5 Tesseract-OCR 文字識別▍第 4 章 Mediapipe × CVZone：人臉與臉部網格偵測4-1 Google MediaPipe 機器學習框架4-2 CVZone 電腦視覺套件與 MediaPipe4-3 CVZone 人臉偵測4-4 CVZone 臉部網格4-5 CVZone 辨識臉部表情：張嘴閉嘴與睜眼閉眼▍第 5 章 Mediapipe × CVZone：3D 手勢偵測與 3D 姿態評估5-1 Mediapipe × CVZone 3D 多手勢追蹤5-2 MediaPipe × CVZone 3D 辨識手勢：剪刀、石頭與布5-3 MediaPipe × CVZone 3D 辨識手勢：OK 手勢5-4 MediaPipe × CVZone 3D 人體姿態評估5-5 MediaPipe × CVZone 3D 辨識人體姿勢：仰臥起坐5-6 MediaPipe × CVZone 3D 辨識人體姿勢：伏地挺身▍第 6 章 LiteRT × Dlib × Deepface 電腦視覺應用6-1 認識與安裝 LiteRT（TensorFlow Lite）6-2 LiteRT 影像分類與物體偵測6-3 Dlib 人臉偵測、臉部網格與特徵提取6-4 face-recognition 人臉識別6-5 Deepface 情緒辨識與年齡偵測6-6 OpenCV DNN 預訓練模型：情緒辨識▍第 7 章 YOLO 電腦視覺應用：物體偵測與追蹤7-1 認識 YOLO7-2 YOLO 物體偵測7-3 YOLO 物體追蹤7-4 YOLO 電腦視覺應用：即時計算視訊的人數和車輛數7-5 YOLO 電腦視覺應用：繪出視訊的車輛追蹤線▍第 8 章 YOLO 電腦視覺應用：影像分類分割與姿態評估8-1 YOLO 影像分類8-2 YOLO 影像分割8-3 YOLO 姿態評估8-4 YOLO 電腦視覺應用：影像分割的背景替換8-5 YOLO 電腦視覺應用：辨識人體姿勢▍第 9 章訓練你自己的 YOLO 物體偵測模型9-1 安裝 GPU 版的 YOLO9-2 取得訓練 YOLO 模型所需的圖檔資料9-3 使用 LabelImg 標註影像建立資料集9-4 整理與瀏覽 Roboflow 取得的資料集9-5 建立 YAML 檔訓練與驗證你的 YOLO 模型▍第 10 章 Streamlit 的 AI 互動介面設計10-1 認識與安裝 Streamlit10-2 建立你的 Streamlit 應用程式10-3 輸出網頁內容10-4 繪製圖表與地圖10-5 建立表單介面的互動元件10-6 佈局、狀態與聊天元件10-7 使用快取機制與網頁配置設定10-8 Streamlit 互動介面設計：建立 YOLO 的 AI 互動介面▍第 11 章 AI 電腦視覺實戰：刷臉門禁管理、微笑拍照與變臉化妝11-1 AI 電腦視覺實戰：刷臉門禁管理11-2 AI 電腦視覺實戰：YOLO 臉部情緒偵測11-3 AI 電腦視覺實戰：微笑拍照11-4 AI 電腦視覺實戰：變臉與化妝▍第 12 章 AI 電腦視覺實戰：手勢操控與 AI 健身教練12-1 pywin32 套件：Office 軟體自動化12-2 AI 電腦視覺實戰：手勢操控 PowerPoint 簡報播放12-3 AI 電腦視覺實戰：AI 健身教練▍第 13 章 AI 電腦視覺實戰：EasyOCR 車牌辨識與車道偵測系統13-1 AI 電腦視覺實戰：Tesseract-OCR 車牌辨識13-2 EasyOCR 的安裝與使用13-3 AI 電腦視覺實戰：EasyOCR 車牌辨識13-4 AI 電腦視覺實戰：YOLO 車牌偵測13-5 AI 電腦視覺實戰：OpenCV 車道偵測系統▍第 14 章 AI 電腦視覺實戰：YOLO 人流與車流控制14-1 找出熱區域座標14-2 判斷目標物體是否進入熱區域14-3 結帳櫃台的人數控制14-4 道路的車流控制14-5 AI 電腦視覺實戰：多個結帳櫃台的人數控制14-6 AI 電腦視覺實戰：南下北上高速公路的車流控制▍第 15 章 AI 電腦視覺實戰：打造自己的 AI 模型與整合應用15-1 使用 Teachable Machine 訓練機器學習模型15-2 AI 電腦視覺實戰：LiteRT 識別剪刀、石頭或布15-3 AI 電腦視覺實戰：建立 YOLO 即時口罩偵測▍第 16 章 AI 電腦視覺實戰：本機 LLM Vision 整合應用16-1 認識生成式 AI 與 LLM16-2 LLM API 服務：Groq API16-3 使用 Ollama 打造本機 LLM16-4 AI 電腦視覺實戰：Llama-Vision 視覺分析助手16-5 AI 電腦視覺實戰：Llama-Vision 車牌辨識16-6 AI 電腦視覺實戰：Llama-Vision 路況分析▍附錄 A 電子書 Anaconda 開發環境與 Python 程式設計A-1 建立 Anaconda 的 Python 開發環境A-2 變數、資料型態與運算子A-3 流程控制A-4 函式、模組與套件A-5 容器型態A-6 類別與物件

商品規格

書名 /	AI Vision×LLM電腦視覺應用聖經: OpenCV×YOLO×Ollama解鎖多模態全攻略
作者 /	陳會安
簡介 /	AI Vision×LLM電腦視覺應用聖經: OpenCV×YOLO×Ollama解鎖多模態全攻略：內容介紹:⛧⛦一本搞定LLM看圖說故事與即時影像分析⛦⛧⛧⛦十款熱門模型實際解決生活中AIVision問
出版社 /	旗標科技股份有限公司
ISBN13 /	9789863128311
ISBN10 /
EAN /	9789863128311
誠品26碼 /	2682906956001
頁數 /	544
注音版 /	否
裝訂 /	P:平裝
語言 /	1:中文繁體
尺寸 /	17X23X2.8CM
級別 /	N:無
重量(g) /	955
提供維修 /	無

最佳賣點

最佳賣點 : 電腦視覺 × LLM 劃開多模態應用新時代！

活動

5/20前全站滿$1,500享9折

AI Vision×LLM電腦視覺應用聖經: OpenCV×YOLO×Ollama解鎖多模態全攻略 | 誠品線上