OpenCV全攻略! AI影像辨識×電腦視覺實戰手冊
| 作者 | 翁健豪 |
|---|---|
| 出版社 | 旗標科技股份有限公司 |
| 商品描述 | OpenCV全攻略! AI影像辨識×電腦視覺實戰手冊:內容介紹:從傳統影像處理到AI影像辨識讓你擁有獨立開發電腦視覺應用的能力OpenCV是目前最為廣泛使用的電腦視覺工具之一,無論 |
| 作者 | 翁健豪 |
|---|---|
| 出版社 | 旗標科技股份有限公司 |
| 商品描述 | OpenCV全攻略! AI影像辨識×電腦視覺實戰手冊:內容介紹:從傳統影像處理到AI影像辨識讓你擁有獨立開發電腦視覺應用的能力OpenCV是目前最為廣泛使用的電腦視覺工具之一,無論 |
內容簡介 內容介紹: 從傳統影像處理到 AI 影像辨識讓你擁有獨立開發電腦視覺應用的能力 OpenCV 是目前最為廣泛使用的電腦視覺工具之一,無論是影像處理、影像分析、人臉辨識、物件偵測,甚至近年熱門的 AI 影像辨識應用,都能看見它的身影。 本書使用 Python 語言,從 OpenCV 開發環境建置開始,循序漸進帶領讀者認識數位影像、色彩空間、影像處理與分析、模板匹配、特徵匹配、視窗互動、影片處理與即時影像分析等核心技術,並進一步透過 cv2.dnn 與 Ultralytics YOLO 實作人臉偵測、人臉辨識、物件偵測與物件追蹤等現代 AI 視覺應用。 除了完整介紹 OpenCV 的重要功能與背後技術外,本書更著重於「如何實際應用」——各章節搭配豐富範例與執行結果比較,說明每項功能的用途與差異,並於章末安排實作小專案,讓讀者立即運用學到的知識。 在本書的最後,整合前面 23 章所學,完成自動玩 Chrome 小恐龍、自動玩 2048、智慧人臉門禁、智慧寵物攝影機,以及簡易版 Photoshop 等五個生活化專案。 從「了解電腦如何看見影像」,到「讓電腦看懂影像」,本書將帶領你把 OpenCV 從一行行生硬的函式,變成解決真實問題的利器。本書特色: ✔ 從「會用 OpenCV」到「會做應用」 學習如何拆解問題、選擇技術與組裝程式碼,建立獨立開發電腦視覺應用的能力。 ✔ 不只學會 API,還要理解背後原理 透過大量圖解與程式範例,說明每個功能的用途、運作原理與適用情境,而非單純的函式教學。 ✔ 從零建立電腦視覺基礎 從安裝、影像讀取與顯示開始,逐步建立像素、解析度、色彩空間與影像通道等核心觀念。 ✔ 完整涵蓋 OpenCV 核心技術 包含影像處理、影像分析、模板匹配、特徵匹配、影片處理與即時影像分析等重要主題。 ✔ 從傳統電腦視覺跨入 AI 影像辨識 實作人臉偵測、人臉辨識、YOLO 物件偵測與物件追蹤,掌握現代視覺系統的開發流程。 ✔ 章末實作 + 五大實戰專案 透過大量實務範例,了解各項技術的應用情境,並於最後整合全書所學,完成五個有趣且實用的生活化專案。
作者介紹 翁健豪(嗡嗡,Howard Weng)學歷:國立政治大學資訊管理碩士(研究方向:電腦視覺與深度學習)、國立交通大學資訊工程學士經歷:高通(Qualcomm)AI 平台工程師、智慧攝影機新創 AI 軟體工程師、台灣微軟學生大使長期專注於影像處理、電腦視覺與 AI 影像辨識領域。業界期間曾於智慧攝影機新創負責人臉、年齡性別等影像辨識模型開發;於高通負責 AI 模型部署、推論驗證自動化等實務工作,熟悉 OpenCV、Python 與深度學習相關技術。多年來持續於個人網站「嗡嗡的隨手筆記(wongwongnotes.com)」分享技術內容,至今累積 800 篇以上文章,累計瀏覽量超過百萬。曾連續三屆參加 iThome 鐵人賽並兩度獲得佳作,其中第 12 屆《錢不夠買 ps 的我,只好用 OpenCV 來修圖了!》系列正是本書最早的雛形。也曾在台大、梅竹黑客松等多場全國性大型賽事奪冠,並受邀擔任 PyLadies Taiwan 深度學習入門講師,希望透過寫作與分享,讓更多人把影像處理技術帶進日常生活。
產品目錄 目錄: ▍第一部分 準備 OpenCV 的 Python 開發環境▍第 0 章 建置 OpenCV 開發環境0-1 Python 環境管理工具:Anaconda0-2 安裝與開啟 JupyterLab0-3 認識與使用 JupyterLab0-4 JupyterLab 檔案管理0-5 關閉 JupyterLab▍第 1 章 OpenCV 影像讀取、顯示與儲存1-1 OpenCV 簡介1-2 OpenCV 與相關工具的安裝1-3 利用 OpenCV 讀取影像檔案1-4 利用 OpenCV 內建的函式顯示影像1-5 利用 OpenCV 儲存影像1-E 替未來準備:封裝本章的程式,方便日後使用▍第二部分 OpenCV 影像基礎與色彩空間▍第 2 章 數位影像的基礎2-1 認識影像如何儲存在電腦中2 2 認識像素位置表示法:NumPy 與 OpenCV 的視角差異2-3 認識影像的顏色通道2-4 認識色碼(Hex Color Codes)2-5 補充:影像在電腦占的儲存空間2-E 練習:透過 Python 分析影像的基本元素▍第 3 章 認識 OpenCV 中的影像與色彩3-1 認識 OpenCV 的 BGR 顏色通道3-2 拆解與合併 OpenCV 的 BGR 顏色通道3-3 進階內容:運用 OpenCV 計算影像的直方圖3-4 進階內容:CMYK、HSV、HSL 色彩空間介紹3-E 小專案:透過 HSV 色彩空間來篩選影像中的紅色▍第三部分 OpenCV 影像處理基礎操作▍第 4 章 OpenCV 影像變形處理4-1 影像的剪裁4-2 影像的旋轉4-3 影像的縮放4-4 影像的翻轉4-5 影像的平移4-6 進階:影像的任意角度旋轉4-7 進階:仿射變換 – 平面影像變形的萬能工具4-8 進階:透視變換 – 校正影像的空間變形4-E 小專案:自製文件掃描機▍第 5 章 OpenCV 影像繪製與標註5-1 畫點於影像上5-2 畫圓於影像上5-3 畫線於影像上5-4 畫矩形於影像上5-5 畫橢圓、圓弧於影像上5-6 畫多邊形於影像上5-7 寫字於影像上5-8 補充:標記特殊符號於影像上5-E 小專案:模擬對 AI 偵測結果進行資料標記▍第 6 章 OpenCV 影像數學運算6-1 本章共通觀念、實作素材準備6-2 影像的加、減法與絕對值差6-3 影像的加權運算6-4 影像的邏輯運算:AND、OR、XOR、NOT 運算6-5 影像數學運算的綜合應用6-E 小專案:「大家來找碴」破解器▍第 7 章 OpenCV 影像模糊、銳化與馬賽克7-1 本章共通觀念、認識濾波器與卷積7-2 影像模糊的不同算法7-3 影像銳化7-4 影像馬賽克7-E 小專案:保護貓貓肖像權▍第 8 章 OpenCV 影像色彩與光影調校8-1 本章共通觀念:OpenCV 線性變換8-2 調整影像亮度、對比度8-3 調整影像飽和度8-4 調整影像色溫(冷色調、暖色調)8-5 進階:透過 Gamma 矯正調整亮度8-6 進階:自動對比度增強「直方圖均衡化」8-7 進階:自適應對比度增強「CLAHE」8-E 小專案:模仿 Photoshop 進行照片修圖▍第四部分 OpenCV 影像分析▍第 9 章 OpenCV 影像二值化9-1 本章共通觀念:二值化的概念、彩色影像前處理9-2 固定門檻值二值化9-3 Otsu 二值化(自動門檻值二值化)9-4 自適應二值化(Adaptive Thresholding)9-5 小結:各種二值化比較9-E 小專案:體驗車牌辨識的前處理▍第 10 章 OpenCV 形態學運算10-1 形態學運算的共通觀念:主體共識、結構元素10-2 影像侵蝕10-3 影像膨脹10-4 進階形態學運算10-E 小專案:優化車牌辨識的結果▍第 11 章 OpenCV 邊緣偵測11-1 Sobel 邊緣偵測11-2 Laplacian 邊緣偵測11-3 Canny 邊緣偵測11-4 比較:邊緣偵測方法比較與應用建議11-E 小專案:觀察不同的邊緣偵測方法效果▍第 12 章 OpenCV 輪廓分析12-1 輪廓擷取12-2 計算輪廓面積12-3 擷取輪廓後繪製外接矩形(Bounding Box)12-E 小專案:尋找其他影像中的主體▍第 13 章 OpenCV 影像分割13-1 GrabCut 影像分割原理13-2 影像分割:cv2.grabCut13-3 程式範例:影像分割實作13-4 進階:使用 GrabCut 的注意事項與優化建議13-E 小專案:替其他影像進行去背▍第五部分 OpenCV 影像匹配技術▍第 14 章 OpenCV 模板匹配14-1 模板匹配(單目標)14-2 模板匹配(多目標)14-3 模板匹配的限制與解法14-E 小專案:找到影片畫面中的「略過廣告」按鈕▍第 15 章 OpenCV 特徵偵測與匹配15-1 本章共通觀念:關鍵點、描述子與特徵匹配15-2 ORB 特徵偵測15-3 BFM 暴力匹配(ORB 特徵匹配)15-4 SIFT 特徵偵測15-5 FLANN 匹配(SIFT 特徵匹配)15-E 小專案:UI 元素匹配▍第六部分 OpenCV 視窗互動、影片與即時影像處理▍第 16 章 OpenCV 視窗與使用者互動16-1 視窗的操作與關閉16-2 進階視窗屬性操作16-3 鍵盤輸入偵測與互動16-4 滑鼠事件偵測與互動應用16-5 視窗滑桿(Trackbar)互動應用16-E 小專案:即時顯示滑鼠座標的影像觀察工具▍第 17 章 OpenCV 影片處理17-1 影片的基礎觀念17-2 讀取影片並取得資訊17-3 逐格處理影片17-4 影片的儲存與編碼17-E 小專案:製作影片負片(Negative)效果並儲存▍第 18 章 OpenCV 攝影機即時影像分析18-1 讀取攝影機即時影像18-2 即時影像處理18-E 小專案:即時影像素描風格(Sobel 邊緣偵測)▍第七部分 OpenCV 從傳統影像處理到 AI 影像辨識▍第 19 章 從「傳統影像處理」邁向「AI 影像辨識」的 OpenCV19-1 傳統影像處理 vs 深度學習:誰來定義特徵?19-2 深度學習任務種類:偵測、辨識與追蹤19-3 OpenCV 的深度學習模組19-4 進階:AI 實作中經常出現的技術介紹▍第 20 章 OpenCV 人臉偵測20-1 人臉偵測基礎20-2 用 Haar Cascade 方法進行人臉偵測20-3 用 SSD 深度學習模型進行人臉偵測20-4 用 YuNet 深度學習模型進行人臉偵測20-E 小專案:觀察不同方法的即時人臉偵測▍第 21 章 OpenCV 人臉辨識21-1 本章共通觀念:準備環境、人臉訓練資料21-2 透過傳統 LBPH 方法進行人臉辨識21-3 透過深度學習的 SFace 模型進行人臉辨識21-4 生活中的人臉辨識應用情境21-E 小專案:即時人臉辨識系統▍第 22 章 OpenCV 物件偵測22-1 什麼是「物件偵測」?22-2 使用 YOLO 深度學習模型進行物件偵測22-3 從 YOLO 結果中篩選物件類別22-4 補充:YOLOv8 的不同大小模型22-E 小專案:即時攝影機 YOLO 偵測與生活應用▍第 23 章 OpenCV 物件追蹤23-1 什麼是「物件追蹤」?23-2 本章共通函式:追蹤器與 ROI 框選23-3 KCF 追蹤器23-4 CSRT 追蹤器23-5 自動偵測並追蹤:透過 YOLOv8 + KCF 實現自動追蹤23-6 補充:其他 OpenCV 提供的追蹤器23-E 小專案:「視覺化」追蹤軌跡與應用情境▍第八部分 OpenCV 日常生活實用專案▍專案 1 讓電腦自己玩遊戲!挑戰 Chrome 小恐龍專案1-1 觀察與拆解:這個問題可以自動化嗎?專案1-2 事前準備:安裝相關套件專案1-3 鎖定範圍:螢幕截圖與 ROI 選取專案1-4 分析畫面:背景差異分析與障礙物偵測專案1-5 組裝程式:讓電腦自動遊玩!專案1-6 驗證成果:測試結果與觀察專案1-7 未來展望:如何讓小恐龍可以跑得更遠▍專案 2 當電腦學會「看懂」遊戲:自動玩 2048專案2-1 觀察與拆解:讓程式先「看懂」棋盤專案2-2 事前準備:安裝相關套件、準備影像素材專案2-3 鎖定範圍:螢幕截圖並將格子定位專案2-4 分析遊戲:使用「模板匹配」進行數字辨識專案2-5 實作遊戲機制:模擬 2048 遊戲機制專案2-6 進行解題:貪婪策略專案2-7 監控視窗:觀察遊戲進行的狀態專案2-8 組裝程式:由主程式作為進入點開始遊戲!專案2-9 驗證成果:測試結果與觀察專案2-10 未來展望:如何更有效率且穩定地解出 2048▍專案 3 刷臉就開門?自製居家智慧人臉門禁專案3-1 觀察與拆解專案3-2 事前準備:Telegram Bot 申請與人臉資料集專案3-3 人臉偵測:用 YuNet 找出人臉位置專案3-4 讓程式「認識」有哪些人專案3-5 人臉辨識:拿特徵向量跟資料庫逐一比對專案3-6 門禁反應:記錄並顯示結果專案3-7 組裝程式:完整的即時攝影機門禁流程專案3-8 實際測試:站到攝影機前,你能成功通過門禁嗎?專案3-9 未來展望:如何優化門禁?▍專案 4 貓咪偷進廚房怎麼辦?自製智慧寵物攝影機專案4-1 觀察與拆解:如何實現一個智慧居家攝影機?專案4-2 事前準備:建立 Telegram Bot 與環境設定專案4-3 接通攝影機:讀取即時影像專案4-4 偵測寵物:讓 YOLO 找出畫面中的寵物專案4-5 框選禁區:只要目標進入就算入侵專案4-6 Telegram 截圖通知:讓手機看到現場畫面專案4-7 組裝程式:從偵測、判斷到通知的完整流程專案4-8 實際測試:讓寵物走進警戒區看看專案4-9 未來展望:讓居家寵物攝影機更聰明▍專案 5 動手做自己的簡易版 Photoshop!專案5-1 觀察與拆解:把修圖軟體的功能拆成一個個零件專案5-2 事前準備:透過 Tkinter 開啟檔案專案5-3 雙視窗顯示(影像、控制)與自動視窗排版專案5-4 影像處理相關函式專案5-5 影像標註工具專案5-6 影像狀態列實作專案5-7 組裝主程式流程專案5-8 實際測試:測試我們自製的簡易版 Photoshop!專案5-9 未來展望:讓自製的 Photoshop 有更多豐富的功能!
| 書名 / | OpenCV全攻略! AI影像辨識×電腦視覺實戰手冊 |
|---|---|
| 作者 / | 翁健豪 |
| 簡介 / | OpenCV全攻略! AI影像辨識×電腦視覺實戰手冊:內容介紹:從傳統影像處理到AI影像辨識讓你擁有獨立開發電腦視覺應用的能力OpenCV是目前最為廣泛使用的電腦視覺工具之一,無論 |
| 出版社 / | 旗標科技股份有限公司 |
| ISBN13 / | 9789863128670 |
| ISBN10 / | |
| EAN / | 9789863128670 |
| 誠品26碼 / | 2683176951000 |
| 頁數 / | 688 |
| 注音版 / | 否 |
| 裝訂 / | P:平裝 |
| 語言 / | 1:中文 繁體 |
| 尺寸 / | 23*17*3.3 |
| 級別 / | N:無 |
| 重量(g) / | 1202 |
| 提供維修 / | 無 |
最佳賣點 : 一本打通影像處理與 AI 辨識!