內容簡介
內容簡介 ◆◆機械学習の成否を分かつ「前処理」◆◆◆◆実務に直結するテクニックを習得◆◆データ分析技術の中心には、分析アルゴリズムやモデリング手法があります。しかし実務の現場では、むしろ「前処理」の重要性に直面します。その方法は「分析目標」と「データ形式」によって異なり、そこからどのように特徴量を作り出すかで、機械学習の成否が左右されます。本書では、構造化データ、画像データ、時系列データ、自然言語について、機械学習における前処理の手順を紹介。演習問題を経て、Pythonによる実装までを体験します。データ分析のフレームワークCRISP-DMに沿って実装を進めるので、実務に近い形で前処理のテクニックが身に付きます。◆◆本書の主な構成◆◆第1章 データ分析・活用を始めるために1 データドリブンな時代へ2 データ分析プロジェクトに必要な要素3 データ分析人材のスキル第2章 データ分析のプロセスと環境1 ビジネス理解2 データ理解3 データ準備4 モデル作成5 評価6 展開・共有7 データ分析環境の選択8 Jupyter Notebook の使い方第3章 構造化データの前処理1 データ理解2 データ準備3 モデル作成4 再びデータ準備へ5 再びモデル作成へ練習問題の解答第4章 構造化データの前処理(2)1 顧客の特性を知る2 顧客のグループ化3 潜在ニーズの抽出第5章 画像データの前処理1 データ理解2 機械学習のためのデータ準備3 深層学習のためのデータ準備練習問題の解答第6章 時系列データの前処理1 データ理解2 データ準備3 教師データの作成練習問題の解答第7章 自然言語データの前処理1 データ理解2 機械学習のためのデータ準備3 深層学習のためのデータ準備4 トピック抽出のためのデータ準備付録1 JupyterLab ローカル環境の構築2 画像認識モデルの作成3 記事分類モデルの作成4 記事トピックの抽出5 様々な可視化ツール ◆◆本書の主な構成◆◆第1章 データ分析・活用を始めるために1 データドリブンな時代へ2 データ分析プロジェクトに必要な要素3 データ分析人材のスキル第2章 データ分析のプロセスと環境1 ビジネス理解2 データ理解3 データ準備4 モデル作成5 評価6 展開・共有7 データ分析環境の選択8 Jupyter Notebook の使い方第3章 構造化データの前処理1 データ理解2 データ準備3 モデル作成4 再びデータ準備へ5 再びモデル作成へ練習問題の解答第4章 構造化データの前処理(2)1 顧客の特性を知る2 顧客のグループ化3 潜在ニーズの抽出第5章 画像データの前処理1 データ理解2 機械学習のためのデータ準備3 深層学習のためのデータ準備練習問題の解答第6章 時系列データの前処理1 データ理解2 データ準備3 教師データの作成練習問題の解答第7章 自然言語データの前処理1 データ理解2 機械学習のためのデータ準備3 深層学習のためのデータ準備4 トピック抽出のためのデータ準備付録1 JupyterLab ローカル環境の構築2 画像認識モデルの作成3 記事分類モデルの作成4 記事トピックの抽出5 様々な可視化ツール
作者介紹
作者介紹 足立悠BULB株式会社所属のデータサイエンティスト。過去にメーカーのSE やデータサイエンティスト、IT ベンダーのデータアナリスト等を経て現職。数々のデータ分析プロジェクトのほか、実務者教育にも従事。個人的な活動として、記事や書籍の執筆、セミナー講師なども行っている。著書に『初めてのTensorFlow』と『ソニー開発のNeural Network Console 入門』がある。多感な時期に高専で5年間を過ごしてしまったせいか、周囲から変人や外れ値と評されている。趣味はお地蔵さんが密集している場所に佇むこと。近いうちに、日本を北から南へ移動しながら仕事し、パフォーマンスを測定してみたい。