統計的データクリーニングの理論と実践 | 誠品線上

統計的データクリーニングの理論と実践

作者 Mark van der Loo/著;Edwin de Jonge/著;地道正行/訳
出版社 日本出版販売株式会社
商品描述 統計的データクリーニングの理論と実践:統計的なデータクリーニングシステムを構築するための包括的なガイドデータクリーニングとは、入手した原データを、分析に耐えうる

內容簡介

內容簡介 統計的なデータクリーニングシステムを構築するための包括的なガイドデータクリーニングとは、入手した原データを、分析に耐えうる品質にするために、エラーや矛盾する値を検出・修正し、欠測を補完する作業のことで、データ分析においてしばしば最も時間のかかるプロセスである。公的統計分野において、この分野は「データ編集」とも呼ばれ、この50年余に多くの知見が蓄積されてきたが、一般の統計のコミュニティにおける文献は多くない。本書は、2013年に開催された世界規模のRユーザーカンファレンスであるuseR!2013において行われたデータクリーニングのチュートリアルがきっかけとなり,オランダ統計局の研究部門に所属する著者によって書かれている。近年のビックデータ時代の到来により、調査集計を行う公的統計部局は行政記録その他の幅広いデータを取り扱うようになるとともに、より広い分野においてもデータの入手が容易になったためにデータクリーニングの要請は広がり、公的統計分野での知見はより多くの分野で役立つ可能性を持っている。著者は、本書で紹介されるデータ検証やエラーの局所化、エラー修正のための様々な方法や欠測値の補完といった様々なデータクリーニングのためのRのパッケージの多くを開発しており、実際に使用するためのコード例も豊富に掲載され、数値やテキスト、日付等のデータの取り扱いや、数値計算時の留意点など、プログラミングに関する内容も収録されている。本書の特徴データ分析を行う際に、しばしば最も手のかかるデータクリーニングに焦点を当て、理論とRによる実装の双方向から解説アドホックで、データ毎に異なるカスタムメイドのクリーニングシステムではなく、汎用性を重視した構築の方法論も解説データの矛盾を解消し、欠測を補完するための統計的手法、バッチ処理化やデータ変遷のモニタリングについても解説〔原著〕Statistical Data Cleaning with Applications in R, Wiley, 2018. そのままでは分析できない生データのエラー値や欠測値を検出・修正・補完し,分析可能な品質を確保するための統計的手法を説明する。

商品規格

書名 / 統計的データクリーニングの理論と実践
作者 / Mark van der Loo 著;Edwin de Jonge 著;地道正行 訳
簡介 / 統計的データクリーニングの理論と実践:統計的なデータクリーニングシステムを構築するための包括的なガイドデータクリーニングとは、入手した原データを、分析に耐えうる
出版社 / 日本出版販売株式会社
ISBN13 / 9784320114630
ISBN10 /
EAN / 9784320114630
誠品26碼 /
裝訂 / P:平裝
頁數 / 350
語言 / 4:日文
級別 / N:無
尺寸 / 25.7X18.2X1.9CM