『データサイエンス超入門』工藤卓哉、保科学世

 日経BP社。副題『ビジネスで役立つ「統計学」の本当の活かし方』。
 データサイエンスというと、何らかのデータを使って何か新しいことでも見つけ出す科学なんだろうなということまでは想像できる。でもそれを実際にビジネスや実務に落とし込む段階になると、一体何をやっているのかが分からない。この本はそういう疑問を持っている人にはぴったりの本だ。著者は、データサイエンスを「データ分析・活用を研究して実践するための学問および手法」と定義している。
  データサイエンスを実務に活かすには膨大なデータを操る目利き力が必要だという。このためには「データを活用したビジネスを企画する力」「データサイエンスを支える統計知識」「アナリティクスを実現するITスキル」の3つの要素を挙げる。これをひとりの人がやるのは大変だ。でもこれに加えて「コミュニケーション能力」があれば、それらを手分けして複数人でビジネスに落とし込むことができる。本書はこれらについて、丁寧に教えてくれる。
 統計学についての解説も、適当に流すことなくきちんとなされていることに好感が持てる。このことについて、統計学に基づいたデータ分析の全体像を捉えられるように、付録として構造化データサイエンスモデル(SDSM)の表がついているのが参考になる。この表には、パラメトリック検定、ベイズ確率、K-means法、協調フィルタリング、重回帰分析といったさまざまな分析手法が分類され、実務ではどのような分野に適用されているのかが書かれている。本文中で、R、SAS、SPSS、Mahoutといった統計解析ソフトウェアについて軽く触れられているのもありがたい。
 データサイエンスの担い手には3つの素養とひとつの姿勢が不可欠だという。それは、「分析の前提や限界を認識していること」「特徴次元空間を意識できること(何のことやら分からないかもしれない)」「一専多能型のコミュニケーション能力を保持していること」そして「情熱とリーダーシップという姿勢」である。私には、これはなかなか厳しい条件だと映ったが、それだけの能力が求められる大変な仕事なのだろう。これからの時代は、彼らの育成もきちんとしていく社会の仕組みが必要なのかもしれないと思った。

shizukiaki

札幌で絵やイラストを描いています。音楽や読書も好きなので、ブログではいろいろなジャンルの投稿をしています。