『現場ですぐ使える時系列データ分析』横内大介、青木義充

 技術評論社。副題『データサイエンティストのための基礎知識』。
 R言語というツールを使って、個別株の日次データを元に、時系列データ分析を教えてくれる。内容は単変量の時系列データ分析に絞っており、自己回帰モデルや単位根過程の解説に始まり、ARCHモデルやGARCHモデルまで解説している。最後の方にはクラスタリングのペアトレーディングへの活用方法が載っていて、興味深かった。これまでRを使ったことのない人でも、パソコンへの導入はもちろん、基本的な解析はできるように配慮されている。説明は丁寧なので、きちんと読めば理解できないということはないだろう。
 とはいえ、この内容は初歩中の初歩なのだという。統計的仮説検定や正規分布についての知識は当然知っているものとして扱っているし、対数や積分もわかっていなければ、本書の中の数式を理解することはできない。この本は「データサイエンティスト」のための本であって、「普通のビジネスマン」のための本ではないのだろう。そうであれば、確かにこの本は初歩的なのかもしれない。
 この本を読んでExcelで解析してみようとは思わない方がいい。本書の内容だけではExcelに落とし込むだけの詳しい数式や定義が載っていないし(例えばShaprio-Wilk検定についてのRのコマンドは載っているが、この検定がどういう計算を行って答えを出しているかということは載っていない)、たとえ違う本からそれらの知識を得たとしても、かなり面倒くさい処理を行わなければならないことになるだろう。Rというフリーソフトは統計処理のためには本当に便利なツールなのだと実感する。
 内容的にはとてもしっかりとしていて、あるモデルをあてはめたいときに、導入条件が揃っているかどうかを調べることを端折ってしまってはいけないのだということまで、きちんと書かれている。データサイエンスの世界は結構泥臭いものなのだということもわかる。これから本気で時系列データ分析を行いたい(今は)素人の人には、いい入門書なのかもしれない。でも、データ分析はExcelでできる程度でいいやと思っている人には、ハードルが高い気がする。

shizukiaki

札幌で絵やイラストを描いています。音楽や読書も好きなので、ブログではいろいろなジャンルの投稿をしています。