『データサイエンス「超」入門』松本健太郎

毎日新聞出版。「嘘をウソと見抜けなければ、データを扱うのは難しい」

データサイエンスというと、AI、機械学習、統計学などを連想することが多いと思う。でもこの本はそういう観点から書かれた本ではない。

「データの読み方」あるいは「データリテラシー」について書かれた本だ。

このことは表立っては「データサイエンス」という顔立ちをしていないけれど、おそらくはここのところをおざなりにしていると、トンチンカンな答えを導きかねない。また、世の中のニュースなどを見ても、間違った結論を正しいものと受け入れてしまいかねないだろう。

本書では実際のニュースを取り上げて、そこで述べられていることは本当に正しいのか、また、そのニュースの背景にはどんな前提なりバイアスがかかっているのかなどについて、実際のデータを用いて分析している。なお、数式は一切出てこない。

こんな例を取り上げている。

  • なぜネットと新聞・テレビで支持率がこんなに違うのか
  • 結局、アベノミクスで景気は良くなったのか
  • 人手不足なのにどうして給料は増えないのか
  • 地球温暖化を防ぐために、私たちが今できることは何か 等々

例えば、人手不足については、実質賃金指数、毎月勤労統計調査、有効求人倍率、労働力調査、全国企業短期経済観測調査等のデータを読み解きながら、その原因を探っている。

閣僚がこう言ってた。ニュースでこう言ってた。会社の同僚が教えてくれた。

そんなのじゃなくて、まずニュース等で解説していた内容を疑ってみる。同僚の解説を疑ってみる。

そして、きちんと自分でデータを探してきて、分析してみる。少しでも疑問点があればどんどん掘り下げていく。矛盾したデータが出てきたらどうしてそうなるのかちゃんと考えてみる。

そういうのがまさにリテラシーであって、そういったデータの読み方の向上を、読者に促している。

直接的なSNS等への言及はないけれど、ネットや噂で流れていることをすぐに鵜呑みにしちゃダメだよ、と諭されている気がした。自分の考えに近いツイートはすぐに信じてしまいがちだけど、そこは罠なんだよ。データサイエンス云々とかいう前に、きちんとしたデータリテラシーを身につけないと。

shizukiaki

札幌で絵やイラストを描いています。音楽や読書も好きなので、ブログではいろいろなジャンルの投稿をしています。