荷物持ちでも構わない

文系大学4年生からデータサイエンティストを目指して頑張りつつ、書きたいことを書きたいときに書きたいだけ書く、ルール無用雑記ブログ。

MENU

【文系向け】統計学の基本を数式なしで学べるオススメ入門書5冊

今回は、数学苦手なド文系だけど独学で統計学を勉強している僕が、数式なしで統計学の基礎を学び、素養を身に着けることができる統計学の読み物をご紹介したい。

統計学の理論や手法を理解して実際に複雑な統計解析ができるようになるのを目指すというよりは、

「統計マインド」を育てて統計データを適切に読み、扱えるようになるような本を集めた。

そのため、統計学の知識がなくて勉強したい人、文系で数学が苦手な人、仕事で統計データを見る機会が多い人に特に読んでほしい本たちとなっている。

それでは本題へどうぞ。

1.『データ分析の力 因果関係に迫る思考法』

1冊目は、『データ分析の力 因果関係に迫る思考法』。

2017年4月の発売と新しめの本で、Amazonのレビューも☆4.5と非常に高い評価を得ている本だ。

「相関関係」と「因果関係」の違いに騙されない目を養うための本

これはどういう本かというと、「データを分析する力はもはやアナリストのような専門職だけに求められる力ではない」ということを前提に、

ビッグデータの時代と言われ、そこら中に溢れかえる統計データから、「因果関係」を適切に見抜くための思考法と、そのために使われる分析手法を紹介している本だ。

もちろん数式はほとんどなく、文章だけで理解できるような構成になっている。

ある変数Xが増加(減少)したとき、もう1つの変数Yも増加(減少)するという現象が見られたとき、その2つのデータXとYには「相関関係がある」と言う。

しかし、Xが変化したことが原因になってYが変化したという「因果関係」があるのか、あるいはその逆なのか、それとも全く別の要因が絡んでいるのかは、相関関係があることを確認するだけではわからない。

統計データ間の「因果関係」を見抜くのは、一筋縄ではいかない大変な作業なのだ。

本書では、その因果関係を見抜くための手法として、

  1. ランダム化比較試験
  2. RDデザイン
  3. 集積分析
  4. パネル・データ分析

という4つの分析手法を、現実の事例を交えながら説明しており、難しい数式と格闘する必要なく、「因果関係を見抜く統計マインド」を養うことができる。

相関関係と因果関係の違いは、統計屋でも騙されることがある問題なので、実際に仕事で統計データを扱っている人なんかは絶対に読むべき本だと思う。

2.『数式を使わないデータマイニング入門 隠れた法則を発見する』

2冊目は『数式を使わないデータマイニング入門 隠れた法則を発見する』。

2006年5月の発売で少し古いが、Amazonのレビューは☆3.5とまずまずの評価だ。

膨大なデータから手がかりを"発掘"する「データマイニング」の手法を学ぶ本

これはどういう本かというと、まず「データマイニング」という言葉を従来の「統計解析」と区別し、

既に用意されている膨大なデータから未来を予測する手がかりを掴むこと」をデータマイニングの定義として、データマイニングに使われる分析手法を、数式なしで紹介している本だ。

  1. 回帰分析
  2. 決定木
  3. クラスター分析
  4. 自己組織化マップ
  5. 連関規則
  6. ニューラルネット

という7つのデータマイニング手法について解説している。

昔と比べてデータの蓄積コストが大幅に下がったおかげで、昨今はデータを蓄積し、それを分析することでビジネスに活かすということが容易になった。

そして、データが膨大な分、データから何らかの法則を見つけ出すことも非常に簡単になった。

しかし、データマイニングで見つけることができる法則はほとんどが役に立たないもので、本当にその法則が役に立つのか、どういう目的で法則を探すのか、ということを考えて行う必要がある、と本書では説いている。

統計データに"使われる"のではなく、"使いこなす"ことができるようになるために重要な一冊だ。

3.『会社を変える分析の力』

3冊目は、『会社を変える分析の力』。 

2013年7月の発売で、Amazonのレビューは☆4となかなか高い。

ビジネスでデータ分析を行うために必要な考え方を身に着けるための本

この本は、先述の2冊とは違い、データ分析で使われる統計解析の手法について紹介する本ではなく、データ分析を行うのに必要な本質的な力を養い、「分析プロフェッショナル」になることを目的とした本である。

この本によれば、データ分析というのは、ただ数値計算をして統計解析を行い、必要なデータを見つけ出せばいいというだけのものではない。

データ分析というのは、ビジネスにおいて、意思決定に役立つ手がかりを提供することに本質があるというのである。

そのためには、数学や統計学を勉強して、分析手法を学ぶことも大切なことではあるし、この本ではそういった力を「分析力」と呼んでいる。

しかし、「分析力」を鍛えるだけでは「分析プロフェッショナル」にはなれず、「分析プロフェッショナル」になるためには、

ビジネス課題を見つける「問題発見力」と、データ分析によって得られた知見を経営者にわかりやすく伝え、実行させる「実行力」が必要であると説いている。

そして、この3つの力を備え、実践できる分析者のことを「フォワード型分析者」と呼び、データ分析でビジネスを変えるためには「フォワード型分析者」を目指さなければならないと言う。

データ分析の仕事を任されているが思うような成果が上げられない人、これからデータ分析の仕事に携わろうとしている人にオススメの一冊と言えよう。

4.『統計数字を疑う なぜ実感とズレるのか?』

4冊目は『統計数字を疑う なぜ実感とズレるのか?』。 

2011年11月の発売で、Amazonのレビューは☆4と高い。

経済統計の「数字のトリック」に騙されないための本

この本は、日常生活で当たり前のように触れている統計データを鵜呑みにするのではなく、そのデータが本当に実態を表しているのかどうか疑ってかかるべきだ、という数字のトリックを暴く本である。

例えば、有名な統計数字のトリックの話に、平均年収の話がある。

平均年収はいろいろなところで目にする統計データだが、なぜだか、年収が平均より下回る人が圧倒的に多い。

これは、「平均値」という統計指標が持つ、「"外れ値(極端な値)"の影響を受けやすい」という性質が原因で起こる現象だ。

ごく一部の大富豪が平均年収を吊り上げていることで、平均を下回る人が大量に生まれてしまうというトリックである。

このように、この本では「統計データ」と「実感」のズレがどうして起こるのか、という統計数字のトリックについて、実際のデータを扱いながら解説している。

特に、GDPや景気動向指数、消費者物価指数というような、経済に関する統計データを中心に扱っているため、データ分析を行う人のための本というよりも、

ニュースや新聞などで統計データを目にする人全般に向けた一冊と言える。

5.『統計学が最強の学問である』

 最後の5冊目は、『統計学が最強の学問である』。

2013年1月の発売で、Amazonのレビューは☆3.5とまずまずの評価。

シリーズ本がたくさん出ているが、今回はその最初の1冊を紹介する。

あらゆる分野で使われるツールである統計学の基礎を学ぶ本

『統計学が最強の学問である』とはなかなかパンチの効いたタイトルだが、タイトルだけでなくしっかりと中身の伴った一冊だと思う。

統計学は、心理学やマーケティング学、自然科学、疫学、教育学、果てはスポーツにまで、あらゆる分野で使われる学問であり、昨今のデータで溢れた時代を生きていくためには「統計リテラシー」が必須であるということを説いた本なのだ。

前半は、実際に統計学が使われている各分野の事例を交えながら統計リテラシーを育てていく内容になっており、

後半では、より具体的な統計解析手法を、数式なしで説明する内容になっている。

前半は単なる読み物として気楽に読み進めていける内容になっているが、後半は専門用語が大量に出てくるので、統計の知識がゼロという人にとっては難しすぎるかもしれない。

むしろ、僕のような統計学の初学者が知識の補強として読むのにちょうどいいような難易度に感じた。

特に、t検定や分散分析、カイ二乗検定といった、一見バラバラに思える分析手法が、全て「一般化線形モデル」という回帰分析の拡張としてまとめられることはこの本を読むまで知らなかった。

Amazonのレビューを見るとかなり評価が真っ二つに割れているように感じたが、僕は間違いなく良書だと思う。

統計学を初めて勉強する人が最初の1冊として買うのにはオススメしないけれども、統計学の勉強を始めて少し経った頃の初級者から中級者へステップアップしようとしている頃に読むと威力を発揮する一冊だと思う。

シリーズ本がたくさん出ているので、余裕があればそちらも併せて読んでみたい。

おまけ:もっとしっかり本気で統計学を学びたい人へ

本気で統計学の基礎を学ぶなら、僕は間違いなく『心理統計学の基礎』をオススメする。

今回の記事で紹介した読み物と違い、ガッツリ数式が盛り込まれたかなり歯応えのある本だが、何度も読み返せば数学が苦手な文系でもちゃんと理解できるようになっている。

詳しくは以下の記事で説明しているのでこちらを参照のこと。

www.messyer813.com

まとめ

というわけで、数学が苦手な文系でもわかる、数式なしで統計学やデータ分析の基本を身に着けられる読み物を5冊紹介した。

統計学は率直に言って難しいし、数学が苦手な人間にとっては数式を見るだけでも大変な苦労を伴うので、最初に統計学の素養を身に着ける意味でこうした読み物を読むのは有益だと思う。

ちなみに、

2.『数式を使わないデータマイニング入門 隠れた法則を発見する』

4.『統計数字を疑う なぜ実感とズレるのか?』

の2冊は、Kindle Unlimitedの無料読み放題の対象となっている。

Kindle Unlimitedは、月額980円で対象の本が読み放題となるAmazonのサービスで、

対象の本も種類が多く、いろいろな本を自由に読み漁れるのでオススメだ。

今回の記事で興味を持ってくれた方は、ぜひKindle Unlimitedに加入して、今回紹介した本を無料で読んでみてほしい。

 

↓Kindle Unlimited登録はこちらから↓