統計学とは?どんな学問か大学の授業を説明する
統計学と聞いてどんな学問だと想像するでしょうか?
小中学生のときに、とうもろこしの輸入先の円グラフを見て、アメリカが一位だと読み取ってみたことや、テストのデータを柱状グラフで描いてみたことを思い出すかもしれません。
また、高校数学で平均値とか四分位数とかを勉強したことを思い出すかもしれません。
そのような、「グラフや平均値などを用いて特徴を理解すること」も立派な統計学と言えます。
しかし、これは統計学の全てとは言えないのです。
統計学とは
まずは辞書的な意味
統計学とは
確率論を基盤にして、集団全体の性質を一部の標本を調べることによって推定するための処理・分析方法について研究する学問。
引用:大辞林
はい。全然わかりません。
そして、これは統計学の一部の説明(後に説明する推測統計の部分)しか無いので、実は少し不十分です。
統計学は主に記述統計と推測統計から構成される
統計学には、記述統計と呼ばれるものと、推測統計と呼ばれるものの主に2種類があります。
グラフみたり、平均値を計算したりして、持っているデータの特徴を記述する統計学を記述統計と言います。
わかっている一部のデータから、わかっていない他のデータの特徴を推測する統計学を推測統計と言います。
統計学とは何かと聞かれたら、これら2つのことだと説明すればよいのです。
重要なのは推測統計
記述統計というのは統計学の一部であり、実はそれほど重要ではありません。
統計学で一番重要なのは、推測統計の方です。
既知のデータを用いることで、未知のデータがどんな状態か・どんな特徴を持つかを数値的に推測するというのはかなり強力で、人を説得する材料になります。
どれだけ凄いか、具体例を上げてみましょう。
推測統計を使う具体例:選挙の出口調査
例えば、選挙の出口調査を考えてみましょう。
選挙が終わる頃、各マスコミでは、どの党がどれだけの議席を得そうかを報道しています。
誰が当選確実かどうかまで、開票作業が終わっていないのにわかっています。
これは投票をした人に対して、どこに投票したのかを聞くことで予想しています。
ですが、もちろんすべての人に聞けるわけではありません。無作為に選んだ何百人から得られたデータから、全体の結果を推測しているのです。
投票する地域や、候補者によっても異なってくるのですが、384人に聞けば誤差5%以内でその候補者の得票率の予想される範囲を95%の信頼度で求めることができます。
これは、推測統計を用いることで算出しているのです。
おわりに
今出した例のように、統計学は日常的な様々なところで用いられています。
現代社会にあふれる様々な情報が、嘘か本当なのかを見抜くためにも統計の知識は必須とも言えるでしょう。
プログラミング言語を使って、統計的にデータを解析することも多いです。
R言語を使ってプログラミングと統計を学びたい方は下を参照してください!
ディスカッション
コメント一覧
まだ、コメントがありません