はじめてからの統計検定2級合格体験記

前提

  • 理系大学・大学院卒業
  • 高校・大学時代に統計学は履修していない
  • 数学はあまり得意ではないが、数式を読むのに抵抗はない

統計検定の受験勉強を始めるまで、統計学は学んだことがなかったのでゼロからのスタートです。専攻は化学だったので、研究で統計知識を使うこともありませんでした。

勉強方法

統計検定2級を受ける人御用達の「統計学の時間」をまず読みました。

統計学の時間 | 統計WEB
「統計学の時間」では、統計学の基礎から応用までを丁寧に解説しています。大学で学ぶ統計学の基礎レベルである統計検定2級の範囲をほぼ全てカバーする内容となっています。学習ページは、数式ばかりではなく具体例を多数掲載し、はじめて統計学を勉強する方...

試験範囲がよくまとまっていますし、適宜例題もあって大変わかりやすいです。まず軽くでいいので目を通すことをお勧めします。

次に過去問2018~2021を解こうとしましたが、2021年6月の問題を見てみて全然まったくちっともわからなかったので、知識を入れるために別の問題集を解くことにしました。後で知ったのですが、2021年6月の問題は過去一難しかったと言われていて、初見で解けないのもあたりまえなのでした。わたしはここで過去問から引き返してしまいましたが、過去問全体を通してみて難易度や出題傾向を把握してもいいと思います。

「統計学の時間」は見たけれどまだ理解はできていない状態だったので、問題を解きながら知識の定着ができる本を探しました。Amazonで評判のよかった、『心理統計学ワークブック』を購入。

タイトルのとおり心理学向けの問題集で、統計検定2級の範囲やポイントからは少しずれますが、内容的には教育的で、解説が丁寧でよかったです。これを解いたことによって推定や検定のところについて理解が深まりました。解きながらわからないところは『心理統計学の基礎』で調べつつ、なんとなくわかった気がする、というところまで持って行きました。

「統計学の時間」と『心理統計学ワークブック』を終えるまでに1ヶ月半くらいかかりました。

一通り『心理統計学ワークブック』を終えたので、過去問リベンジです。

2021年6月はやはり難しく、この難易度だったらどうしようと不安になりましたが、それ以前の問題を解く中で出題傾向が見えてきて、「このパターンはこう解けばいいな」というのがだんだんわかってきました。CBT(パソコン)受験は2013年以前の問題と傾向が似ているという噂を目にしたので、2011~2013年の公式問題集も購入して解きました。

過去問を解く中でも、第一種の過誤と第二種の過誤のところが理解できずに苦しみました。

二つの分布があって、第一種の過誤αと第二種の過誤βが塗り分けられている図です。

第一種の過誤は「帰無仮説が正しいときに帰無仮説を棄却する確率」という意味ですが、「帰無仮説が正しいとき」ってなんや〜?これが分布の図とどう関係があるのか〜?というのがなかなか理解できず。

調べたり考えたりしてわかったことを最後に記します。間違いがあればご指摘くださいm(_ _)m

ここがわかったことによって、検定についてある程度「腹落ち」することができて、スムーズに問題が解けるようになりました。あと勉強のポイントとしては、推定と検定の関係についても理解しておくといいと思います。

過去問は3回ずつ解きました。最後の一回は時間を測って解きました。試験時間内に余裕を持って解き終わるように、一度は通しで解いてみることをお勧めします。

ちょうど案件の待機時間だったので、1ヶ月弱は仕事の時間をまるまる使って勉強することができました。案件が始まってからしばらくは生活の変化に慣れるのに必死で週末しか勉強できませんでした。その間に記憶や集中力が薄れてしまったと感じるので、平日も少しでいいので勉強を続ける習慣にした方がいいと思います。最後の2週間は過去問を解いたり、要点を整理したメモを作ったりして過ごしました。この要点整理メモを作ったおかげで、知識を「腹落ち」レベルまで持っていけたと思います。

過去問を解いてばかりいると、知識がバラバラ状態になるので、一周したタイミングで軽く知識を整理しておくと二週目が捗ると思います。わたしは一周したタイミングと、二周したタイミングでまとめを作りました。

2023年6月追記:今調べてみたら、統計検定2級のCBT対応問題集があることに気がつきました。2023年1月に出ていますね。こちらは未読ですが、これから受けようという方はまずこちらから取り組んでみるのがいいかもしれません。

受験

試験はOdysseyの試験会場で受けることになります。

わたしは1時間ほど早く試験会場に着いたのですが、試験会場で待つことができなかったため、近くのスタバで最終確認をしました。この点はちょっと注意です。

試験を受けるにあたっては、後から見返すことができるので、わからなかったらチェックをつけてどんどん飛ばして、全体を見てから落ち着いて解くことをお勧めします。わたしは緊張するとドキドキして記憶が吹っ飛ぶのですが、確実に解ける問題を解くうちに落ち着いてきます。わたしの場合、10分くらい時間に余裕を持って解き終わることができたので、過去問が解けていれば時間が足りないということはないと思います。

感想

統計検定2級を取ったからといって、すぐにデータサイエンスばりばりわかるようになる、ということはありませんが、基本的な統計の知識があることはデータ分析において必須なので、知識を効率よく勉強する機会として受験はおすすめです。

資格って役に立つかどうかでいうと必ずしも業務に直結しないと思うのですが、体系的に勉強する機会を提供してくれて、しかも会社や転職で評価対象になるわけなので、トータルで見るとメリットが大きいと思います。業務で必要になったことをその都度調べているだけだと知識に偏りが出てしまうんですよね。資格試験の教科書ってよくまとまっています。試験が近づいてくるとやだ〜試験受けたくない〜と毎回思っていますし、試験直前はドキドキして早く終わってほしいとしか考えていないのですが、受かっていると苦労も全部吹っ飛んで、受けて良かったなと思います。(落ちることもありますが。。。)将来的には統計検定準一級も受けたいなと考えています。道のりは遠いですがコツコツやります!

検定について

二つの分布があって、第一種の過誤αと第二種の過誤βが塗り分けられている図について理解したことをまとめます。

図の二つの分布は、そもそも「帰無仮説が正しいときの検定統計量の確率分布(帰無分布)」と、「ある対立仮説(いろいろあります)が正しいときの検定統計量の分布」なんですね。帰無仮説は統計量がある値に等しいとする仮説なので、対立仮説は統計量がある値に等しくないときで、統計量はある値以外いろいろな値を取れます。だから対立仮説の分布は複数作れることになります。

まず棄却ということですが、「確率が低すぎてめったにおこらないことだから、今回もその事象は起きていないと判断する」ということですね。

棄却するかどうかの基準があるとき、帰無分布において基準よりも大きい部分の面積は、「帰無仮説が正しいときに帰無仮説を誤って棄却するときの確率」で、逆に対立分布において基準よりも大きい部分の面積は、「対立仮説が正しいとき誤って対立仮説を棄却する(帰無仮説を採択する)ときの確率」になります。

検定についてもおさらいしておきます。

帰無仮説が正しいと仮定したときの統計量の分布(帰無分布)において、データから求めた検定統計量のラインよりも大きい部分の面積(p値)と、棄却するかどうかの基準よりも大きいところの面積(有意水準)とを比較します。よく使われる有意水準は5%ですね。有意水準よりもp値が小さい場合は、データから得られた検定統計量がその値になることはめったに起きないということなので、帰無仮説を棄却しますが、誤って棄却していて帰無仮説が正しい確率(第一種の過誤)が有意水準の確率で発生することになります(第一種の過誤の定義を思い出してください)。そのため、帰無仮説を誤って棄却してしまう確率を減らすためには、有意水準を小さくすれば良いということになります。これは直感的にも理解しやすいですよね。「めったに起きない」の判定ラインを小さい確率にしておけば、めったに起きない度合いが高くなるので、本当にめったに起きなくて安心して棄却できるということです。

コメント

タイトルとURLをコピーしました