かけだしデータサイエンティストのG検定合格体験記

前提

  • 業務でAI, 機械学習を使っている(本格的に業務に関わるようになって1年半ほど)
  • 機械学習(scikit-learnの範囲)については本で勉強済み&実務で使用中
  • ディープラーニングの知識は『高校数学からはじめるディープラーニング』を読んだ程度

G検定について

公式ページによると、

ディープラーニングの基礎知識を有し、適切な活用方針を決定して、事業活用する能力や知識を有しているかを検定する。

G検定とは
ディープラーニングの基礎知識を有し、適切な活用方針を決定して、事業活用する能力や知識を有しているかを検定する。

勉強方法

まず公式テキストを読んで、内容をEvernoteにまとめました。次に用語をネットで調べて、用語のページを作り、公式テキストのページの用語のところにリンクしました。Evernoteはノートリンクができるのですが、一つ一つ手でリンクする必要があり、しかもデフォルトではブロックタイプの挿入になるのでいちいち文字リンクに変換して…という処理が必要でした。めちゃくちゃめんどくさかった…このノートリンク形式は用語の関連をノートにまとめつつ、各用語の詳しい説明も載せることができてとてもよかったのですが、手間がかかるのでおすすめしません。

公式テキストはこちら。通称「白本」と呼ばれているようです。

まとめノートは↓のような感じです。緑色の文字のところが用語のページのリンクになっています。このスタイルだと、用語のページを更新していけば、どのまとめノートで用語を参照したときにも最新版をリンクできるというメリットがあります。

いま応用情報技術者試験の勉強をしているのですが、Notionのデータベースを利用してノートを作っています。これだと名前を入力するだけでその名前のページができるので、リンクを貼る手間がかかりません。あと、テキストを設定したプロパティに概要を書いておくと、データベースのテーブルボード上にも用語のページにも概要が表示されるのでとてもいい感じです。ただ、データベースだと用語間の関係を表現しにくいのが難点ですね。

応用情報のテキストのページではなくて、IT技術用語のページを作ってそのデータベースに記載しています。こうすることで重複なく用語のページを作れるはずです。まだ試験を受けていないので、このスタイルでうまくやれるかはこれから検討ですね。単元でフィルターしたり、重要度でフィルターしたりして、ざっと流し見すれば効率よく勉強できるかなと思っています。

用語のページはこんな感じです。プロパティ「要約」のところに書いた文章が自動的に用語のページにも表示されます。これすごく便利ですね!詳しく調べた内容については下の白紙ページのところに記載していき、要約の文章をブラッシュアップしていく予定です。

ちょっと脱線しました。

ノートを作成した後は、白いほうの問題集を解きました。(白本というと公式テキストのことみたいです)

G検定の問題集は通称黒本もあるのですが、解説が詳しいとレビューに書かれていた白いほうの問題集にしてみました。

実際、白い問題集は問題あたりの解説の量が多く、わかりやすかったので購入して良かったと思います。黒本の中を見ていないので、どちらがいいのかは比較できませんが…

白い問題集を解いて、用語の概要の文章をブラッシュアップしてまとめノートと用語ノートの両方を更新しました。問題は2回ほど解きました。

公式テキストは6章「ディープラーニングの手法」の難度が高いです。画像認識や自然言語処理、強化学習などのさまざまなモデルについて概略が列挙されていますが、詳しい説明がないので理解が難しいです。ネットで調べてみても簡単に説明されているサイトはなかなかなくて、ここは勉強が大変でした。しかしG検定の試験においてはそれほど難しいことは聞かれず、GoogLeNetだったらInceptionモジュール、ResNetだったらSkip connectionとResidual Blockなど、それぞれのモデルとその概要と関連する用語について基本的な知識があれば問題は解けます。このあたり、E資格の参考書(問題集)を読んでみるといい感じにまとまっているのではないかと思ったのですが、シラバスが改定されてから新しい版が出ておらず、しかも紙本で6000円以上するので今回は購入しませんでした。(2023年5月27日時点でKindle版は半額になっていますね…買っちゃおうかな)

公式テキストと白本の解説ではCNN(畳み込みニューラルネットワーク)の説明が理解できなかったので、『ディープラーニングAIはどのように学習し、推論しているのか』を購入しました。タイトルがイマイチなのですが、この本めちゃくちゃわかりやすかったです。ニューラルネットワークとCNNについてこれ以上ないほどわかりやすく詳しい説明がしてあります。数式をできるだけ使わないで説明してあるので、厳密性には欠けるのでしょうが、意味を理解するための最初の一冊としてとてもおすすめです。

8章の「ディープラーニングの社会実装に向けて」からも結構出題されていました。こちらは白い問題集の問題数が少なく、興味もあまりなかったため対策が甘かったです。実際正答率も60%台でした。問題をたくさん解くのがいいと思うので、その点で言うと黒本を買っても良かったかもしれません。

受験

G検定は自宅のPCで受験することができます。事前にユーザー登録が必要なので、受験する前に登録して動作確認をしておくことをおすすめします。

感想

G検定受けて本当に良かったです。前述の通り、機械学習(scikit-learnの範囲)については勉強したことがありましたが、ディープラーニングについて体系的に勉強したことがありませんでした。公式テキストを読んで知識を入れることができ、いま話題のGPTについても「TってTransformerのことよね」とわかるようになりました。業務で使っているとどうしても実務上のこと、実装上のことに集中してしまうと思うのですが、歴史的背景や理論について少しでも触れられたことによって、最新ニュースにも(ちょっと)ついていけるようになりましたし、これから勉強する土台ができたと思っています。試験自体はそれほど難しいわけではありませんし、いま業務でバリバリやっている方々にとってはテキスト自体もおもしろいと思うので、ぜひ受けてみてください。いつかはE資格もとりたいな〜と思っています。

コメント

タイトルとURLをコピーしました