新卒エンジニアが1週間半でGCP資格を取得!Professional Data Engineer 合格体験記

GCP

こんにちは!株式会社KIYONOの新卒エンジニアです。
本記事は、最近受けたGoogle Cloud Professional Data Engineer資格の合格体験記です。
これからGoogle Cloud資格のProfessional Data Engineerを取得しようと思っている方向けに、
勉強開始から合格までの1週間少しで私がしたこと、してよかったこと、すべきだったことなどをまとめた記事になります。

できる限り再現性高い内容をお伝えできればと思いますので、
ぜひ最後まで読んでいただけると幸いです!

Professional Data Engineer試験範囲

試験ガイドはこちらで公開されています。

主な内容と比率については下記のように記載されています。

セクション 内容概要 出題比率
データ処理システムの設計 セキュリティ、信頼性、柔軟性、データ移行などの
設計要素
約22%
データの取り込みと処理 パイプラインの計画、構築、デプロイ 約25%
データの保存 ストレージ選定、DWH、データレイク、
データメッシュ設計
約20%
分析用データの準備と使用 可視化、共有、特徴量エンジニアリング 約15%
データ ワークロードの
管理と自動化
最適化、自動化、モニタリング、耐障害設計 約18%

データの移行からパイプライン構築、保存、分析、自動化・管理と一連の流れを網羅的にカバーしているテスト範囲となっていることがわかります。

比率で見ると、データ処理システムの設計データの取り込み、データの保存の3セクションがやや比率高めといった形になっていますね。
ここでポイントなのが、セキュリティやデプロイなどのワードがあることから、単にデータ周りのサービス理解だけでなく、セキュリティや信頼性、デプロイに関する部分も理解しておかなければいけないことがわかります。(幅広い、、、)

一つ注意として、こちらの記事でも紹介されているのですが、Professional Data Engineer は、2024年1月に試験範囲が改訂されたみたいです。
下記のように、以前には試験範囲に含まれていたML関連のAPI周り、機械学習周りの範囲が削除されて、逆にデータメッシュや新しめのサービスが範囲に追加されました。

個人的にはこの試験範囲改訂によって、より難化したんじゃないかなーなんて思ってます。

削除された範囲

  • 機械学習関連の部分
    • ML関連のAPI (Vision API、Speech API、AutoML)
    • 機械学習モデルの再トレーニング(AI Platform Prediction、AI Platform Training、BigQuery ML、Kubeflow、Spark ML)

追加された範囲

  • データメッシュ関連(Dataplex、Data Catalog)
  • Datastream
  • Dataform
  • Workflows
  • Analytics Hub
  • BigQuery Omni、BigLake

内容が古いUdemyの教材などでは、削除された範囲の問題が含まれているものもあったので、飛ばすなどして最短ルートで合格までの道筋を辿りましょう。

勉強開始から受験までにやったこと

まず初めに著者の勉強開始前の前提知識を簡単にご紹介すると、

  • 4年制大学情報系の学科卒
  • 応用情報技術者保有
  • BigQuery周りの分析業務中心で、試験範囲のほとんどのサービスは触ったことなし
  • Google Cloud資格 受験経験なし

といった具合になります。
このような状況から大体1週間半の勉強で合格することができました。
勉強方法はひたすらUdemyの問題演習です。使用したUdemy教材をこちらでご紹介しておきます。

勉強開始してから受験日までにやったこと

  • 4/24(木):
    • 教材①:第1セット(1回目)問題演習
      • 正答率は30%
  • 4/25(金):
    • 昨日受けた第1セットの復習
    • 教材①:第2セット(1回目)問題演習
      • 正答率:40%
  • 4/26(土):
    • 昨日受けた第2セットの復習
    • 教材②:第3セット(2回目)問題演習
      • 正答率:46%
    • 「サービスがわからなすぎて、点数が伸びない!」と思い、インプットに切り替え
    • 問題演習で出てきた名前のサービスをいろいろ調べて、Notionにまとめる
      • いつでも見返せる辞書的なのをNotionに作った
  • 4/27(日):
    • 電車でNotionのインプット進める
    • 夜に教材①:第1セット(1回目)
      • 正答率:65%
      • インプットの成果が出て、ちゃんと伸びた
  • 4/28(月):
    • 教材②の第2セット(1回目)
      • 正答率:78%(大歓喜)
  • 4/29(火):
    • 電車で教材①の解き直し
  • 4/30(水):
    •  電車で教材②の解き直し
  • 5/1(木):
    • 飲み会に行ったため電車の中でNotion見返す程度の勉強
  • 5/2(金):
    • 教材②の第3セット(1回目)
      • 正答率:72%
  • 5/3(土):
    • 教材②の第4セット(1回目)正答率:74%
    • 教材1〜3セット(2回目)正答率:90% 以上
  • 5/4(日):
    • 受験日

当日の手応え

    このような形で、直近3回分の模擬問題では1回も合格ラインを下回らず、解き直しでは2、3問しか間違えないくらいにまで成長したので、「まあいけるだろう」と言う気持ちで当日臨みました。

    しかし、試験開始して10問くらい解いたあたりから、わからんすぎて不合格が頭によぎりました。模擬問題集にあったようなシンプルな問題が少なく、頭を悩まして時間がすぎていくばかりでした。
    1周目で頭を悩ましても仕方なかったので、一旦50問解き終えてから、特にわからなかった問題を重点的に見直すようにました。
    (テストの機能で問題にチェックをつけて、後で見直しがしやすくなっていたので助かりました。)

    2周目の際は1周目ではよくわからなかった問題も意外と理解できて、「なんだそう言うことか」となることが多く、テスト提出の際には多分受かっただろうと言う手応えでした。

    模擬問題集では1時間かからずに見直しまで終わるようなスピード感で解くことができてましたが、結局、試験本番は1時間くらいで全問解ききり、そこから50分くらいで慎重に見直しをするような時間配分になりました。

    提出ボタンを押すと、任意のアンケートがあり、その次のページにちっちゃーく合格の文字がありました。

    やってよかったこと

    • 電車の中で勉強
      • 社会人になると、学生の頃のようにまとまった時間が取れなかったです。
      • 電車の時間でスマホでぽちぽちUdemyの問題を解いたり、まとめたNotionを読んだりして勉強時間を確保したのが、合格の一番の要因だったと思います。
    • 誰かにいつまでに受験することを伝える
      • 合格のためには、ある程度勉強の強制力があった方がいいと思います。
      • できるだけ、「この人に行ったからには受からなきゃ」と思う人(上司など)に「いついつに受験します!」と宣言しましょう
    • 引っかかったワードは正解でない選択肢であっても全て調べる
      • 特に聞いたことないカタカナやサービスは全部調べましょう
        • あってたからいいや精神は良くない!!
      • 調べた内容は全てNotionに自分がわかりやすいようにまとめる
        • 電車内などの隙間時間で振り返ることができるので非常におすすめです
        • また、同じ内容を再度調べ直すことがなくなるので、勉強効率の向上にもつながります
    • インプット速度向上のためには、公式docではなくテック記事を読んだり、生成AIに解説してもらったりする
      • 個人的にはインプットはこれが最速だと思ってます。
      • テックブログは、一つの目的に対する記事が多いので、自分が知りたいものが的確にまとめられているものが結構あります。
      • 逆に公式ドキュメントは各サービスに関して体系的にまとめられているので、情報量が多く、探すのに時間がかかったり、気づいたら全然違うところを理解しようとしてしまったりと寄り道してしまうことも、、
      • 用途に応じて、使い分けるのが最も良いと思います
    • 問題解きながら気になったことはメモしておいて、後で調べる
      • 問題を解きながら思ったことって、意外と解き終わったら忘れることが多いんじゃないかと思います。
      • 例えば、「選択肢にあるこのサービスなんだっけ、、」とか「BigQueryってストリーミング処理できたっけ?」といったような疑問は、意外と大事だったりします。
      • これを問題を解きながらメモしておいて、その後に調べることで試験本番にも起こりうる「うわーこれなんだっけ」状態になる可能性を減らすことができます

    やるべきだったこと

    • 一番最初に最初に試験範囲の理解
      • 記事冒頭で説明したように、2024年に試験範囲の改訂がありましたが、Udemy教材は削除された範囲を含んでいるものもあります。
        • 機械学習周りをある程度勉強してから気づいた、、
      • 正確に試験範囲を理解した上で、勉強を開始するのが最も効率的だと思いました。
    • 演習問題の網羅性
      • 使用した教材のうち1個は2024/5が最終更新日の古いもの
      • もう一方の2025年の教材(50問✖️4回分)を2周したが、もっといろんな教材で新しい問題を解いた方が試験本番で似たような問題に出くわす可能性は上がるなと感じました
    • 当日、考えてもわからない問題は割り切って諦める
      • わからない問題にも2種類あると思います
        • 一つは、完全な知識ゲーで、知ってるか知ってないかのもの
        • すでに持っている知識で解けるはずだが、問題がややこしいもの
      • 私の場合、1周目で前者に少し時間をかけすぎてしまいました
        後者をしっかり考える時間を作るために、考えてもわからない問題はそれっぽい選択肢を選んで次に進むべきです

    最後に

    いかがでしたでしょうか。
    新卒エンジニアがGoogle Cloud Professional Data Engineer資格を取得するために、やったこととその振り返りをまとめてみました。
    本記事がこれから試験を受ける方の参考になれば幸いです。

    お問い合わせ

      GCP
      野村拓也をフォローする
      KIYONO Engineer Blog

      コメント

      PAGE TOP
      タイトルとURLをコピーしました