ホーム > Data Engineering on Google Cloud Platform

Data Engineering on Google Cloud Platform

対応チケット/ポイント等

  • New!
    新規コース(過去6ヶ月)
期間  4日間 時間  9:30~17:30
価格(税込)  352,000円(税込) 主催  トレノケート
コース種別  集合研修  
形式  講義+ハンズオン コースコード  GGC0022V
日程 会場 空席状況 実施状況 選択

2021年10月26日(火) ~ 2021年10月29日(金)

オンラインLive

  空席あり

2022年3月8日(火) ~ 2022年3月11日(金)

オンラインLive

  空席あり

※「キャンセル待ち」でお申し込みの方には、別途メールにてご連絡いたします。
※「実施確定」表示のない日程は、お申し込み状況により開催中止になる場合がございます。
※ お申込期日が過ぎた日程は、「お問い合わせください」と表示されます。
※ トレノケート主催コース以外の空席状況は、残席数に関わらず「お申し込み後確認」と表示されます。
※ トレノケート主催コース以外では、主催会社のお席を確保した後に受付確定となります。
お申込みに関するお問い合わせはこちらから

重要なご連絡・ご確認事項

※下記の事前必須手続きが完了していない場合は、ご受講頂けませんのでご注意ください。本手続きが完了しておらず、当日ご受講頂けなかった際は有償キャンセルとなります※

【ご受講前の必須手続き】

ご受講日までに、下記リンクよりプライバシーポリシー及び利用規約にご同意の上、トレーニングシステム「Qwiklabs」のアカウントを作成ください。
Qwiklabsアカウントとコース申込時の受講者メールアドレスは、同一のメールアドレスをご使用ください。

https://trainocate.qwiklabs.com/?locale=ja

自動返信メールにはglobalknowledge-jp.qwiklabs.comからアクセスしてくださいと表示される場合がありますが、同じサイトであるため問題ありません。

既にtrainocate.qwiklabs.comのQwiklabsアカウントをお持ちの方は再作成の必要はございません。




【本コースはオンライン対応です】※一部日程をオンラインで開催しています


会場が「オンラインLive」または「教室Live配信」の日程は、PCやタブレット等を通してオンラインでご参加いただけます。


  • オンラインLive:受講者の方はオンラインのみとなります。
  • 教室Live配信:教室・オンラインから受講される方が混在します。

★オンラインLiveトレーニングの詳細はこちら

対象者情報

対象者
このクラスは、次のようなビッグデータ分析を担当する開発者を対象としています。
・データの抽出、読み込み、変換、クリーニング、検証。
・データ処理のためのパイプラインとアーキテクチャの設計。
・機械学習と統計モデルの作成と維持。
・データセットのクエリ、クエリ結果の視覚化、レポートの作成。
前提条件
このコースを最大限に活用するには、参加者は次の条件を満たしている必要があります。
・Google Cloud Big Data & Machine Learning Fundamentalsのコースを受講しているか、同等の経験があること。
・データモデリング、抽出、変換などのSQLエクスペリエンスの基本的な知識。
・Pythonなどの一般的なプログラミング言語を使用した開発知識。

学習内容の詳細

コース概要
この 4 日間のクラスでは、Google Cloud Platform でデータ パイプラインの設計および実践的な構築をハンズオンで学習します。講義、デモ、ハンズオンラボの組み合わせにより、データ処理システムの設計方法、データ パイプラインの構築方法、データの分析方法、およびインサイトの引き出し方を学びます。
Google Cloud Platform でのデータ分析と機械学習について詳細に学ぶことができるコースですが、他の2コースに比べ内容はやや難しく、理解するためにはデータ分析や機械学習についての基礎知識が必要です。
基礎知識に自信がなければ、Google Cloud Big Data & Machine Learning FundamentalsもしくはFrom Data to Insights with Google Cloud Platformを先にご受講されることをお勧めします。
学習内容
モジュール1:データエンジニアリングの概要
モジュール2:データレイクの構築
モジュール3:データウェアハウスの構築
モジュール4:バッチデータパイプラインの構築の概要
モジュール5:Spark on CloudDataprocの実行
モジュール6:クラウドデータフローを使用したサーバーレスデータ処理
モジュール7:Cloud DataFusionとCloudComposerを使用したデータパイプラインの管理
モジュール8:ストリーミングデータの処理の概要
モジュール9:Cloud Pub / Subを使用したサーバーレスメッセージング
モジュール10:クラウドデータフローストリーミング機能
モジュール11:ハイスループットBigQueryおよびBigtableストリーミング機能
モジュール12:高度なBigQueryの機能とパフォーマンス
モジュール13:分析とAIの概要
モジュール14:非構造化データ用のビルド済みMLモデルAPI
モジュール15:クラウドAIプラットフォームノートブックを使用したビッグデータ分析
モジュール16:Kubeflowを使用した本番MLパイプライン
モジュール17:BigQueryMLでSQLを使用したカスタムモデルの構築
モジュール18:CloudAutoMLを使用したカスタムモデルの構築

実習/演習内容詳細

演習/デモ内容
ラボ1:BigQueryを使用したデータの分析
ラボ2:タクシーデータをCloudSQLにロード
ラボ3:BigQueryへのデータの読み込み
ラボ4:BigQueryでのJSONおよび配列データの操作
ラボ5:CloudDataprocでApacheSparkジョブを実行
ラボ6:Cloud DataFusionでパイプライングラフを作成して実行する
ラボ7:CloudComposerの概要
ラボ8:単純なデータフローパイプライン(Python / Java)
ラボ9:DataflowのMapReduce(Python / Java)
ラボ10:サイド入力(Python / Java)
ラボ11:ストリーミングデータをPub / Subにパブリッシュ
ラボ12:ストリーミングデータパイプライン
ラボ13:ストリーミング分析とダッシュボード
ラボ14:データパイプラインをBigtableにストリーミング
ラボ15:パフォーマンスのためにBigQueryクエリを最適化する
ラボ(オプション):Google BigQueryのパーティション分割テーブル
ラボ16:Natural LanguageAPIを使用して非構造化テキスト分類
ラボ17:AIプラットフォーム上のJupyterラボのBigQuery
ラボ18:KubeflowでAIモデルを実行する
ラボ(オプション):BQMLの回帰モデルを使用して自転車の移動時間を予測
ラボ(オプション):BigQueryMLを使用して映画をおすすめする

ご注意・ご連絡事項

※事前必須手続きが完了していない場合は、ご受講頂けませんのでご注意ください。本手続きが完了しておらず、当日ご受講頂けなかった際は有償キャンセルとなります。
【事前必須手続き】
リンクよりトレーニングシステム「Qwiklab」アカウントの作成ください。
申込時Qwiklabアカウントのメールアドレスを受講者様メールアドレスに記載ください。

おすすめのコースフロー図を見る