学習内容
|
1. はじめに
2. Apache Hadoop とHadoop エコシステム入門
3. Apache Hadoop ファイルストレージ
4. Apache Hadoop クラスタでのデータ処理
5. Apache Sqoop でリレーショナルデータをインポートする
6. Apache Spark の基礎
7. RDD を扱う
8. ペアRDD でデータを集約する
9. Apache Spark アプリケーションを記述、実行する
10. Apache Spark アプリケーションを設定する
11. Apache Spark での並列処理
12. RDD の永続化
13. Apache Spark のデータ処理での一般的なパターン
14. DataFrame とApache Spark SQL
15. Apache Kafka によるメッセージ処理
16. Apache Flume でデータを取り込む
17. Apache Flume とApache Kafka を統合する
18. Apache Spark Streaming: DStream の紹介
19. Apache Spark Streaming: 複数のバッチを処理する
20. Apache Spark Streaming: データソース
21. まとめ
|