This quest is designed to teach you how to work with AWS services to perform big data analytics on the cloud.

Working with Amazon Redshift(日本語版)

このラボでは、クラスターの作成、データのロード、クエリの実行、パフォーマンスのモニタリングなど、Amazon RedShift の使い方をデモンストレーションします。注: このラボの一環で、無料の SQL クライアントをダウンロードします。

Exploring Google Ngrams with Amazon EMR(日本語版)

このラボでは、ビッグデータを処理するための Amazon Elastic MapReduce (EMR) クラスターを起動し、Hive と SQL スタイルのクエリを併用してデータを分析する方法について説明します。Amazon EMR を使用して小さな Hadoop クラスターを作成し、Amazon S3 に保存されているデータに対してインタラクティブな Hive クエリを実行できるようにします。また、Hive を使用して有用性の高い方法でデータを標準化します。さらに、有益な結果でテーブルを生成し、それを Amazon S3 に保存して、クラスター上で実行される他のジョブに再利用することにも取り組みます。

Advanced Amazon Redshift: Analytics and Amazon Machine Learning

In this lab, you will build a smart solution using Amazon Redshift and Amazon Machine Learning that predicts delays for flights originating in Chicago’s O’Hare international airport. You will learn how to analyze large amounts of data using Redshift. Then you will practice using Machine Learning to create a model that will predict flight delays. Prerequisites: To successfully complete this lab, you should be familiar with Redshift concepts by taking the introductory lab at Some knowledge of SQL and Python programming is required, although full solution code is provided. You should be comfortable using RDP to connect to a Windows server and using SQL client software. You should have at a minimum taken the “Introduction to Amazon Redshift” and “Introduction to Machine Learning” labs at

