Big Data on AWS

5 ラボ · 35 クレジット · 5時 11分

Use Case (Experienced) 9 big data on aws option 02

This quest is designed to teach you how to work with AWS services to perform big data analytics on the cloud.

Working with Amazon Redshift(日本語版)

このラボでは、クラスターの作成、データのロード、クエリの実行、パフォーマンスのモニタリングなど、Amazon RedShift の使い方をデモンストレーションします。注: このラボの一環で、無料の SQL クライアントをダウンロードします。

Icon  advanced advanced 10クレジット 45 分

Exploring Google Ngrams with Amazon EMR(日本語版)

このラボでは、ビッグデータを処理するための Amazon Elastic MapReduce (EMR) クラスターを起動し、Hive と SQL スタイルのクエリを併用してデータを分析する方法について説明します。Amazon EMR を使用して小さな Hadoop クラスターを作成し、Amazon S3 に保存されているデータに対してインタラクティブな Hive クエリを実行できるようにします。また、Hive を使用して有用性の高い方法でデータを標準化します。さらに、有益な結果でテーブルを生成し、それを Amazon S3 に保存して、クラスター上で実行される他のジョブに再利用することにも取り組みます。

Icon  expert expert 無料 1 時間

Analyze Big Data with Hadoop

In this lab, you will deploy a fully functional Hadoop cluster, ready to analyze log data in just a few minutes. You will start by launching an Amazon EMR cluster and then use a HiveQL script to process sample log data stored in an Amazon S3 bucket. HiveQL is a SQL-like scripting language for data warehousing and analysis. You can then use a similar setup to analyze your own log files.

Icon  intro Introductory 無料 40 分

Advanced Amazon Redshift: Table Layout and Schema Design

In this lab, you will take a close look at different types of table layout and schema design. You will create tables using various methods for data compression and distribution, and analyze which methods work best, including incorporating Amazon Redshift recommendations. You will conclude the lab by building five different versions of the same table, and analyzing how the differences impact storage requirements and query performance. Pre-requisites: To successfully complete this lab, you should be familiar with Redshift concepts by taking the "Introduction to Amazon Redshift" and "Working with Amazon Redshift" labs at Knowledge of SQL programming is required, although full solution code is provided.

Icon  expert expert 15クレジット 1 時間 45 分

Advanced Amazon Redshift: Data Loading (日本語版)

このラボでは、Amazon Redshift を使用して、さまざまな方法でデータのロードを実験し、これらの方法を比較します。ここでは、テーブルの作成、S3 および Amazon Data Pipeline を使用したデータのロード、リモートホストからのロード、およびデータロードエラーのトラブルシューティングの実習を行います。ラボの最後には、クリーンアップ手順を実習します。前提条件: Redshift およびデータベースの基本的な概念を理解している必要があります。 で入門ラボ、「Introduction to Amazon Redshift」を修了している必要があります。SQL 文および JSON フォーマットの知識が必要です。ただし、ソリューションコードはすべて提供されます。記載されているとおりにラボを利用するために、自動で割り当てられているリージョンを変更しないでください。

Icon  advanced advanced 10クレジット 45 分