cloudera apache hadoop - wwing.net...training sheet cloudera universityの4日間のapache...

2
TRAINING SHEET Cloudera University の 4 日間の Apache Hadoop 管理者向けコースでは、 Cloudera Manager を使用して、Hadoop クラスタを操作、管理するために必要なす べての手順の包括的な理解を提供しています。インストールと設定からロードバラ ンスやチューニングまで、Cloudera のトレーニングコースは Hadoop の管理者が直 面する現実世界での課題のために最も準備されているものです。 ハンズオンで経験を得る インストラクター主導の議論や対話形式の実践的な演習問題を通して、参加者は Hadoop エコシステムを操る以下のようなトピックを学習します: ログ収集、設定管理、リソース管理、レポート、アラート、サービス管理のよ うなクラスタの管理を容易にさせる Cloudera Manager の機能 YARN、HDFS、Impala、Hive、Spark、Kafka を含む Hadoop に関連する主要 サービスを提供する実環境でスケールするクラスターの設定とデプロイ クラスターに適切なハードウェアとインフラストラクチャーの決定 データセンターに統合するための正しいクラスターの設定とデプロイメント HDFS、Kudu および Amazon S3 のようなクラウドオブジェクトストアにある データの取り込み、保存、アクセス Kafka と Flume を使用して、クラスターにファイルベースのデータのロードと ストリーミングデータを行う方法 本番環境クラスターを準備、チューニング、運用するためのベストプラクティ トラブルシューティング、診断、クラスターの問題の解決 コースへの期待 このコースは基本的な Linux の経験がある、システム管理者と IT マネージャーに最 適です。Apache Hadoop の事前知識は必要ありません。 認定資格の取得 コース終了後、参加者は Cloudera Certified Associate (CCA) 管理者向け認定資格 のためのの学習と登けることを推奨します。認定資格は大き差別化あり、あなたのスルと専門知識の具体的な証拠用者 と顧客に提供するため に、あなたがこの分野のリーーとして確立するのに役立ちます。 Cloudera Apache Hadoop Take your knowledge to the next level “独学で1ヶ月勉強した容以のことを日に学習 することがでました。りの日間もしみです

Upload: others

Post on 14-Mar-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Cloudera Apache Hadoop - wwing.net...TRAINING SHEET Cloudera Universityの4日間のApache Hadoop管理者向けコースでは、 Cloudera Managerを使用して、Hadoopクラスタを操作、管理するために必要なす

TRAINING SHEET

Cloudera University の 4 日間の Apache Hadoop 管理者向けコースでは、

Cloudera Manager を使用して、Hadoop クラスタを操作、管理するために必要なす

べての手順の包括的な理解を提供しています。インストールと設定からロードバラ

ンスやチューニングまで、Cloudera のトレーニングコースは Hadoop の管理者が直

面する現実世界での課題のために最も準備されているものです。

ハンズオンで経験を得る

インストラクター主導の議論や対話形式の実践的な演習問題を通して、参加者は

Hadoop エコシステムを操る以下のようなトピックを学習します:

� ログ収集、設定管理、リソース管理、レポート、アラート、サービス管理のよ

うなクラスタの管理を容易にさせる Cloudera Manager の機能

� YARN、HDFS、Impala、Hive、Spark、Kafka を含む Hadoop に関連する主要

サービスを提供する実環境でスケールするクラスターの設定とデプロイ

� クラスターに適切なハードウェアとインフラストラクチャーの決定

� データセンターに統合するための正しいクラスターの設定とデプロイメント

� HDFS、Kudu および Amazon S3 のようなクラウドオブジェクトストアにある

データの取り込み、保存、アクセス

� Kafka と Flume を使用して、クラスターにファイルベースのデータのロードと

ストリーミングデータを行う方法

� 本番環境クラスターを準備、チューニング、運用するためのベストプラクティ

� トラブルシューティング、診断、クラスターの問題の解決

コースへの期待

このコースは基本的な Linux の経験がある、システム管理者と IT マネージャーに最

適です。Apache Hadoop の事前知識は必要ありません。

認定資格の取得

コース終了後、参加者は Cloudera Certified Associate (CCA) 管理者向け認定資格

のためのの学習と登録を続けることを推奨します。認定資格は大きな差別化要因で

あり、あなたのスキルと専門知識の具体的な証拠を雇用者 と顧客に提供するため

に、あなたがこの分野のリーダーとして確立するのに役立ちます。

Cloudera Apache Hadoop��������� Take your knowledge to the next level

“独学で1ヶ月間勉強した内

容以上のことを初日に学習

することができました。残

りの3日間も楽しみです”

Page 2: Cloudera Apache Hadoop - wwing.net...TRAINING SHEET Cloudera Universityの4日間のApache Hadoop管理者向けコースでは、 Cloudera Managerを使用して、Hadoopクラスタを操作、管理するために必要なす

TRAINING SHEET

コースの詳細

Cloudera 株式会社 〒104-0031 東京都中央区京橋 2-7-14 ビュレックス京橋 2 階

ご質問は [email protected] までご自由にお寄せください。

© 2019 Cloudera, Inc. All rights reserved. Cloudera and the Cloudera logo are trademarks or registered trademarks of Cloudera Inc. in the USA and other countries. All other trademarks are the property of their respective companies. Information is subject to change without notice.

はじめに

Cloudera Enterprise Data Hub

• Cloudera Enterprise Data Hub

• CDH の概要

• Cloudera Manager の概要

• Hadoop の管理者の責務

Cloudera Manager と CDH のインストール

• Cluster のインストールの概要

• Cloudera Manager のインストール

• CDH のインストール

• CDH クラスターサービス

Cloudera クラスターの設定

• 概要

• 構成の設定

• サービス構成の変更

• 設定ファイル

• ロールインスタンスの管理

• 新しいサービスの追加

• ホストの追加と削除

Hadoop 分散ファイルシステム

• 概要

• HDFS のトポロジーと役割

• 編集ログとチェックポイント処理

• HDFS のパフォーマンスとフォールトト

レランス

• HDFS と Hadoop セキュリティの概要

• HDFS の Web ユーザーインターフェイ

• HDFS コマンドラインインターフェイス

の使用

• その他のコマンドラインユーティリティ

HDFS のデータ取り込み

• データ取り込みの概要

• ファイル形式

• ファイル転送または REST インターフェ

イスを用いたデータ取り込み

• Apache Sqoop によるリレーショナルデ

ータベースからデータをインポート

• Apache Flume による外部ソースからの

データのインポート

• データインポートのベストプラクティス

Hive と Impala

• Apache Hive

• Apache Impala

YARN と MapReduce

• YARN の概要

• YARN でアプリケーションの実行

• YARN アプリケーションの表示

• YARN アプリケーションのログ

• MapReduce アプリケーション

• YARN のメモリと CPU の設定

Apache Spark

• Spark 概要

• Spark アプリケーション

• YARN で Spark アプリケーションを実

行する方法

• Spark アプリケーションの監視

クラスターを計画する

• 一般的な計画に関する考慮事項

• 適切なハードウェアの選択

• ネットワークの考慮事項

• 仮想化オプション

• クラウドデプロイのオプション

• ノードの設定

高度なクラスター設定

• サービスポートの設定

• HDFS と MapReduce のチューニング

• HDFS 高可用性の有効化

リソース管理

• 静的サービスプールを使用した cgroups

の設定

• フェアスケジューラー

• 動的リソースプールの設定

• Impala クエリのスケジューリング

クラスターのメンテナンス

• HDFS のステータスを確認する

• クラスター間でデータをコピーする

• HDFS のデータの再バランス

• HDFS のディレクトリスナップショット

• クラスターのアップグレード

クラスターの監視

• Cloudera Manager のモニタリング機能

• ヘルステスト

• イベントとアラート

• チャートとレポート

• モニタリングの推奨事項

クラスターのトラブルシューティング

• 概要

• トラブルシューティングのツール

• 設定ミスの例

Hue のインストールと管理

• 概要

• Hue の管理と設定

• Hue の認証と認可

セキュリティ

• Hadoop セキュリティのコンセプト

• Kerberos を使用した Hadoop での認証

• Hadoop での認可

• Hadoop での暗号化

• Hadoop クラスターのセキュア化

Apache Kudu

• Kudu の概要

• アーキテクチャー

• インストールと設定

• 監視と管理ツール

Apache Kafka

• Apache Kafka とは何か

• Apache Kafka の概要

• Apache Kafka クラスターのアーキテク

チャー

• Apache Kafka のコマンドラインツール

• Flume と Kafka を使用する

クラウドでのオブジェクトストア

• オブジェクトストレージ

• Hadoop をオブジェクトストレージに接

続する