[data platform conference tokyo 2017]...

43
エキスパートに聞く! クラウドで実現するビッグデータ活用 日本マイクロソフト株式会社 佐藤 直生 日本アイ・ビー・エム株式会社 平山 毅 ホートンワークスジャパン株式会社 北瀬 公彦

Upload: naoki-neo-sato

Post on 21-Jan-2018

537 views

Category:

Software


2 download

TRANSCRIPT

Page 1: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

エキスパートに聞く!クラウドで実現するビッグデータ活用

日本マイクロソフト株式会社 佐藤 直生日本アイ・ビー・エム株式会社 平山 毅ホートンワークスジャパン株式会社 北瀬 公彦

Page 2: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

© Data Platform Conference Tokyo 2017. All Rights Reserved2

Data Platform

Conference Tokyo 2017

© Data Platform Conference Tokyo 2017. All Rights Reserved2

メジャーなクラウドにおけるビッグデータ・アナリティクス関連サービスについて確認

Azureのビッグデータ・アナリティクス関連サービスについて

IBMのビッグデータ・アナリティクス関連サービスについて

アジェンダ

Page 3: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

日本マイクロソフト株式会社パートナー事業本部エバンジェリスト

佐藤 直生 氏

日本アイ・ビー・エム株式会社IBMクラウド事業本部

コンサルティング・アーキテクト

平山 毅 氏

Page 4: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Data Platform

Conference Tokyo 2017

© Data Platform Conference Tokyo 2017. All Rights Reserved4

Category OSS AWS Azure Google IBMETL NiFi, Sqoop, Flume,

etcAmazon Data Pipeline Azure Data Factory

Azure Data CatalogCloud DataPrep Data Connect

メッセージングシステム

Kafka Amazon Kinesis Azure Event Hub Cloud Pub/Sub IBM Message Hub

ビッグデータ分散処理

HadoopSpark

Amazon EMR Azure HDInsight Cloud DataProcCloud Dataflow

BigInsights for Apache Hadoop

リアルタイムデータ処理

Storm Amazon Kinesis Azure StreamAnalytics

Streaming Analytics

NoSQL MongoDB, CouchDB,HBase, Cassandra, etc

Amazon DynamoDB Azure CosmosDBAzure Time Series

Insights

Cloud DatastoreCloud BigTable

IBM Cloudant

データウェアハウス Hive / Druid Amazon Redshift Azure SQL Datawarehouse

BigQuery IBM Db2 Warehouse on Cloud

クエリエンジン Hive, Impala, Presto Amazon Athena Azure Data Lake Analytics

BigQuery BigInsights for Apache Hadoop (Subscription)

BI Superset, etc Amazon QuickSight PowerBI Google Data Studioデータサイエンス Zeppelin

Jupyter NotebookAmazon Machine

LearningAzure Machine

LearningCloud DataLab IBM Data Science

Experienceマシーンラーニング Amazon Machine

LearningAzure Machine

LearningCloud Machine

Learning ServicesIBM Watson Machine

Learning

クラウドサービスの紹介

ビッグデータ・アナリティクス

参考: https://ilyas-it83.github.io/CloudComparer/

Page 5: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Data Platform

Conference Tokyo 2017

© Data Platform Conference Tokyo 2017. All Rights Reserved5

ビッグデータ分析のための

データパイプライン

ストリームデータ転送

分散ファイルシステム

データウェアハウス

Business Intelligence

分散処理 データサイエンス

バルクデータ転送

アドホッククエリー

リアルタイム処理

マシンラーニング

DB

DB

NoSQL

Sensor

Sensor

Page 6: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Data Platform

Conference Tokyo 2017

© Data Platform Conference Tokyo 2017. All Rights Reserved6

Apache Kafka

Apache HDFS

ApacheHive / Druid

ApacheSuperset

Apache Hadoop /

Spark

Apache Zeppelin

Apache Sqoop

ETL

ApacheHive QL / LLAP

Apache Storm

Spark Mllibなどの機械学習ライブラリを使用して開発

DB

DB

Mongo DB

Apache HBase

クラウドサービスの紹介

OSS ビッグデータ・アナリティクス

Sensor

Sensor

ストリームデータ転送

バルクデータ転送

Page 7: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Data Platform

Conference Tokyo 2017

© Data Platform Conference Tokyo 2017. All Rights Reserved7

AmazonKinesis

AmazonS3

AmazonRedshift

Amazon QuickSight

AmazonEMR

Apache Zeppelin

ETL

AmazonAthena

AmazonKinesis

Analytics

Amazon ML

DB

DB

AmazonDynamoDB

クラウドサービスの紹介

AWS ビッグデータ・アナリティクス

Sensor

Sensor

ストリームデータ転送

バルクデータ転送

Page 8: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Data Platform

Conference Tokyo 2017

© Data Platform Conference Tokyo 2017. All Rights Reserved8

GoogleCloud Pub/Sub

GoogleCloud Storage

GoogleDatastore

Google Data Studio

GoogleCloud

Dataproc

Google Cloud Datalab

ETL

GoogleBigQuery

Google Cloud

Dataflow

Google Cloud Datalab

DB

DB

Google BigQuery

GoogleBigTable

Google Cloud

Dataflow

クラウドサービスの紹介

Google ビッグデータ・アナリティクス

Sensor

Sensor

ストリームデータ転送

バルクデータ転送

Page 9: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Data Platform

Conference Tokyo 2017

© Data Platform Conference Tokyo 2017. All Rights Reserved9

AzureEvent Hub

AzureBlob / ADLS

AzureSQL Server

Data warehouse

Azure PowerBI

Azure MLETL

それぞれのサービスに付属

AzureStreaming Analytics

Azure ML

DB

DB

AzureCosmoDB

AzureHDInsight

クラウドサービスの紹介

Azure ビッグデータ・アナリティクス

Sensor

Sensor

ストリームデータ転送

バルクデータ転送

Page 10: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Data Platform

Conference Tokyo 2017

© Data Platform Conference Tokyo 2017. All Rights Reserved10

IBM Message Hub

IBMObject Storage

IBM Db2 Warehouse

on Cloud

Cognossなど、UnmanagedなBI製品を利用

IBM Data Science

ExperienceETL

それぞれのサービスに付属

IBMStreaming Analytics

IBM Watson Machine Learning

DB

DB

IBM Cloudant

BigInsights for Apache Hadoop

クラウドサービスの紹介

IBM ビッグデータ・アナリティクス

Sensor

Sensor

ストリームデータ転送

バルクデータ転送

Page 11: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

日本マイクロソフト株式会社パートナー事業本部エバンジェリスト

佐藤 直生 氏

Page 12: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用
Page 13: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

デ ジ タ ル ト ラ ン ス フ ォ ー メ ー シ ョ ン

Page 14: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

クラウド AIデータ

Page 15: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用
Page 16: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

データ ウェアハウス

データ レイク

オペレーション データベース

データ ウェアハウス

データ レイク

オペレーション データベース

セキュリティと

プライバシー選択肢の柔軟性

あらゆる場所の

あらゆるデータに対応

AI 組み込み | 最もセキュア | 最小の TCO

2年連続で業界トップ

TPC-H パフォーマンスでトップ

任意のデータに対する T-SQL クエリ

Aurora より 70% 高速

Redshift の 2 倍のグローバル リーチ

上限なし、99.9% SLA

ハイブリッド

SQL ServerAzure

データ サービスコード変更なしに簡単に移行

SocialLOB Graph IoTImageCRM

Page 17: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Apps + insightsSocial

LOB

Graph

IoT

Image

CRM 投入 格納 準備、訓練 モデル、提供

Data orchestration and monitoring

Big datastore

Hadoop/Spark and machine learning

Data warehouse

Page 18: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

制御 使いやすさ

Azure Data Lake

Analytics

Azure Data Lake Store

Azure Storage

Any Hadoop technology

Workload optimized,

managed clusters

Specific apps in a multi-

tenant form factorAzure Marketplace

HDP | CDH | MapR

Azure Data Lake

Analytics

IaaS クラスター マネージドクラスター ビッグデータサービス

Azure HDInsight

ビッグデータ

ストレージ

ビッグデータ分析

ユーザー導入

Page 19: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

OSS ビッグ データフレームワークを希望しているか?

オンプレミスと厳密

に同じである必要

があるか?

対話型、ストリーミングが必要か?

必須 強い意見なし

Azure Marketplace (IaaS)

• All workloads exactly like on-premises

• Cloudera/MapR

Azure HDInsight

• Most Hadoop workloads

• Fully managed by Microsoft

• Sell HDI + ADLS

• Stickier to Microsoft than VMs

• Can do interactive (Spark) and streaming

(Storm/Spark)

Azure Data Lake

• Easiest experience for admin: no sense of

clusters, instant scale per job

• Easiest experience for developers: Visual

Studio/U-SQL (C#+SQL)

• Sell ADLA + ADLS

• Batch workloads only

はい主要な機能が必要 はい バッチで十分

.NET/VS ユーザーか?

Page 20: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

ビッグ データ ソリューション3 つの主要ソリューション

ビッグ データによる、データ ウェアハウスのモダナイゼーション

高度な分析 Internet of Things (IoT)

Page 21: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

モデル、提供準備、訓練

HDInsight /

Spark

データ

Business

apps

Custom

apps

Sensors

and devices

インテリジェンス アクション

格納

Blobs / Data Lake

投入

Data Factory

Analytical dashboards

Web & mobile apps

Machine Learning Cosmos DB

SQL DB

SQL Data Warehouse

Analysis Services

Operational reports

Page 22: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Business

apps

Custom

apps

Analytical dashboards

Azure SQL Data

Warehouse

Page 23: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Azure SQL Data

Warehouse

Azure CLI

Azure Data Factory

bcp Command Line Utility

SQL Server Integration Services

Business

apps

Custom

apps

Analytical dashboards

Page 24: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Business

apps

Custom

apps

Azure SQL Data

Warehouse

Azure SQL

Database

Azure Analysis

Services

Data Migration Service

Data Migration Service

Data Migration Service

Data Migration Service

Analytical dashboards

Page 25: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Business/Custom

apps

(structured)

Azure SQL Data

Warehouse

Azure CLI, Azure Data Factory

Azure Analysis

Services

Data Migration Service

Logs, Files and

media

(unstructured)

Analytical dashboards

Page 26: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Azure SQL Data

Warehouse

Azure Storage

Business/Custom

apps

(structured)

Logs, Files and

media

(unstructured)

Polybase

Azure HDInsight

(Hadoop/Spark)

Analytical dashboards

Page 27: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

*IDC study “The Business Value and TCO Advantage of Apache Hadoop in the Cloud with Microsoft Azure HDInsight”

Azure HDInsightエンタープライズ向けの Spark、Hadoop クラウド サービス

信頼性 エンタープライズ級 生産性の高いプラットフォーム

コスト効率 統合

簡単

63% 低い TCO

Page 28: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用
Page 29: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Azure SQL Data

Warehouse

Azure Storage

Business/Custom

apps

(structured)

Logs, Files and

media

(unstructured)

Polybase

Azure HDInsight

(Hadoop/Spark)

Azure Machine Learning &

Machine Learning Server

Analytical dashboards

Page 30: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Model Management

モデルのデプロイ、バージョン管理、管理、監視

Workbench

データ準備、モデル構築、デプロイ、管理

Experimentation

Spark、GPU、アジャイル開発で生産性を加速

Page 31: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Azure SQL Data

Warehouse

Azure Data Lake

Store

Business/Custom

apps

(structured)

Logs, Files and

media

(unstructured)

Polybase

Azure Data Lake

Analytics

Azure Machine Learning &

Machine Learning Server

Analytical dashboards

Page 32: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Azure SQL Data

WarehouseAzure Storage

Polybase

Azure HDInsight

(Hadoop/Spark)

Azure Machine Learning &

Machine Learning Server

Analytical dashboards

Sensors and IoT

(unstructured) Azure Event Hubs

Azure IoT Hub

Azure HDInsight

(Kafka)

Page 33: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Azure SQL Data

Warehouse

Azure Stream Analytics

Polybase

Azure Machine Learning &

Machine Learning Server

Analytical dashboards

Sensors and IoT

(unstructured) Azure Event Hubs

Azure IoT Hub

Azure HDInsight

(Kafka)

Page 34: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Azure SQL Data

Warehouse

Azure Storage

Business/Custom

apps

(structured)

Logs, Files and

media

(unstructured)

Polybase

Azure HDInsight

(Hadoop/Spark)

Azure Machine Learning &

Machine Learning Server

Analytical dashboards

Web & mobile apps

Cosmos DB

Sensors and IoT

(unstructured) Azure Event Hubs

Azure Data Factory

Orchestration

Azure Key Vault

Key Management

Azure ExpressRoute

Private Connections

Operations Management Suite

Monitoring

Page 35: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

Data Lake Analytics

Business

apps

Custom

apps

Sensors

and devices

Data Lake

Store

Data Factory(Data Movement)

Machine Learning

Web & mobile apps

Cosmos DB

SQL DB

Analytical dashboards

SQL Data

Warehouse

Analysis

Services

Operational reportsHDInsight

(Hadoop/Spark)

Stream Analytics

Blob

Storage

Event Hubs

Kafka on HDInsight

Azure

Azure Data Factory

Orchestration

Azure Key Vault

Key Management

Azure ExpressRoute

Private Connections

Operations Management Suite

Monitoring

Page 36: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

利用分析

MACHINE LEARNING

データ

Business

apps

Custom

apps

Sensors

and devices

インテリジェンス アクション

格納

UP TO 150TB

準備、投入

INTEGRATION SERVICES

Analytical dashboards

Web & mobile apps

REPORTING SERVICES

SQL Server<150TB compressed, SMP

PolyBase

Analytics Platform System>150TB compressed, MPP

Your big data store

Operational reports

Page 37: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

SQL Server 2017Windows Server、Linux、Dockerで動作

アダプティブクエリ処理を備えた業界トップのパフォーマンス

R、Pythonによるデータベース内の高度な機械学習

SQL Server2017

Page 38: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

TrustedHybrid IntelligentProductive

Microsoft Azure

Page 39: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用
Page 40: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

最新技術とソリューションの動向。取り組むべき課題と習得すべきスキル。80 を超えるセッションをご用意しお迎えします。

お申し込みは http://aka.ms/mstsjp17

#mstsjp17

早期割引申込受付中!

インフラエンジニア、アーキテクト、IT 戦略にかかわる皆様のための技術カンファレンス

Page 41: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用
Page 42: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

日本アイ・ビー・エム株式会社IBMクラウド事業本部

コンサルティング・アーキテクト

平山 毅 氏

Page 43: [Data Platform Conference Tokyo 2017] エキスパートに聞く!クラウドで実現するビッグデータ活用

エキスパートに聞く!クラウドで実現するビッグデータ活用

日本マイクロソフト株式会社 佐藤 直生日本アイ・ビー・エム株式会社 平山 毅ホートンワークスジャパン株式会社 北瀬 公彦