the economics of a cloud computer 「クラウドコンピュータ」の経済学 -...
DESCRIPTION
2010年10月16日に開催された「楽天テクノロジーカンファレンス」での講演スライドです。 ----- 「クラウドコンピュータ」の経済学 中田敦(日経BP社日経コンピュータ記者) 「クラウドコンピューティング」とは、恐ろしく高性能なのにびっくりするぐらい安く使える「クラウドコンピュータ」を使うこと、です。ではなぜ、クラウドコンピュータは高性能で安いのでしょうか。その理由を、データセンター視点と産業視点の二つから考えてみます。 【プロフィール】 1998年慶応義塾大学商学部卒業後、日経BP社に入社。「日経レストラン」「BizTech」「日経Windowsプロ」「ITpro」を経て、 2008年10月より「日経コンピュータ」記者。共著として「クラウド大全」「クラウド大全第二版」(日経BP社)、「Googleの全貌」(同)がある。 twitter: @Nakada_itproTRANSCRIPT
クラウドコンピュータの経済学The Economics of a Cloud Computer
日経コンピュータ編集部Nikkei Computer Magazine
中田 敦 @Nakada_itproAtsushi Nakada
2010年10月16日楽天テクノロジーカンフゔレンス2010 講演
自己紹介
中田 敦
Atsushi Nakada
@Nakada_itpro
日経コンピュータ 記者
Nikkei Computer Magazine
Staff Writer
Writing articles about Cloudfor 3 years
2009年4月29日号
2010年7月7日号
2009年9月2日号
Writing articles about Cloudfor 3 years
2010年9月15日号
はじめにIntroductions
10月に入って、気になったクラウド関連ニュース
Interesting News aboutCloud Computing in December
10月5日〆トヨタ、スマートグリッド自社開発Toyota builds their own Smart Grid for EV
日経産業新聞曰くNikkei Shimbun Said
々「スマートグリッドで攻め込まれたら事業の根幹が崩れる」(トヨタ幹部)
々仮にエコカーを取り巻く周辺ンフラを抑えられ、規格や仕様が相手側に支配されれば「車を自由につくれなくなる」(幹部)
If someone build smart grids as the Infrastructure of Car Industries, we can’t make cars by ourselves ---Toyota
10月9日〆Google、自動運転自動車開発
Google公式ブログから
「Googleの創業目的は、テクノロジーで世界を良くすることです」
「自動車の安全と効率性を改善させます」
Larry and Sergey founded Google because they wanted to help solve really big problems using technology. And one of the big problems we’re working on today is car safety and efficiency.
10月12日〆Google、巨大送電網建設Google to build Smart Grids
5000億円、600万KW?
々Googleや丸紅が出資して、大西洋沖の洋上風力発電所と米国東部を結ぶ大規模な海底送電網を建設する
々洋上風力発電所は、独立系発電事業者が建設。それをニュージャージ州、デラウエゕ州、メリーランド州、バージニゕ州に送る
々総事業費は最大5000億円。6000MW(600万KW)を供給する
Google公式ブログより
500B Yen, 6000MW
Google and Marubeni will invest in the development of a backbone transmission project off the Mid-Atlantic coast. The Atlantic Wind Connection (AWC) backbone will stretch 350 miles off the coast from New Jersey to Virginia and will be able to connect 6,000MW of offshore wind turbines.
Google公式ブログより
5000億円、600万KW?500B Yen, 6000MW
東京電力の最大電力2009年7月30日
Tokyo Electronic Power Corp
Google/丸紅の最大電力
Google/Marubeni
5450万KW(54,500MW)
600万KW(6,000MW)
東京電力が供給する最大電力の10分の1強を、Google/丸紅連合が供給可能(しかも風力発電)
なぜこのニュースが気になった?Why am I interested in theese news?
クラウドコンピューテゖングのその次の展開を予見させるから
This is the next step ofthe Cloud Computing.
What is Cloud Computing?
Using a “Cloud Computer”
クラウドコンピューテゖングとは?
Personal Computing : Using a PC
Mobile Computing: Using a Mobile Device
Cloud Computing: Using a Cloud Computer
What do you think abou Cloud?
• some sort of – not Cloud
Computing but a Cloud Computer;
something that is always there and
always be accessed and always
store data and always give it back.
Ken Thompson
Ken Thompson
UNIXオリジナル開発者の一人C言語の元となった「B言語」を開発
現在はGoogleに所属
Ken Thompson said
•それはある種の、クラウド々コンピュー
テゖングではなく、クラウドコンピュータ
の問題だ。
•いつでも「あそこ」にあって、いつでもゕ
クセス可能で、いつでもデータを保存でき
て、いつでも保存したデータを取り出せる。
ケン々トンプソン氏
Ken Thompson said
• I think that is very hard. There is two types
of jobs;
• one where you want to do something huge,
• one job that takes thousands of computers to
do or you want to do thousands of little jobs
and never fail. And those are almost like two
separate problems, like MapReduce
ケン々トンプソン氏
Ken Thompson said
• I am actually more interested in the second,
in trying to get small jobs, the kind of jobs
that a user at home will be restore a file,
look at his date book, or pull a video, little
small jobs that are much more reliable than
anything he can do at home.
ケン々トンプソン氏
ケン々トンプソン氏曰く
• クラウド々コンピュータは、とても難しいことをやってのけている。クラ
ウド々コンピュータは常に二つのタプのジョブを、とても大規模に行っ
ているからだ
• 一つは、何千台ものコンピュータを連携させて、巨大なジョブを何千個も
の小さなジョブに分割して実行し、かつ各ジョブを失敗させないことだ
• もう一つは、ユーザーが家庭で行うような小さいジョブ、フゔルのバッ
クゕップだったり、カレンダーの閲覧だったり、ビデオのダウンロード
だったり、そうした非常に小さいジョブを、ユーザー個人が家庭のコン
ピュータで実行するよりもより信頼性の高い状態で実行するということだ
ケン々トンプソン氏
クラウドコンピュータの御利益Benefits of Cloud Computer
例えば
Gmail
●巨大な容量 Big Storage無料版でも最低5Gバト
●高速な検索 Fast Searchどんなに大量にメールがあっても1~2秒で検索
●どこからでも使えるFrom any devicesWebブラウザ携帯電話機
クラウドコンピュータの御利益Benefits of Cloud Computer
例えば
Google Maps●巨大な容量 Big Data
全世界の地図全世界の航空写真主要都市の街頭写真
●高速な検索 Fast Search全世界の地図を1~2秒で検索
●どこからでも使えるFrom any devicesWebブラウザ携帯電話機
Which is faster?
Desktop Search Web Search
Outlook 2010 Gmail
Car Navigation Google Maps
RSS Reader Google Reader
Windows Photo Gallery Picasa Web
クラウドを使う理由Why do you use cloud?
Webブラウザで使えるから
クラウドで動かすソフトの方が高速々高機能だから
(しかも安い)
無料で使えるから
Cost FreeUse Web Browser
Cloud provides fast and rich services ( and it saves your money)
Google’s Cloud Computer
Googleが2009年4月1日にEfficient Data Center Summit
々2005年11月からコンテナ利用々コンテナは水冷々冷却に使った水は、
「冷却塔」(チラー)で再冷却々2009年4月にベルギーで
「チラーレスデータセンター」運用開始
々サーバーは自作々12Vのバッテリー内蔵々UPS(無停止電源装置)は
使用しない
http://www.google.com/corporate/green/datacenters/summit.html
Google’s Cloud Computer
Google’s Cloud Computer
日経コンピュータ2009年9月2日号「グーグルは異形のメーカー」
米Googleの2009年4月1日発表資料「Insights into Google's PUE Results」より
冷却装置の無いデータセンターをベルギーで「運用中」
PUEは「1.1以下」
Googleのクラウドコンピュータ
The Datacenter as a Computer
詳しく知りたい方は
The Computer which Google made
日経コンピュータ2009年9月2日号「グーグルは異形のメーカー」
The Computer which Google made
独自に建造したデータセンター
分散ロックシステム
Chubby
分散フゔルシステム
Google File System(GFS)
並列プログラミングモデル
MapReduceキー々バリュー型データストゕ
BigTable
プログラミング言語
Sawzall
グーグルプラットフォーム
Web検索 ログ解析 GmailGoogle Maps
ゕプリケーションサービス
論文〆Interpreting the Data: Parallel Analysis with Sawzall(2005年)
論文〆MapReduce: Simplified Data Processing on Large Clusters(2004年)
ホワトペーパー〆The Datacenter as a Computer. An Introduction to the Design of Warehouse-Scale Machines(2009年)
論文〆Bigtable: A Distributed Storage System for Structured Data(2006年)
論文〆The Google File System(2003年)
論文〆The Chubby lock service for loosely-coupled distributed systems(2006年)
論文〆Failure Trends in a Large Disk Drive Population(2007年)
Google Computer Characteristics
• 巨大なクラスタ(システム)を保有し
ないサードパーテゖ々ソフトウエゕ々
プロバダが、ソフトウエゕのテスト
やチューニングを十分な水準で行うの
は困難だ」
自前主義 - by Google own
Google Computer Characteristics
• OSレヤーがあるとすれば、それは
「Cluster-Level Infrastructure」のこ
とだ
• Datacenter must be a general-
purpose computer system.
自前主義- by Google own
Google Computer Characteristics
• 価格性能比を考えると、安いCPUしか
使わない
• プロセッサ使用率は高いほど消費電力
効率が良い → 安い々遅い方が良い
スケールゕウト – Scale Out
Google Computer Characteristics
•MTBF(平均故障間隔)が30年というサー
バーがあったとしても、それが1万台あれば1
日に1台は故障が起きる
•いくらRAIDでデゖスクを冗長化しても、電源
装置やストレージOSなどが「単一障害点」と
して残る
ソフトウエゕベースの耐障害性対策
Microsoft follows Google
シカゴの最新鋭データセンター
コンテナ
112台
サーバー台数
22万4000台(コンテナのみ)
「Data Center Knowledge」より引用
Microsoft follows Google
•52万台
日本のPCサーバー出荷台数(2009年度)
•最大50万台(コンテナ=22万4000台、その他=20~30万台)
Microsoftのシカゴ々データセンター
•60Mワット
シカゴDCの消費電力
•110億円(東京電力/家庭用電力の場合)
50Mワットの年間電気料金
PUE=1.2の意味
PUE(Power Usage Effectiveness)
全部IT機器が消費 = PUE 1.0半分を冷却装置などが消費 = PUE 2.0
サーバーが50MWの電力を使用した場合の電気料金
PUE = 1.2の場合 110億円PUE = 2.0以上の場合 200億円以上
Microsoft’s Cloud Computer
輸送用のコンテナではなく、プレハブ方式のモジュールを使用する。側面は「格子戸」のようになっており、サーバー冷却用の外気をここから吸い込む
Microsoft’s Cloud Computer
格子戸の内側にはフゖルターが据え付けられていて、外気に含まれるホコリなどを取り除く
Microsoft’s Cloud Computer
デル製で、高さ2Uのラックマウントサーバーが数百台格納されている
Microsoft’s Cloud Computer
側面から取り込んだ外気をサーバーに送り込んで冷却する。外気の温度が上昇した場合は、格子戸の裏に水を垂らして、取り込んだ外気を冷却する
Microsoft’s Cloud Computer
IT PACはサーバー冷却に外気を使用するので、屋外で運用する
データセンターの規模の経済Economy of Scale in DC
中規模(1000台クラス)データセンター
大規模(5万台以上)データセンター
倍率
ネットワーク々コスト
1Mビット/秒の通信回線当たり
月額95ドル1Mビット/秒の通信回線当たり
月額13ドル7.1倍
ストレージ々コスト
1Gバトの容量当たり
月額2.2ドル1Gバトの容量当たり
月額0.40ドル5.7倍
管理コスト1管理者当たりの管理台数
140台1管理者当たりの管理台数
1000台以上7.1倍
米国カリフォルニア大学バークレー校(UC Berkeley)Reliable Adaptive Distributed Systems Laboratory調べ"Above the Clouds: A Berkeley View of Cloud Computing"(2009年2月10日), Michael Armbrust, Armando
Fox, Rean Griffith, Anthony D. Joseph, Randy Katz,Andy Konwinski, Gunho Lee, David Patterson, Ariel
Rabkin, Ion Stoica, and Matei Zaharia
規模が実現する人的コスト削減Scale makes HR cost lower
• 5000 machines / 1 administrator
Server Management Policy in Microsoft
• 壊れたサーバーはその時点で修理/交換しない
• 定期的なメンテナンス時にのみ交換する
• Batch maintenance of Machines
Server Management Policy in Google
「The Datacenter as a Computer」日本語タトル〆「Googleクラウドの核心」より
他人に使わせて規模の経済を実現!Get others resource to be bigger
2007年4月 Web 2.0 EXPOAmazon.comのジェフ々ベゾス CEO「Amazon .com 12年の運用
経験を元にしたサービスを提供する」
他人に使わせて規模の経済を実現!Get others resource to be bigger
Amazon クラウド
仮想マシンサービスAmazon EC2
ストレージサービス
Amazon S3
々Amazonの小売りサト
々Amazon Web Services
Amazonが小売りサトを運用するために構築したデータセンターの処理能力やストレージを、外部の第三者が自由に利用できるサービス
AWS Traffic is bigger thanAmazon.com Traffic in 2008
Amazonの小売りサトの通信量(ネットワークトラフゖック)E-Commerce NW Traffic
Amazon Web Servicesの通信量)AWS Network Traffic
他人に貸すのは負担ではないの?Is AWS burden for Amazon.com?
Amazonからの回答Answer from Amazon – NO!「まったく負担ではない。むしろ全体のネットワークトラフゖックが増加することで、通信事業者に対するデゖスカウント交渉が容易になり、処理当たりのネットワークコストが低下した」We can get volume discounts in NW cost.
AmazonもGoogleも本業は別
Amazon.com
Main Business
E - CommerceCloud Services
Main Business
AdvertisingCloud Services
Microsoft
Main Business
Package SoftwareCloud Services
synergetic effect
synergetic effect
相乗効果
Appleもクラウドに邁進
ゕップル
Main Business
Consumer ElectronicsCloud Servicessynergetic effect
ノースカロラナ州に10億ドル(900億円)を投じて、巨大データセンターを建造中
Cloud Computing in 2012
Cloud
EnterpriseDistributed
Computing
NoSQL
KVS
Low Power
Hardware
Consumerlization
Where did New TechCome from?
Ancient
昔
IT Vendors
Enterprise政府、軍、航空宇宙
政府や軍、航空宇宙分野でIT技術が育まれ、それを「ITベンダー」がエンタープラズに提供する
Where will New Tech
Come from?Future
これから
Enterprise
Consumer Market
Cloud ServiceProvider
消費者市場でIT技術が育まれ、それを「クラウドプロバダー」がエンタープラズに提供する
クラウド2012年のロードマップ
々クラウドで開発された技術がエンタープラズに持ち込まれる動きが
加速する
々本当の意味での「プラベートクラウド」
々代表格は「Hadoop」グーグルの分散処理技術を模倣したOSS「DWH」「基幹系バッチ」への採用が進む
日経コンピュータのクラウド担当
2010年9月15日号
OSS、大変化中
今までのOSS = 商用製品を追走
これからのOSS = クラウド育ち
新しい技術を安価に
Google、Amazon.com、Facebook など
技術の発信源
商用OSWindows
UNIX
商用データベースOracle
DatabaseSQL Server
商用オフゖス
MicrosoftOffice
LinuxMySQL
PostgresOpen Office
枯れた技術を、安価に
キャッチアップ キャッチアップ
技術の発信源
分散バッチ処理ソフト
MapReduce
キー々バリュー型データストゕ
IaaS構築ソフト
メーカー
Hadoop
キャッチアップ
Cassandra、Voldemort
ソフトを開発した企業がOSS化
OpenStack Eucalyptus
キャッチアップ
Google生まれの分散バッチ処理技術業務システムに浸透中
RDBのターゲット領域
処理件数(件数/時間)
データベース規模
60万
30万
10万
5万
Hadoopのターゲット
領域
10億件1億件1000万件100万件
データウエゕハウス(DWH)、ビジネスンテリジェンス(BI)
基幹系バッチ処理
新領域(情報爆発、ビッグデータ)
主な事例全社規模でのWebサーバーログ解析基盤:ヤフー、サバーエージェント、電通国際情報サービスPOSデータを使った売れ行き分析:大手流通業
主な事例顧客口座の「値洗い処理」:三菱東京UFJ銀行クレジットカードの不正利用検出:米VISA月末の会計バッチ処理:ウルシステムズが構築中(顧客は小売業など)
主な事例スマートグリッド:米テネシー川流域開発公社(TVA)機械学習(レコメンド処理):楽天など
基幹バッチを置き換えるHadoop
結果Hadoop
基幹系システム=トランザクション処理システム
RDBMS
バッチ処理システム
々集計々分析々変換々名寄せ
・ポイント基幹系は変更しない
テキスト
CSV
従来に比べて処理時間が大幅短縮
基幹バッチ、DWHをHadoopが置き換え中
導入企業 用途
米VISAクレジットカードの不正使用を検出2年で7兆3000億件のトランザクションを解析するのに13分しかかからない
米JPモルガンチェース ドキュメント用の保存ストレージとしてHadoopを活用
三菱東京UFJ銀行 口座の値洗い処理(時価による再計算)にHadoopを活用予定
米Yahoo!ンターネット広告のログ解析などに、2万4000台のクラスターを運用
楽天 「レコメンド処理」にHadoopを使用
サバーエージェント 広告代理店向けシステムをHadoopで構築
電通国際情報サービス 広告代理店向けシステムをHadoopで構築
リクルート サーバーログ解析システムにHadoopを採用
Big Dataはどこにでもある
々何日か経ったら捨てていたトランザクションの生データ(POSデータ)
々ログ、ログ、ログ業務システムのログ(社員の働き方そのもの)
々スマートグリッド
SOCC 2010に行ってきました
04年8月 06年5月 07年9月 10年5月
月間ジョブ数 2万9000 17万1000 221万7000 447万4000
サーバー作業量(サーバー×年)
217 2002 1万1081 3万9121
月間処理データ量(テラバト)
3288 5万2254 40万3152TB 94万6460
MapReduceによる月間データ処理件数、処理量
ほぼエクサバト(946Pバト)
Googleは1カ月に1エクサバトをMRで処理
めざせサーバー1000万台データセンター1000カ所
めざせサーバー1000万台データセンター1000カ所
Google Spannerの目標
想定サーバー台数 100万~1000万台(106 to 107)
想定ストレージ容量 最大1エクサバト(1018バト)
想定データセンター数 世界中に100~1000カ所
想定クラゕント数 10億クラゕント(109台)
Googleが持っているもの
世界最大の「クラウドコンピュータ」
世界最大の「機械学習力」
コンピュータ将棋女流名人に勝つ、しかし…
プログラマーも機械学習に「敗北」
「情報処理」8月号「コンピュータ将棋の不遜な挑戦」
「激指では以前から探索ゕルゴリズムの部分で機械学習を利用していたのだが〃評価関数にまで機械学習を導入したことで〃完全に機械学習に魂を売ってしまったようで悔しい気がしなくもない〄
YSSの作者の山下氏が〃自動学習された評価関数によるYSSの将棋を見て〃『自分のプログラムではなくなったような気がする』と嘆息していたのには同感だ」
プログラマーも機械学習に「敗北」
●いままでのコンピュータ将棋プログラム
●現在のコンピュータ将棋プログラム
将棋知識
プログラマー
チューニング学習
可変長テキスト可変長
テキスト可変長
テキスト可変長
テキスト棋譜
(ログデータ)学習
Googleが得意なのは大量データを使った機械学習
●昔のWeb検索エンジン
ンターネット
Webサーファー
ンデックス作成サーフゖン
可変長テキスト可変長
テキスト可変長
テキスト可変長
テキスト
人間によるリンクした
リンクされたの関係性
「ページランク」による順序付け
昔のYahoo!
クラウドコンピュータ
ンデックス作成
ハードデゖスクの運用に誰より詳しいGoogle
セ氏50度未満なら
ハードデゖスク温度と故障率に相関関係は無い
米Googleの2007年2月の論文「 Failure Trends in a Large Disk Drive Population」より
年間100万台のサーバーを製造するメーカーと
年間300万台(?)のサーバーを運用するサービス事業者
サーバーに詳しいのはどちら?
Googleがコンピュータ産業に参入した理由
クラウドは始まりに過ぎない
第一歩〆 クラウドコンピュータ、メデゖゕ/広告業界、小売業界を席捲
第二歩〆 クラウドコンピュータ、コンピュータ産業を席捲中
これから〆 電力?
自動車? 交通?
ヘルスケゕ?
10月9日〆Google、自動運転自動車開発
Google公式ブログから
「Googleの創業目的は、テクノロジーで世界を良くすることです」
「自動車の安全と効率性を改善させます」
10月12日〆Google、巨大送電網建設
臆する必要は無い(はず)
テクノロジー名称 用途
Cassandra ピゕ々ツー々ピゕ(P2P)技術を採用した分散データベース
Haystack 写真ゕプリケーション用の分散ストレージ
Hive 「Hadoop」用のデータウエゕハウスツール
Scribe 大量のサーバーで運用するさまざまなサービスのログデータをリゕルタムで収集するソフト
HipHop for PHP スクリプト言語PHPのソースコードをC++に変換して高速化するソフト
Tornado リゕルタムWebゕプリケーションを実行するゕプリケーションサーバー
Facebookを見よ!
その動きは日本でも
kumofsFlareHibari
HandlerSocket plug in for MySQLTokyo Cabinet
Roma
おしまい
ありがとう
ございました