dmm.com ラボはなぜsparkを採用したのか？...

40

DMM.COM SPARK

Upload: wataru-shinohara

Post on 23-Jan-2018

1.054 views

Category:

Presentations & Public Speaking

1 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

DMM.COM SPARK

Page 2: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

2015/4 - DMM labo

API

Page 3: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

AGENDADMM Apache Spark DMM Tips

Page 4: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

DMM

Page 5: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

DMM

Page 6: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Page 7: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Page 8: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

SPARK

UC Berkekey Apache

Scala, Python, Java, SQL, R API

Page 9: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Page 10: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

(2014/09)Mahout

SparkJava, Scala, Python

GraphLab

Page 11: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Page 12: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

WHY SPARK

MLlib, GraphX

Hadoop

Page 13: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Hadoop

Page 14: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

item to item

user to item

popular

Page 15: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

1. (Tracking API)

2. (Hive on Spark)

3. (Spark)

4. (Sqoop)

5. API(Play)

Page 16: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

(TRACKING API)Javascript

API

RDB Hadoop

Page 17: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

(HIVE ON SPARK)Spark

Page 18: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

(SPARK - ITEM2ITEM)

Page 19: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

val itemToItems = userProducts.join(userProducts).filter { case (user, ((item1, keyword1, score1), (item2, keyword2, score2))) => item1 != item2}.map { case (user, ((item1, keyword1, score1), (item2, keyword2, score2))) => ((item1, keyword1, item2), score1 * score2)}.reduceByKey(_ + _).mapValues(math.sqrt(_)).map { case ((item1, keyword1, item2), score) => ((item1, keyword1), (item2, score))}.groupByKey().mapValues(_.toList.sortBy(_._2).reverse.take(config.numDisplayItems)).filter { case ((item1, keyword1), items) => items.size >= config.numDisplayItems}.cache()

Page 20: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

(SPARK -USER2ITEM)

MLlib ALS( )

Page 21: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

val model = ALS.train(ratings.map(_._1), config.alsRank, config.alsNumIterations, config.alsLambda) val predictions = model.predict(candidates).groupBy(_.user).map { case (user, ratings) => (user, ratings.toList.sortBy(_.rating) .reverse.take(config.numDisplayItems)) }.cache()

Page 22: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

(SPARK)RDB Hadoop

Page 23: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Sqoop MariaDB

Page 24: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

API item2item(id: ItemId): List[ItemId]user2item(id: UserId): List[ItemId]popular : List[ItemId]

Page 25: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

DEPLOY AND EXECUTE

Jenkins + Build Pipeline + BuildFlow

Page 26: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

(2015/09)Jenkins + Build Pipeline + BuildFlow

Job Script + Git

Hive

Spark

Sqoop

Recommend API(Node.js)

MariaDB(Galera Cluster)

Page 27: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Jenkins + Build Pipeline + BuildFlow

Job Script + Management API

Hive on Spark

Spark

Sqoop

Recommend API(Play)

MariaDB(Galera Cluster)

Page 28: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Management API

File

Hive on Spark

Hive 3

Play

Spark, Hive UDF Util

Page 29: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Page 30: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

AB PDCA

Page 31: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

[ ]

Page 32: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

701

Page 33: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

75 % ↑ 97% ↑

Page 34: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

TIPS

use dataframes or datasetshive

Page 35: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

executor

memoryOverhead

cheat sheet

Top 5 Mistakes to Avoid When Writing Apache Spark

Applications

Page 36: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Page 37: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

HIVE

Spark

HiveContext

Hive on Spark

Page 38: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

DATAFRAMES DATASETS (1.3 - ) Dataframes(1.6 - ) Datasets

Project Tungsten(1.5 - )

Page 39: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Page 40: DMM.com ラボはなぜSparkを採用したのか？レコメンドエンジン開発の裏側をお話します

Realtime RecommendDataframes & DatasetsGraphframes

B E R S KYC O T oL OCTOBER SKY CO.,LTD C t O d · ンデーションツールRtoasterのレコメンドエンジン（カーネル法を採用）の開発も行い、包括的なマーケティングソリューションを提供しています。

株式会社DMM.comラボ様 - Uniadex€¦ · DMM.comラボは、事業の企画営を行うDMM.comと一体化し総合エンターテイメトサ「DMM.com」の要であるシステムの開発・運営から、ネットワークインフラの提供、

VRグラス ① VRG-D01PBK DMM VR動画スターターセット取扱説 … · DMM.comからVR動画を選んだら[今すぐ購入]をタップしてください。購入にはDMM.comへのユーザー登録が必要です。

違⏇・有Ⓣ情報⎬策活動報告 - Safe Line · 株式会社DMM.com auコマース＆ライフ株式会社 GMOペパボ株式会社トランスコスモス株式会社 . 3

株式会社DMM.comラボ様¼š員数1,700万人、月間約25億のページビュー数を誇る総合エンターテインメントサイト「DMM.com 」をICTで支える DMM.comラボ。同社はサービスを担うICTインフラに関して、サービス仮想基盤を個別最適から全体最適へ再構築し、

「明日からできる！面白ガジェットの作り方」プロ生勉強会第35回＠DMM.comラボ

New GOALS 1110 Civictech 色 05 - OUIK | OUIK websiteouik.unu.edu/wp-content/uploads/GOALS_1110_Civictech_X-1... · 2019. 1. 16. · 201811.10 SAT 土会場 DMM.com ラボ南町オフィス

出展企業一覧午前の部 - jobcafe-ishikawa.jp · 81 (同)DMM.com 23 83 ㈱テクノプロテクノプロ・デザイン社 23 87 東京コンピュータサービス㈱ 23

醒琶園口重P口重ロししAY POCOししAY

お客様導入事例 - 合同会社DMM.com 様€¦ · 展開するDMM.com。同社のサービスを利用する会員数は、2900万人(2018年2月時点)を突破。日本を代表する総合エンターテインメントサイトとして、

DMM.comのビジネスを支える物流センター運用性に優れたアンダーレイネットワーク … · DMM.com のビジネスを支える物流センター運用性に優れたアンダーレイネットワークをベースに将来性のある仮想共通基盤を構築

GEEK ACADEMY REAL Vol.2. 「最先端のデータ解析/Apache Sparkを利用したレコメンドエンジン開発」

LANDしOF REALESVATETE しlブ州しO...H∈しPIN6印ST B口Yし円NDしO間S TO ∈i丁H∈R Ml]N隔∈ OR S∈しし LANDしOF REALESVATETE しlブ州しO EA呂丁 BAY PR口PERTY

DMM.com証券口座開設マニュアル - eoji.or.jp · DMM.com証券の口座に関しご不明な点やご質問等ございましたら、DMM.com証券へお問い合わせください。

DMM.com証券口座開設マニュアルeoji.or.jp/fx_trade-img/files/DMM.pdf · 2019-06-27 · 保存形式 png，bmp，gif，tif，tiff，jpg，jpeg，pdf ファイル容量 1ファイル3MB以下

JAPAN LOGISTICS DECEMBER 2018 MARKETBEATS€¦ · System, DMM.com, Sagawa Express started 3D printing services in their collaborative logistics facilities. In addition, the Ministry

AWSでのストリーム処理入門 · 個人向けWeb サービスクリックストリーム分析インプレッションやPVなどのメトリクスレコメンドエンジンや積極

コンテンツプロバイダから見た権威DNSサーバ · 2017. 1. 25. · コンテンツプロバイダから見た権威DNSサーバ 2016年12月1日株式会社DMM.com

終了しました終了しました終了し ... - Lawson · 終了しました終了しました終了しました終了しました終了しました終了しました終了しました

むむかかししばばななししカカフフェェ · 2020. 11. 17. · むむかかししばばななししカカフフェェ ØØööwwnn44êê ßßØØööww ^^ÎÎ

55/65インチ 4Kディスプレイ取扱説明書 ª式会社DMM.com N 安全上のご注意本機をお使いになる前に必ず本書をお読みの上、正しく安全にご使

I - PattayaMnLU幾らLUgnOg払し舶1しめ卜非螺掬熊し押し撃鳴柑Lgらしい0し購零叩噂lL即れ弊し即しP r噌PI怯肌し坤調LLuLHル1 ト舞喋軌範し押し撃螺鴫LLgLU博し朕坤や叫甲

たせしましたアンフォーレオープンしました！ - 安 …...お待たせしましたアンフォーレオープンしました！アンフォーレグランドオープニングイベント（6月1日）にて

「一番いいおすすめを頼む」～5分でわかるレコメンドエンジンの基礎～ (Gunma.web #3 2010/12/11)

PSMDL190910-02 DMM6-144MA-420-430DDPSMDL190910-02 DMM6-144MA-420-430DD 標準仕様書型名 DMM6-144MA-420DD DMM6-144MA-430DD 2019年09月10日合同会社DMM.com DMM6-144MA-420-430DD

Zephyr:オカムラ...ハンガーなしハンガー付ハンガーなしハンガー付ハンガーなしハンガー付ハンガーなしハンガー付ハンガーなし

「プロ生ちゃんウォッチを作ろう！」プロ生勉強会第33回＠DMM.comラボ

株式会社 DMM.com証券 - 【FX・外為】FX取引の外 … 1 1.ログイン当社ホームページにて[外為ジャパンFX ログインはこちら]をクリックします。

DMM.com - HOW TO USE J750...2019/10/30 · DMM.make 3DプリントサービスでJ750のサービスを開始して早くも1年弱の時間が経ちました。大変ご好評とお伝えできる事が望ましいですが、実際には多くのお客様にご利用頂

APRICOT 2015 JANOG session "Traffic in Japan" DMM.com Labo

仕出し割烹しげよし¹´06月12日現在仕出し割烹しげよししだしかっぽうしげよし明治45年創業の料亭「寿美家」仕出し部門による、高級日本料理のお

919080-5 ATC930 1907...5 確認しましょう確認しましう AT-C-930 ：約39kg？困たときにはお手入れしましうましう準備しましう！安全上のご注意

Press Release › wp-content › uploads › 2015 › 10 › 【PR...Press Release! ＜DMM.com Groupとは＞ DMM.comグループでは、無店舗型デジタルコンテンツ配信、DVD販売、DVDレンタルからFX・CFDの運営、さらには、オンラインゲーム制作・

New 平成27年度卒業者（就職者）の就職先一覧【学域】 - … · 2016. 8. 2. · （株）DMM.comラボ 12 3 （株）NTTデータ・アイ 10 （株）TKC 10 （株）インテック

ICTSC5 DMM.comラボの紹介+お給料の話