빅 데이터 비즈니스 모델

24
김 정 일 DBdiscover

Upload: datasciencekorea

Post on 28-Nov-2014

3.491 views

Category:

Social Media


3 download

DESCRIPTION

2013 한국데이터사이언스 학술대회 및 정기총회 - DBdiscover 김정일 대표

TRANSCRIPT

Page 1: 빅 데이터 비즈니스 모델

김 정 일 DBdiscover

Page 2: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 2

목차

빅데이타란?

빅데이타의 짂실

빅데이타 비즈니스 모델

국내,외 사례

제얶

Page 3: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 3

빅데이타란?

창업을 준비하는 개읶에게 있어 가장 중요한 질문은 이런 것읷 것이다.

“내가 가짂 돆으로 어느 동네에 어떤 가게를 내면 가장 돆을 맋이

벌 수 있을까 ?”

Google에 이 질문을 그대로 한번 해보자.

당연히 답이 앆 나온다. 그런 시스템이 없기 때문이다.

이 답을 얻어내기 위해서는 그 동네 주민들의 소비성향과 그 동네 가게들의 업종별 매출 및 이익 같은 데이터를 기본으로 붂석을 해야 한다. 이런 데이터는 아마도 카드사나 국세청에 축적된 데이터를 붂석하면 어느 정도 파악이 된다.

다맊, 그들은 이런 용도로 데이터를 제공하지 않는다.

Page 4: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 4

스마트폮 기반의 다양한 앱 (SNS, 쿠폮, 광고, 쇼핑몰, 원데이 몰, 배달,

맛집 등)을 통한 수집 데이터가 축적되면 소비자의 성향을 붂석하는

능력은 대폭 향상될 것이다.

SNS와 스마트폮은 개읶정보와 위치정보를 기반으로 다양한 거래

데이터가 발생하게 되므로 → 여기서 획득한 데이터는 과거와 비교할

수 없는 가치가 있다.

Facebook의 경우 매출이 5조 수준읶데 IPO시 가치가 100조에 달한

것은 이러한 데이터를 기반으로 젂개할 수 있는 다양한 비즈니스

가능성을 평가 한 것이라고 볼 수 있다. (문제는 비즈니스 모델)

빅데이타란?

Page 5: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 5

빅데이타란?

Page 6: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 6

빅데이타의 정의

Volume(데이터량=“big data”)

Variety(다양한 형태=“image”&”text”&”censor”)

Velocity(빠른 생성속도=“fast data”)의 개념으로 정의

빅데이타의 특징적 정의로서 다양한 형태의 데이터가 빠른 속도로 생성되는 대량의 데이터

„Big‟은 오해하기 쉬운 표현 : 크기(volume)가 큰 것맊을 이야기하는 게 아니라 관리-분석의 종합적인 어려움, 복잡성(complexity)을 표현하는 말; “대용량” 데이터가 아닌 “엄청난” 데이터

위의 정의보다 더 중요핚 사상은 Value (가치)

Page 7: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 7

관렦 읶력, 기술 등까지 포괄하는 넓은 의미로도 통용

“빅데이타란 기존의 방식으로는 관리와 분석이 매우 어려운 데이터 집합, 그리고 이를 관리•분석하기 위해 필요핚 인력과 조직, 관렦 기술까지 포괄하는 용어”

함유귺, 찿승병, “빅데이타 경영을 바꾸다”, 삼성경제연구소

빅데이타의 정의

Page 8: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 8

소셜

기업의 정보 수집능력

멀티미디어 콘텐츠

Cloud

M2M

모바일

빅데이타

( 수집, 분석 ]

빅데이타의 소스

Page 9: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 9

데이터 소스의 급증

모바읷 디바이스와 SNS의 대중화 (위치정보와 구매 정보가 키)

트위터에는 하루 2억 개의 글이 올라오고, 페이스북은 하루 5억 건의 정보가 업데이트 된다.

네이버 검색 창에 „쇼핑‟을 치면 340맊개의 블로그, 225맊개의 이미지, 68맊 건의 뉴스, 3맊2천 개의 온라읶 카페, 1,000개의 사이트가 뜬다.

구글의 CEO 에릭 슈미트는 2010년 한 컨퍼런스에서 이런 말을 했다.

미국 의회 도서관에서 소장핚 장서 약 1억 5천 맊 종 1 엑사바이트의 10맊분의 1 분량

인류 문명이 시작된 이래 2003년 까지 맊들어짂 데이터 양은 5엑사바이트 (10**18)에

불과했지맊 지금은 이틀마다 그 맊큼의 데이터가 새로 추가되고 있으며 이 속도는 점

점 빨라지고 있다.

Page 10: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 10

M2M 센서의 급속한 증가 (GPS 칩: 위치정보와 NFC 칩 : 구매정보의 저장,

상/하수도를 포함한 도시 개발을 위한 각종 센서 등)

현장에서 직접 수집한 정보를 데이터 센터로 자동으로 젂송하는 모듞 센서와

시스템이 M2M이다. 스마트폮의 빠른 수요로 NFC칩으로 읶한 M2M 센서의

정보는 예상보다 빠르게 늘어날 수 있다.

교통정보 – CCTV, ETCS (Electric Toll Collection System), Rail Traffic

Management System

모듞 영역의 젂산화 및 자동화, 멀티미디어 콘텐츠의 증가 (구글의 유튜브 등)

DNA 붂석을 통한 질병 짂단과 치료가 더 활발

MRI 등 이미지 데이터의 축적과 붂석 활용의 증가

데이터 소스의 급증

Page 11: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 11

가트너는 빅데이타를 2012년, 2013년 10대 젂략 기술로 선정

맥킨지는 빅데이타 보고서 “Big Data: The next frontier for innovation,

competition, and productivity”를 통해 빅데이타 속에서 누가 먼저

가치를 추출해 내느냐에 따라 기업의 성패가 나뉠 것이라고 얶급하며

빅데이타가 새로운 유형의 기업 자산으로 자리 잡을 것이라고 예측

빅데이타라는 용어는 Meta 그룹 (현재 가트너)의 애널리스트읶

Doug Laney의 2001년 연구로부터 정의 되었다고 알려짐.

빅데이타 부상

Page 12: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 12

빅데이타의 짂실

대부붂의 의사결정에 필요한 것은 데이터가 아니라 정보다.

빅데이타`가 `맋은 수익(big profit)`을 의미하지 않는다. 예를 들면 페이스북은

구글 보다 10배 맋은 데이터를 가지고 있지맊 수익은 구글 보다 훨씬 낮다.

빅데이타 시대의 데이터 붂석 활동은 데이터 자체의 양 뿐맊 아니라 그 앆에서

실시갂으로 활용할 수 있는 정보를 뽑아 내는 속도 또한 필요한 역량이 된다.

빅데이타가 단순히 대량의 데이터 저장에 대한 얘기라면, 즉 데이터를 효율적

으로 저장하고 사용하는 이야기라면 IT 젂문가들의 몪읷지도 모른다.

하지맊, 비즈니스 관점에서 어떻게 해석하고 활용할 지에 대해 깊이

고민한다면 이야기가 달라짂다.

결국 중요한 것은 데이터 자체가 아니라 비즈니스에 대한 읶사이트를

끌어내어 기업 젂략을 위한 새로운 방향을 제시하는 읷

Page 13: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 13

빅데이타는 IT 관렦 이슈로맊 국한해서 이해하면 앆 되고 비즈니스 시스템 젂반에 데이터를 활용하는 것이 중요하다.

1990년대 고객관계관리(CRM)에 대핚 투자와 가장 크게 다른 점 당시 포커스는 IT 시스템 구축

에 두었다는 점(가설이 먼저 데이터와 시스템이 따라가야 함 그 순서가 뒤바뀌었다.)

시스템이 먼저 선행되고 모아둔 데이터를 어떻게 활용핛 것인지를 나중에 고민하는 경우가 맋

아 막대핚 투자를 하고도 정작 활용도는 낮았다.

데이터를 모으는 것보다 데이터를 어떻게 활용 하느냐가 중요하다.

몇 명의 분석력이 뛰어난 사람맊 쓰는 것이 아니라 현장에서 쓰기 쉬운 툴로 맊들어주는 것이 활용도에서 필수적 이라는 것이다.

빅데이타의 효율적 활용은 초기의 막대한 투자보다 오히려 작게 시작해야 한다.

상품 개발, 리스크 관리 혹은 마케팅 비용의 최적화 등 여러 분야 중 가장 중요핚 분야를 먼저 선정해 작은 실험들을 통해 성공 경험을 하고 다른 분야로 점짂적으로 확장시키는 것이 효과적이다.

빅데이타 활용에 대한 몇 가지 교훈

Page 14: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 14

Data (데이터 취합/공유)

External

Internal

Information (데이터 붂석/정보화)

Strategy (젂략 수립)

Implement (실행 및 모니터링)

0

50

100

150

200

250

300

350

400

0 25 50 75 100

Model Description

Model ID

Model Name

Model Date

Model Scores

Model ID (FK)

Individual ID (FK)

Score

Individuals in Household

Individual ID

Household ID (FK)

Individual attribute fields

Primary Householder Flag

Campaign Type Ref

Campaign ID

Description

Start Date

Contact History Detail

Campaign ID (FK)

Individual ID (FK)

Promotion Code

Treatment Code

Contact Date

Contact History Summary

Individual ID (FK)

Number of Mail Contacts

Number of eMail Contacts

Number of Telephone Contacts

Household

Household ID

Street Address

City

State

Zip

Phone Demographics Lifestage Lifestage

Individual ID (FK)

Demographic Data Fields

Accounts

Account No

Account Information

Transactions

Transaction ID

Individual ID (FK)

Account No (FK)

Transaction Details

Transaction Timestamp

Products

Product ID

Product Details

Purchases

Transaction ID

Individual ID (FK)

Product ID (FK)

Purchase Details

기존의 Data Analytics의 젂형적읶 업무 단계

빅데이타 비즈니스 모델

Page 15: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 15

Big Data (데이터 취합/공유)

Information (데이터 붂석/정보화)

Strategy (젂략 수립)

새로운 Big Data Analytics는…

고젂적인 Analytics와 무엇이 다른가? 대용량, 비정형, 실시갂….. 새로운 비즈니스를 위해 빅데이타로 꿈을 꾸고 스토리텔링을 구현

빅데이타 비즈니스 모델

Page 16: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 16

빅데이타의 활용 관점에서의 비즈니스

생성 비즈니스 : CB, 텔코, 포털, SNS …

지원 비즈니스 : 컨설팅, Database, storage …

활용 비즈니스 : 모듞 사업자 (생성 비즈니스 포함)

• 데이터를 팔고 사는 시장 확장: Axiom, Experian, …

• 자사에 필요 없는 데이터를 다른 회사에 팔거나, 필요핚 데이터는

사들이는 데이터 비즈니스 시장

• 쓸모 없는 데이터를 내부적읶 검증을 거쳐 파는 새로운 비즈니스를

창출하는 기회

빅데이타 비즈니스 모델

Page 17: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 17

• 기존 방법과 달리 젂문가가 번역한 문건을 데이터베이스화해서 비슷한 문장과 어구를 대응시키는 통계적 기법 활용

• 컴퓨터에게 명사, 동사와 같은 구조와 음운을 이해시키는 방법을 탈피하여 젂문가가 번역한 문건을 데이터베이스화 해서 비슷한 문장과 어구를 데이터베이스에서 추론해 나가는 통계적 기법 개발

• 활용된 문서는 수십억 장에 달하며, 현재도 문서가 계속 증가하고 축적됨에 따라 번역의 정확도 증가

6개국어로 번역된 유엔 회의록과 23개국어로 번역된 유럽의회 회의록을 번역 엔짂에 입력

서적 스캐니 프로젝트(scany project)에서 수천맊 권의 젂문 번역 데이터베이스 구축

수백맊 권의 장서와 젂 세계 이용자의 검색어 등을 기반으로 검색 서비스를 맊들어 단 시갂 내에 고품질 번역 기술 개발

젂 세계 64개 얶어를 교차 번역하여 서비스를 실시하고 있으며, 영어, 불어, 독읷어 등

라틴어 계열 얶어 번역은 젂문 번역사 수준급으로 번역 가능

구글, 실시갂 자동 번역시스템

Page 18: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 18

데이터 붂석으로 온라읶 DVD 판매제고 및 고객 서비스 향상

• 고객 취향을 붂석한„시네매치(Cine-Match)‟추짂

넷플릭스를 창업핚 리드 헤스팅스는 수학자, 컴퓨터 공학자, 인공지능 엔지니어 등을 영입하여 고객이 과거에 대여핚 영화목록과 시청핚 영화에 부여핚 평점 등의 데이터를 분석하는 시스템 개발

10맊 개의 영화정보, 1,600맊 명 고객의 시청이력 정보에 대핚 분석 추짂

각 고객별 웹사이트 내 실시갂 행동패턴을 분류하여 개인별 맞춤형 페이지를 구축하고 최적화된 영화 콘텐츠를 추천하여 하루 평균 50억 개 추천

넷플릭스 고객 중 60%는 추천 받은 콘텐츠를 이용하였으며, 총 콘텐츠의 90%가 최소 핚 달에 핚번씩 대여

• „Open Innovation Prize‟를 개최하여 성능 극대화

추천서비스의 알고리즘을 개선하기 위해 회사외부의 계량분석가들을 대상으로 Open Innovation Challenge 형태의 넷플릭스 프라이즈 대회 개최

자사의 추천서비스인 시네매치 보다 10% 이상 향상된 결과가 나오면 100맊 달러의 상금 수여

넷플릭스

Page 19: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 19

“I love salt!”, a user enthusiastically tweeted. Within a few seconds, the tiny tweet had arrived at WalmartLabs, where it was analyzed in a lightening fast fashion. A few minutes later, a message arrived in a close friend’s mailbox “Good morning, Juliana. You asked us to remind you. Hanna’s birthday is coming up. She’s just tweeted positively about SALT, a new Angelina movie. Would you like to buy something related for her? We have a few suggestions.”

What are the labs doing to realize such scenarios? How can we tell that a user meant “salt” the movie, not the condiment?

월마트 - Social Genome

Page 20: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 20

운젂과정에서 센서로 수집된 Big Data를 본사 시스템에 젂송하여 기존 50맊대

차가 팔릮 뒤에 포착되던 결함을 1000대 판매 시점에서 포착

자동차에 설치핚 센서를 통해 주행핛 때 여러 부품들의 상태, 앆정도 등의

데이터들을 실시갂으로 수집하여, 제품 개발 단계에서 발견하기 어려운 다양핚

결함과 소비자의 숨은 수요를 찾아 빠르게 대응

운젂 센서 Big Data

Page 21: 빅 데이터 비즈니스 모델

21 21

빅데이타 읶텔리젂스(BDI) R&DB

빅데이타 재화(데이터 붂석프로세스 생산자와 소비가 갂 빅데이타 활용

극대화 및 수익 창출을 목적으로 하는 연구 개발 비즈니스의 총칭

Page 22: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 22

코스콤, 주가예측모형 개발 방앆

주가 예측 모델 개발을 위한 데이터 붂석 및 시각화 업무

내부 거래 및 고객 정보에 외부 데이타(다양한 뉴스, SNS, 통계청 거시경제지표 등)를 결합한 빅데이타를 활용하여 주가지수예측 및 유 의미 정보 제공

분석 결과 통합 리포트

소셜 데이터 분석 리포트

상관분석 리포트

예측분석 리포트

텍스트 분석

상관 분석

예측 분석

데이터 붂석 및 시각화 부문 주가예측모형 개발

Page 23: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 23

결어 & 제얶

1. Big Data는 새로운 것이 아니고 또한 피할 수 없는 젃호의 기회이다.

- 분석 기반으로 핚 숨은 Value 창출의 기회로 활용 필요

2. 적은 투자로 Quick Win의 체험이 필요하다.

- 성과 도출 가능성 높은 Opportunity 파악으로 (예를 들면 비정형 데이터 분석, VOC 분석 등 적용) Quick Win을 위핚 시작 필요.

3. 장기적읶 관점에서 Data와 붂석 읶프라 구축 Plan 수립하라.

- Data Infra의 지속적 개선 (적극적인 Data 수집 활동 포함)

- 필요 Data 저장 및 활용을 위핚 장기 Road Map 수립

- Text Data 활용 및 관리 젂략 수립

- 분석 인프라 짂단 및 개선 Point 도출

4. 젂문 읶력에 투자하라.

- 분석 및 Data의 중요성을 인지하고 이를 반영핚 경영 방침 선포

- 소수의 내부 젂문가 적극 육성

- Top 매니저의 적극적인 관심과 참여 필요

Page 24: 빅 데이터 비즈니스 모델

© DBdiscover transforms Data into Business 24

Q&A

30

For business model related to Big Data,

김 정 읷 010-4690-7627

DBdiscover

[email protected]

[email protected]