상품의상품의상품의상품의 구매후기구매후기구매후기구매후기 … · 상...

6
상품 상품 상품 상품 매후기 매후기 매후기 매후기 분석 분석 분석 분석 통한 통한 통한 통한 점발 점발 점발 점발: 호텔 호텔 호텔 호텔 산업 산업 산업 산업 중심로 중심로 중심로 중심로 박배 박배 박배 박배 a ∙ 하성호 하성호 하성호 하성호 b a 북대학 영학부 박사정 대역시 대학로 80 Tel: +82-53-950-5440, Fax: +82-0303-3440-1871, E-mail: [email protected] b 북대학 영학부 대역시 대학로 80 Tel: +82-53-950-5440, Fax: +82-0303-3440-1871, E-mail: [email protected] Abstract 연는 온라 사용 콘텐츠 (User-Generated Contents, UGC)활용한 기업 평판리 방안 마련해 한다. 다양한 UGC소비가 온라상에 직접 성한 매후기를 활용하 후기성 활발 산업 호텔산업 선정하였다. 다수 온라 투숙후기 사트 (: Booking.com, Hotels.com, Expedia.com) 역사와 신력 면에서 대표 TripAdvisor.com 투숙후기 데터를 활용하였 . 분석 감성분석(sentiment analysis) 적용 토픽모델(topic model) 확분석 토대로 호텔 상품 중요 속성추출(aspect extraction) 해당속성 감성(sentiment on aspect) 판별한다. 통한 점발 분류로 호텔기업 평판리 개선에 방안 제안에 바지 한다. 상품에 대한 매후기를 활용하는 방법 통해 데터 시대에서 비정형 데터 대부분 차지하 텍스트 정보 가치 재발 활용 민할 기회와 시사점 제해 . Keywords: 감성분석, 토픽모델, 평판리 Ⅰ. . . . 서론 서론 서론 서론 폭발적로 증가하는 소비들 온라 표출 소셜 미디어 UGC활용한 양한 연들 주목 받아오기 시했다 (Leskovec, Adamic, & Huberman, 2007). 소셜 미디어란 사용 개개 직접 내용 생성(User Generated Contents) 참여들 생성된 정보 통해 상호용 가능케 하는 온라 서비스 통칭해서 내릴 , 질적로 다양하 양적로 방대함로 특성 된다(Berger & Milkman, 2012; Palka, Pousttchi, & Wiedemann, 2009). 대표적 소셜 미디어 UGC 서비스로는 맥리 형태 스타그램, 페스북, 트터등 존재하며 특정 상품 주제에 포럼, 블로그, 좀더 체적 정제된 형태 매후기 형태 서비스는 여전히 진화하 . 하지만, 실시간 쏟아지는 방대한 분량 사용 생성 컨텐츠는 그것 지니 가치에도 불하 정보부하(information overload) 제를 야기하 기도 한다. 압도될 정도로 방대한 UGC정보를 활용 통찰력 습득 가치창출 방안 모색 소비 뿐만 아니라 영진 에서도 중요 심사 . 만약 방대한 UGC활용한 해당 기업 소비 온라상에서 지속적로 모니터링하 그에 상하는 선제적 가능하다면, 기업 평판 제는 개선사항 조속히 영한 품질 개선에도 바지 것다. 라서, 도출된 소비 불만 사항들 형화 시킬 다면 해당 제품 체적 시하는 것데, 토대로 개선 방안 제할 다는 논리에 기초한 연다. 연에서는 다양한 UGC기업 평판에 직접적 연성 매후기 사트를 대상 특정하여 분석해 한다. 하지만, 후기 활용한 연에서 감성분석 긍정, 또는 부정로 분류된 감성 긍정적 상호 파악에 편중(Luca, 2011)되어 부정 활용 상대적로 등한시 되어 왔다. 불만 투영된 부정적 통해 추해 제품 또는 서비스 파악 체가 지닌 중요성에도 불하, 막상 활용한 질적 평판리 개선방안에 연는 극히 미비 실정다(Abrahams et al., 2015). 맥락로 연에서는 서비스 상품 온라 매후기를 통해 소비들 감성 분석 , 부정 감성로 분류된 후기들 기반로 픽모델 적용하여 객에게 제하는 서비스 형화 함로써 기업 평판 제할 방안 제안하 한다. 산업 선정, 대표적며 신력 2015 한국경영정보학회 추계통합학술대회 -571-

Upload: others

Post on 31-Aug-2019

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 상품의상품의상품의상품의 구매후기구매후기구매후기구매후기 … · 상 새로운 사실이 아니라고 해도 과언이 아니다. 다양한 선행 연구를

상품의상품의상품의상품의 구매후기구매후기구매후기구매후기 분석을분석을분석을분석을 통한통한통한통한 결점발견결점발견결점발견결점발견: 호텔호텔호텔호텔 산업을산업을산업을산업을 중심으로중심으로중심으로중심으로

박경배박경배박경배박경배a ∙∙∙∙ 하성호하성호하성호하성호b

a 경북대학교 경영학부 박사과정

대구광역시 북구 대학로 80

Tel: +82-53-950-5440, Fax: +82-0303-3440-1871, E-mail: [email protected]

b 경북대학교 경영학부 교수

대구광역시 북구 대학로 80

Tel: +82-53-950-5440, Fax: +82-0303-3440-1871, E-mail: [email protected]

Abstract

본 연구는 온라인 상의 사용자 제작 콘텐츠(User-Generated Contents, 이하 UGC)를 활용한 기업의 평판관리 방안을 마련해 보고자 한다. 다양한 형태의 UGC중 소비자가 온라인상에 직접 작성한 상품의 구매후기를 활용하고자 후기작성이 가장 활발한 산업군인 호텔산업을 선정하였다. 다수의 온라인

투숙후기 제공 사이트 중(예: Booking.com, Hotels.com,

및 Expedia.com등) 역사와 공신력 면에서 가장 대표적인 TripAdvisor.com의 투숙후기 데이터를 활용하였다. 분석을 위해 감성분석(sentiment analysis)의 적용

후 토픽모델(topic model)의 확장분석을 토대로 호텔상품의 중요 속성추출(aspect extraction) 및 해당속성의 감성(sentiment on aspect)을 판별한다. 이를 통한

결점발견 및 분류로 호텔기업의 평판관리 개선에 기여 할 수 있는 방안 제안에 이바지 하고자 한다. 특정 상품에 대한 고객의 구매후기를 활용하는 방법을

통해 빅 데이터 시대에서 비정형 데이터의 대부분을

차지하고 있는 텍스트 정보의 가치 재발견 및 활용에 관해 고민할 기회와 시사점을 제공해 보고자 한다.

Keywords:

감성분석, 토픽모델, 평판관리

ⅠⅠⅠⅠ. . . . 서론서론서론서론

폭발적으로 증가하는 소비자들의 온라인 상 의견

표출의 장인 소셜 미디어 혹은 UGC들을 활용한 다

양한 관련 연구들이 큰 주목을 받아오기 시작했다

(Leskovec, Adamic, & Huberman, 2007). 소셜 미디어란

사용자 개개인이 직접 관련 내용을 생성(User

Generated Contents) 하고 참여자들이 생성된 정보의

공유를 통해 상호작용을 가능케 하는 온라인 서비스

를 통칭해서 정의 내릴 수 있으며, 질적으로 다양하

며 양적으로 방대함으로 특성 된다(Berger & Milkman,

2012; Palka, Pousttchi, & Wiedemann, 2009). 대표적인

소셜 미디어 및 UGC 서비스로는 인맥관리 형태의

인스타그램, 페이스북, 및 트위터등이 존재하며 특정

상품 및 주제에 관한 포럼, 블로그, 및 좀더 구체적

이며 정제된 형태의 구매후기 등이 있으며 그 형태

와 서비스는 여전히 진화하고 있다.

하지만, 실시간 쏟아지는 방대한 분량의 사용자

생성 컨텐츠는 그것이 지니고 있는 가치에도 불구하

고 정보과부하(information overload)의 문제를 야기하

기도 한다. 압도될 정도로 방대한 UGC정보를 활용

한 통찰력 습득 및 가치창출의 방안 모색은 소비자

뿐만 아니라 경영진 입장에서도 중요 관심사일 것이

다. 만약 방대한 양의 UGC를 활용한 해당 기업의

소비자 반응을 온라인상에서 지속적으로 모니터링하

고 그에 상응하는 선제적인 대응이 가능하다면, 해

당 기업의 평판 제고는 물론 개선사항을 조속히 반

영한 품질 개선에도 이바지 할 수 있을 것이다. 따

라서, 도출된 소비자의 불만 사항들을 유형화 시킬

수 있다면 이는 곧 해당 제품의 구체적인 결함을 암

시하는 것인데, 이를 토대로 개선 방안을 제고할 수

있다는 논리에 기초한 연구이다.

본 연구에서는 다양한 UGC들 중 기업 평판에

직접적인 연관성이 있는 구매후기 사이트를 대상으

로 특정하여 분석해 보고자 한다. 하지만, 구매 후기

를 활용한 많은 연구에서의 감성분석은 긍정, 또는

부정으로 분류된 감성 중 긍정적인 의견과 경영 성

과와의 상호 관계 파악에 편중(Luca, 2011)되어 부정

적 의견의 활용은 상대적으로 등한시 되어 왔다. 고

객의 불만이 투영된 부정적 의견을 통해 유추해 볼

수 있는 제품 또는 서비스의 결점 파악은 그 자체가

지닌 중요성에도 불구하고, 막상 이것을 활용한 실

질적인 평판관리 개선방안에 관한 연구는 극히 미비

한 실정이다(Abrahams et al., 2015).

위와 같은 맥락으로 본 연구에서는 서비스 상품

의 온라인 구매후기를 통해 소비자들의 감성을 분석

하고, 부정 감성으로 분류된 후기들을 기반으로 토

픽모델을 적용하여 고객에게 제공하는 서비스의 결

점을 유형화 함으로써 기업의 평판을 제고할 수 있

는 방안을 제안하고자 한다. 이를 위해 관광산업을

선정, 가장 대표적이며 공신력이 있는

2015 한국경영정보학회 추계통합학술대회

-571-

Page 2: 상품의상품의상품의상품의 구매후기구매후기구매후기구매후기 … · 상 새로운 사실이 아니라고 해도 과언이 아니다. 다양한 선행 연구를

TripAdvisor.com으로부터 호텔 투숙 사용후기를 확보

하여 분석에 활용하고자 한다.

고객의 특정 제품에 대한 온라인 사용 후기를 활

용하는 방법은 빅 데이터 시대에 걸맞게 방대한 양

의 비정형 데이터(텍스트)를 즉각적으로 분석하므로

시의 적절하게 고객 반응을 모니터링 및 추적을 가

능케 하고, 드러난 서비스 결점에 선제적으로 대응

할 수 있으며, 부정적 후기가 삽시간에 다른 잠재고

객에게 미치는 부정적 영향 또한 최소화할 수 있을

것이다. 이를 통해, 폭발적으로 증가하는 비정형 텍

스트 정보의 활용 가치의 극대화에 대해 고민해 보

고 서비스 기업의 평판관리에서 의미 있는 시사점을

제공해 보고자 한다.

ⅡⅡⅡⅡ. . . . 선행선행선행선행 연구연구연구연구

구매후기를구매후기를구매후기를구매후기를 활용한활용한활용한활용한 연구연구연구연구

온라인 구매 또는 투숙 후기는 호텔 및 관광산업

에서 소비자 행동 및 경영성과를 이해하는 데 있어

큰 영향력을 미치는 가장 중요한 형태의 UGC라 할

수 있다. 고객이 자발적으로 작성할 수 있는 특정

제품에 대한 구매 후기는 일반적으로 (1)제품에 대

한 평점 (rating)과 (2)제품에 대한 고객의 구체적인

생각 또는 의견으로 구성된다.

소비자가 특정 제품을 언급 할수록 보다 많은 사

람들이 그 제품에 대해 알게 될 것이며 (후기의 개

수), 특정 제품에 긍정적인 평점이 부여되면 부정 평

점의 제품보다 고객의 상품 구매를 더욱 유도할 것

이라는 점에 착안하여 (Dellarocas et al., 2007), 후기의

양(개수)과 평점이 제품의 판매 성과 또는 경영 실

적에 미치는 영향에 관한 연구들이 다수 진행되었다

(Chevalier & Mayzlin, 2006; Dellarocas et al., 2007; Liu et

al., 2013; Ye et al., 2011). 이들의 연구에서 알 수 있는

중요한 시사점은 구매 후기와 경영 성과 간에 강한

상관관계가 존재한다는 것이다.

이를 바탕으로, 제품 구매 후기 구성 요소의 한

축인 후기 평점과 후기 개수를 활용하는 연구와 나

머지 다른 한 축인 후기 내용 분석을 기반으로 훨씬

구체적이며 실질적인 방안을 모색해 보는 연구들이

계속적으로 발전하게 된다 (Archak et al., 2007; Ghose

et al., 2012).

선행 연구들 중 Archak et al. (2011)의 연구는 숫자

의 요약인 평점과 후기 개수가 지닌 근본적인 한계

점을 지적하였고 후기 내용 분석의 중요성에 주목하

였다. 기존의 연구들에서는 평점을 5점(또는 10점)

만점으로 중간 점수, 즉 3점(또는 5점) 이상이면 긍

정, 이하이면 부정으로 분류하여 고객의 일반적 반

응 또는 감성을 유추하였는데, 평점과 후기 개수는

다분히 1차원적인 분석이라 할 수 있다. 이를 통해

서는 다차원적이며 다양한 고객의 개별 선호도 파악

은 불가능하며, 이러한 맹점을 극복하기 위해선 반

드시 후기 내용 자체를 분석해야 한다.

감성분석감성분석감성분석감성분석 (Sentiment Analysis)

구매 후기 내용의 중요성을 반영하여 이를 보다

심도 있게 연구하는 텍스트마이닝 (text mining) 기법

의 감성분석 활용 연구들이 나타나게 되었다. 감성

분석은 개체, 개인, 이슈, 이벤트, 주제에 관한 사람

들의 의견, 평가, 태도 및 감정 등을 분석하는 방법

(Liu, 2010, 2012)으로, 후기 내용을 긍정, 부정, 또는

중립으로 세분하는 연구에서 제품의 속성에 기반을

둔 분석 (Blair-Goldensohn et al., 2008; Popescu &

Etzioni, 2007)에 이르기까지 다양한 형태로 진화하게

된다. 광범위한 감성 분석에 관한 정리는 Pang and

Lee (2008)와 Liu (2015)의 연구를 통해 확인할 수 있

다.

구매 후기를 감성 분석에 활용한 대표적인 연구

분야는 영화 후기 (Singh et al., 2013), 정치 분야

(O'Connor et al., 2010; Stieglitz & Dang-Xuan, 2012), 제

품 후기 (Zhang et al., 2012), 주식 시장 (Bollen et al.,

2009; Bollen et al., 2011), 호텔 산업 (Ghose et al., 2012;

Ye et al., 2009; Ye et al., 2011)에 이르기까지 다양하다.

다시 말해, “고객의 소리” 를 들을 수 있는 곳이면

연구 분야는 제한이 없다고 봐도 무방할 것이다.

감성 분석은 크게 문서 수준 (document-level), 문

장 수준 (sentence-level), 속성 수준 (aspect-level)의 세

가지 방법이 존재한다. 문서 수준의 분석에서는 개

별 문서 전체를 이용하여 감성을 판별하고, 문장 수

준의 분석에서는 문서 내에서 각 문장의 감성을 구

분하게 되며, 속성 수준의 분석에서는 한 문장 내에

서 언급된 서로 다른 속성에 기반하여 감성구분을

수행한다. <그림 1>은 감성분석의 세 가지 형태를

도식화한 것이다.

그림그림그림그림 1 – 감성감성감성감성 분석의분석의분석의분석의 세세세세 가지가지가지가지 유형유형유형유형:

문서문서문서문서, 문장문장문장문장, 속성속성속성속성 수준수준수준수준

본 연구에서의 감성 분석은 개별 소비자에 의해

생성된 후기를 각각의 서로 다른 문서로 취급하여

2015 한국경영정보학회 추계통합학술대회

-572-

Page 3: 상품의상품의상품의상품의 구매후기구매후기구매후기구매후기 … · 상 새로운 사실이 아니라고 해도 과언이 아니다. 다양한 선행 연구를

긍정 또는 부정 감성으로 판별하는 것에 목적을 두

고 있다. 따라서, 본 연구는 문서 수준의 감성 분석

을 수행하는데, 이것은 토픽 모델링을 위한 전단계

이면서 정교함을 향상시키기 위한 필터링 성격의 분

석이라 할 수 있다.

감성 분석에서는 개별 후기가 분석의 기본 단위가

되며, 비정형 구매 후기 텍스트가 분석에 적합하도

록 다음과 같은 다섯 가지 요소로 구조화 과정을 거

친다. 즉, 감성분석의 최종 목표는 SOijkl 의 값을 기

반으로 양과 음의 감성을 가진 후기들을 판별해 내

는 것이다.

Quintuple (ej, ajk, SOijkl, hi, tl)

여기서, ej = 대상 제품 (entity),

ajk = 제품의 속성 또는 특성 (aspect),

SOijkl = 제품 e의 속성 a에 관한 특정 시점 t에

서 구매작성자 h에 의한 최종 감성 점수, 양 또

는 음의 값으로 산출 (sentiment orientation),

hi = 후기 작성자 (opinion holder),

tl = 후기가 작성된 시점 (time)

토픽모델토픽모델토픽모델토픽모델(Topic Model)

토픽 모델링은 Latent Dirichlet Allocation (LDA) 알

고리즘을 기반으로 계산된 절차적 확률 분포 모델로,

텍스트마이닝 분야에서 사용하는 유용한 지식 발견

도구이다 (Blei et al., 2003). 토픽 모델링은 주어진 문

서가 다양한 주제들로 이루어졌고, 각각의 주제는

특정 키워드들로 구성되었는지를 파악하기 위한 분

석 도구이며 (Blei, 2012; Blei & Lafferty, 2009), 주로

거대한 문서의 집합체로부터 가치 있는 패턴을 발견

하기 위해 사용되며 이때 발견된 패턴은 소위 “토픽”

이라 불리는 단어의 벡터로 이루어진다. 문서에서

직접 관찰할 수 있는 것은 문장을 이루고 있는 단어

들이며, 주어진 문서에서 관찰된 단어들을 바탕으로

주제, 주제의 비율, 할당된 주제를 추론하는 것이

LDA 토픽 모델 분석법의 핵심이다.

텍스트 기반의 문헌이 존재한다면 어떤 분야라도

적용되어 연구의 주제와 동향을 분석할 수 있고 이

런 범용성이 토픽 모델링의 장점이라 할 수 있다.

이런 맥락으로, 거대 문서 집합체의 대표적인 영역

이라 할 수 있는 온라인 구매 후기를 활용한 다양한

형태의 진일보한 연구가 이루어졌고, 이것은 후기

내용에서의 잠재적인 토픽이란 바로 해당 제품에 관

한 특성일 것이라는 직관을 반영한 것이다 (Liu,

2015). 소비자들의 실질적인 관심사를 보다 세밀하게

반영한 제품의 속성파악에 관한 연구에서, 간접적으

로 표현된 제품의 속성 유추, 파악된 속성 별로 세

분화된 감성 판별을 위한 연구, 및 LDA 방법론의

개선과 확장에 이르기까지 다양한 형태의 연구로 발

전되어 왔다 (Bagheri et al., 2014; Lakkaraju et al., 2011;

Titov & McDonald, 2008a, 2008b; Wang et al., 2010; Zhao

et al., 2010).

LDA를 확장 적용한 다양한 토픽모델 방법론들

중에서 본 연구에서는 senti-aspects 이라 불리는

[aspect, senti]의 쌍(pair)을 도출해 내어, 결국 속성추

출(aspect extraction)과 해당속성의 감성(sentiment)판별

이 가능한 Jo and Oh (2011)가 제안한 ASUM(Aspects

Sentiment Unification Model)을 활용하여 분석을 수행

한다. 기존의 LDA는 주제 또는 속성 추출만 가능했

다면 확장된 LDA모델인 ASUM은 속성과 감성판별

의 동시분석을 가능하게 한다. 다음의 <그림 2>는

ASUM의 그래픽 모델과 절차를 나타낸다.

그림그림그림그림 2 – ASUM의의의의 그래픽그래픽그래픽그래픽 모델모델모델모델 및및및및 절차절차절차절차

Notation

D = the number of reviews M = the number of sentences N = the number of words T = the number of aspects S = the number of sentiments w = word z = aspect s = sentiment = Multinomial distribution over words

= Multinomial distribution over aspects = Multinomial distribution over sentiments

���

= Dirichlet prior vector for

���

, ����

= Dirichlet prior vector for (for sentiment j)

���

= Dirichlet prior vector for

Generative Process

1. For every pair of sentiment s and aspect z:

draw a word distribution ��

~ Dirichlet (��

2. For each document d,

A. Draw the document's sentiment distribution:

�~ Dirichlet ()

B. For each sentiment s, draw an aspect distribution:

��

~ Dirichlet ()

C. For each sentence,

I. Choose a sentiment j ~ Multinomial (�)

II. Given sentiment j:

choose an aspect k ~ Multinomial (��

)

2015 한국경영정보학회 추계통합학술대회

-573-

Page 4: 상품의상품의상품의상품의 구매후기구매후기구매후기구매후기 … · 상 새로운 사실이 아니라고 해도 과언이 아니다. 다양한 선행 연구를

III. Generate words w ~ Multinomial (��

)

그림그림그림그림 3 – 연구연구연구연구 프레임워크프레임워크프레임워크프레임워크

요약요약요약요약 및및및및 연구연구연구연구 프레임워크프레임워크프레임워크프레임워크

리뷰마이닝(review mining)과 기업 경영 성과와의

상관성에 관한 의구심에서 촉발된 연구들은 이들간

의 명확한 관계를 밝히려는 왕성한 시도로 이어져왔

고, 이로 인해 밝혀진 구매 후기의 중요성은 더 이

상 새로운 사실이 아니라고 해도 과언이 아니다.

다양한 선행 연구를 통해 구매 후기와 경영 실적

은 불가분의 관계임을 확인할 수 있었지만, 기존 연

구들에선 제품 및 서비스 개선을 위한 구체적인 전

략 도출법의 노력이 결여되어 있어 통찰력 제공이

제한적일 수밖에 없다 (Abrahams et al., 2012). 제품

및 서비스에 대한 고객의 불만을 발견하고, 분류와

우선순위 결정을 통해 고객 만족 향상에 도움을 주

고자 할 경우 새로운 분석 및 접근법이 필요함을 시

사한다.

따라서, 본 연구에서는 기존 연구의 한계점을 극

복하고자 구매 후기를 분석함에 있어 감성 분석에

이은 토픽 모델 분석으로의 통합 적용을 시도하며 <

그림3>의 연구 프레임워크를 제안한다.

ⅢⅢⅢⅢ. . . . 방방방방법법법법론론론론

데이터데이터데이터데이터 수집수집수집수집 및및및및 분석분석분석분석

온라인 구매 또는 투숙 후기는 호텔 및 관광산업

에서 소비자 행동 및 경영성과를 이해하는 데 있어

큰 영향력을 미치는 가장 중요한 형태의 UGC라 할

수 있다(Cantallops and Salvi, 2014). 소비자(투숙객)는

그들이 머물렀던 특정 호텔에서의 경험을 바탕으로

해당 후기사이트에 별점(점수) 및 후기 내용 등을

작성하게 되는데 이는 같은 곳에서의 유사한 경험을

가진 소비자와 그들의 경험을 공유할 수 있게 되고,

아직 그들과 유사한 경험을 하지 못한 잠재적 고객

에게는 해당 호텔에 대한 중요한 정보를 제공하게

된다. 특히, 아직 구체적인 계획을 세우지 못한 잠재

고객에게는 그들의 여행 계획의 첫 수립 단계에서부

터 의사 결정의 단계 및 서비스 소비 후

(post-consumption stage)의 단계에 이르기까지 지대한

영향을 끼치게 된다(Min et al., 2014).

동시에, 작성되고 있는 구매후기 수의 증가는 가

히 폭발적이라 할 수 있는데, 특히 TripAdvisor 한

사이트의 경우 2014년 기준으로 전 세계 490만개가

넘는 호텔, 레스토랑 및 관광명소에 대해 2억 2천 5

백만건 이상의 관련 후기가 올라와 있다(http://www.tripadvisor.com/PressCenter-c6-About_Us.htm

l). 호텔 산업에서 투숙객의 사용 후기는 해당 호텔

의 자사 홈페이지, TripAdvisor, Expedia 및 Priceline

등과 같이 다양한 채널을 통해 접할 수 있다. 그 중

본 연구에서는, 역사와 공신력 면에서 가장 대표적

이라 여겨지는 TripAdvisor.com으로부터 관련 후기

데이터를 확보한 후 분석에 활용한다.

후기 데이터의 정제 및 전처리, 그리고 문서수준

의 감성분석 위해 RapidMiner를 활용하고, 토픽모델

분석을 위해 R 프로그램을 활용한다. RapidMiner에서

제공하는 확장 Operator인 execute R은 RapidMiner 내

에서의 R 사용을 가능하게 하여, 두 프로그램의 장

단점을 흡수 통합한 유연한 분석을 가능하게 한다.

유추된 서비스 결점들을 파악해 봄으로써 특정

호텔의 어떠한 문제점이 시급한 개선을 요하는 사항

인지 간파 할 수 있을 것이며 해당 결점들에 대한

선제적인 대응 및 개선을 통해 해당 호텔의 부정적

이미지가 온라인 상에서 삽시간에 전파되는 것을 최

소화 할 수 있을 것이며, 이를 통해 좀 더 효율적인

평판 관리에 이바지 할 수 있을 것이라 기대할 수

2015 한국경영정보학회 추계통합학술대회

-574-

Page 5: 상품의상품의상품의상품의 구매후기구매후기구매후기구매후기 … · 상 새로운 사실이 아니라고 해도 과언이 아니다. 다양한 선행 연구를

있을 것이다.

ⅣⅣⅣⅣ.... 결론결론결론결론

연구의연구의연구의연구의 기대결과기대결과기대결과기대결과 및및및및 시사점시사점시사점시사점

실무적 관점에서의 기대효과는 다음과 같다. 첫째,

긍정 감성보다 부정 감성의 전파력이 상대적으로 빠

른 것을 고려할 때 부정적 후기가 온라인 상에서 잠

재고객을 대상으로 빠르게 퍼지는 부정적 영향을 최

소화할 수 있을 것이다. 이는 곧 기업의 대외 신인

도와 평판 유지에 직결되는 이슈이므로 연구 결과의

반향이 클 것으로 기대된다. 둘째, 기존의 설문지를

통한 소비자 만족 평가 방식은 시간이 많이 소요되

는 제약이 있었다. 온라인 구매 후기를 활용하는 방

법은 빅데이터 시대에 걸맞게 방대한 양의 비정형

데이터를 즉각적으로 분석하므로 시기 적절하게 고

객 반응을 모니터링 및 추적할 수 있고, 향후 신제

품 개발에 소비자 의견이 적극 반영될 기회를 제공

한다.

아울러, 이론적 관점의 기대효과는 다음의 두 가

지로 요약된다. 첫째, 본 연구 결과는 향후 연구에서

다른 산업군 및 제품의 물류로 확장 적용이 가능하

다. 일반 제품에 비해 서비스 산업은 소비자들이 구

매 후기에 더 많이 의존할 수 밖에 없어 다른 분야

로의 연구 확장은 실용성 및 파급력이 클 것으로 기

대된다 (예: 항공, 렌터카, 영화, 패션, 의료산업 등

의 다양한 서비스 산업). 둘째, 부정 감성에 기반을

둔 결함 도출에 그치지 않고, 긍정 기반의 후기들도

고려하여 미처 발견하지 못한 내재된 제품 및 서비

스의 장점까지 정교하게 반영한 통합 연구로의 후속

진행도 가능하다.

연구의연구의연구의연구의 한계점한계점한계점한계점

모든 연구가 그러하듯 본 연구도 몇 가지 한계점

에서 자유로울 수 없다. TripAdvisor에서는 장점이자

단점이 될 수 있는, 실제 투숙 여부와 상관없이 누

구나 투숙 후기를 작성할 수 있다는 점이다. 이 때

문에 때로는 후기 자체가 지니고 있는 신뢰성에 대

해서 문제가 제기되곤 하였다. 날조된 구매 후기 문

제는 산업군을 막론하고 최근 대두되고 있는 문제이

며, 따라서 보다 더 신빙성을 담보 할 수 있는 세부

적인 추가 방안이 향후 연구에서는 필요할 것이다.

또한, 본 연구에서의 구매 후기 분석은 특정 도시에

소재한 호텔을 대상으로 하였기에 결론을 일반화 하

기에는 무리가 따른다. 그러므로, 더 많은 도시와 호

텔로부터 확보된 보다 다양한 투숙 후기 데이터의

확장 적용을 바탕으로 통합적 분석을 향후 연구에서

는 고려해야 할 것이다.

참고문헌참고문헌참고문헌참고문헌

[1] Abrahams, A. S., Fan, W., Wang, G. A., Zhang, Z. J.,

& Jiao, J. (2015). An integrated text analytic

framework for product defect discovery. Production

and Operations Management, DOI:

10.1111/poms.12303.

[2] Abrahams, A. S., Jiao, J., Wang, G. A., & Fan, W.

(2012). Vehicle defect discovery from social media.

Decision Support Systems, 54(1), 87-97.

[3] Archak, N., Ghose, A., & Ipeirotis, P. G. (2007).

Show me the money!: deriving the pricing power of

product features by mining consumer reviews. Paper

presented at the Proceedings of the 13th ACM

SIGKDD international conference on Knowledge

discovery and data mining.

[4] Archak, N., Ghose, A., & Ipeirotis, P. G. (2011).

Deriving the pricing power of product features by

mining consumer reviews. Management Science,

57(8), 1485-1509.

[5] Bagheri, A., Saraee, M., & De Jong, F. (2014).

ADM-LDA: An aspect detection model based on

topic modelling using the structure of review

sentences. Journal of Information Science, 40(5),

621-636.

[6] Berger, J., & Milkman, K.L. (2012). What makes

online content viral? Journal of Marketing Research,

49(2), 192-205.

[7] Blair-Goldensohn, S., Hannan, K., McDonald, R.,

Neylon, T., Reis, G. A., & Reynar, J. (2008). Building

a sentiment summarizer for local service reviews.

Paper presented at the WWW Workshop on NLP in

the Information Explosion Era.

[8] Blei, D. M. (2012). Probabilistic topic models.

Communications of the ACM, 55(4), 77-84.

[9] Blei, D. M., & Lafferty, J. D. (2009). Topic models.

Text mining: classification, clustering, and

applications, 10(71), 34.

[10] Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent

dirichlet allocation. Journal of Machine Learning

Research, 3, 993-1022.

[11] Bollen, J., Mao, H., & Zeng, X. (2011). Twitter mood

predicts the stock market. Journal of Computational

Science, 2(1), 1-8.

[12] Bollen, J., Pepe, A., & Mao, H. (2009). Modeling

public mood and emotion: Twitter sentiment and

socio-economic phenomena. arXiv:0911.1583.

[13] Cantallops, A. S., & Salvi, F. (2014). New consumer

behavior: A review of research on eWOM and hotels.

International Journal of Hospitality Management, 36,

41-51.

[14] Chevalier, J.A., & Mayzlin, D. (2006). The effect of

word of mouth on sales: Online book reviews. Journal

of marketing research, 43(3), 345-354.

[15] Dellarocas, C., Zhang, X.M., & Awad, N.F. (2007).

Exploring the value of online product reviews in

forecasting sales: The case of motion pictures. Journal

of Interactive marketing, 21(4), 23-45.

[16] Ghose, A., Ipeirotis, P. G., & Li, B. (2012). Designing

ranking systems for hotels on travel search engines by

2015 한국경영정보학회 추계통합학술대회

-575-

Page 6: 상품의상품의상품의상품의 구매후기구매후기구매후기구매후기 … · 상 새로운 사실이 아니라고 해도 과언이 아니다. 다양한 선행 연구를

mining user-generated and crowdsourced content.

Marketing Science, 31(3), 493-520.

[17] Jo, Y., & Oh, A. H. (2011, February). Aspect and

sentiment unification model for online review analysis.

In Proceedings of the fourth ACM international

conference on Web search and data mining (pp.

815-824). ACM.

[18] Lakkaraju, H., Bhattacharyya, C., Bhattacharya, I., &

Merugu, S. (2011). Exploiting Coherence for the

Simultaneous Discovery of Latent Facets and

associated Sentiments. Paper presented at the In

SDM.

[19] Leskovec, J., Adamic, L.A., & Huberman, B.A.

(2007). The dynamics of viral marketing. ACM

Transactions on the Web (TWEB), 1(1), 5.

[20] Liu, B. (2010). Sentiment analysis and subjectivity.

Handbook of natural language processing, 2, 627-666.

[21] Liu, B. (2012). Sentiment analysis and opinion mining.

Synthesis Lectures on Human Language Technologies,

5(1), 1-167.

[22] Liu, B. (2015). Sentiment Analysis: Mining Opinions,

Sentiments, and Emotions: Cambridge University

Press.

[23] Liu, Y., Yu, X., An, A., & Huang, X. (2013). Riding

the tide of sentiment change: sentiment analysis with

evolving online reviews. World Wide Web, 16(4),

477-496.

[24] Luca, M. (2011). Reviews, reputation, and revenue:

The case of Yelp. com. Com (September 16, 2011).

Harvard Business School NOM Unit Working Paper,

(12-016).

[25] Min, H., Lim, Y., & Magnini, V. P. (2014). Factors

Affecting Customer Satisfaction in Responses to

Negative Online Hotel Reviews The Impact of

Empathy, Paraphrasing, and Speed. Cornell

Hospitality Quarterly, 1938965514560014.

[26] O'Connor, B., Balasubramanyan, R., Routledge, B. R.,

& Smith, N. A. (2010). From tweets to polls: Linking

text sentiment to public opinion time series. ICWSM,

11, 122-129.

[27] Palka, W., Pousttchi, K., & Wiedemann, D.G. (2009).

Mobile word-of-mouth–A grounded theory of mobile

viral marketing. Journal of Information Technology,

24(2), 172-185.

[28] Pang, B., & Lee, L. (2008). Opinion mining and

sentiment analysis. Foundations and trends in

information retrieval, 2(1-2), 1-135.

[29] Popescu, A. M., & Etzioni, O. (2007). Extracting

product features and opinions from reviews Natural

language processing and text mining (pp. 9-28):

Springer.

[30] Singh, V. K., Piryani, R., Uddin, A., & Waila, P.

(2013). Sentiment analysis of movie reviews: A new

feature-based heuristic for aspect-level sentiment

classification. In International Multi-Conference on

Automation, Computing, Communication, Control

and Compressed Sensing (iMac4s), pp. 712-717.

[31] Stieglitz, S., & Dang-Xuan, L. (2012). Political

communication and influence through

microblogging-An empirical analysis of sentiment in

Twitter messages and retweet behavior. In 45th

Hawaii International Conference on System Science

(HICSS), pp. 3500-3509.

[32] Titov, I., & McDonald, R. T. (2008a). A Joint Model

of Text and Aspect Ratings for Sentiment

Summarization. Paper presented at the In ACL (Vol. 8,

pp. 308-316).

[33] Titov, I., & McDonald, R. T. (2008b). Modeling

online reviews with multi-grain topic models. Paper

presented at the In Proceedings of the 17th

international conference on World Wide Web, pp.

111-120. ACM, 2008.

[34] Wang, H., Lu, Y., & Zhai, C. (2010). Latent aspect

rating analysis on review text data: a rating regression

approach. Paper presented at the Proceedings of the

16th ACM SIGKDD international conference on

Knowledge discovery and data mining.

[35] Ye, Q., Law, R., & Gu, B. (2009). The impact of

online user reviews on hotel room sales. International

Journal of Hospitality Management, 28(1), 180-182.

[36] Ye, Q., Law, R., Gu, B., & Chen, W. (2011). The

influence of user-generated content on traveler

behavior: An empirical investigation on the effects of

e-word-of-mouth to hotel online bookings. Computers

in Human Behavior, 27(2), 634-639.

[37] Zhang, W., Xu, H., & Wan, W. (2012). Weakness

Finder: Find product weakness from Chinese reviews

by using aspects based sentiment analysis. Expert

Systems with Applications, 39(11), 10283-10291.

[38] Zhao, W. X., Jiang, J., Yan, H., & Li, X. (2010).

Jointly modeling aspects and opinions with a

MaxEnt-LDA hybrid. Paper presented at the

Proceedings of the 2010 Conference on Empirical

Methods in Natural Language Processing.

2015 한국경영정보학회 추계통합학술대회

-576-