word2vec을 활용한 야매추천시스템 - github pages · 2019. 5. 3. · 악성코드...
TRANSCRIPT
Word2vec을활용한야매추천시스템
싸이그램즈김성근
심리학..그머나먼여정의끝..
• 심리치료공부
• 심리검사개발
• 심리검사영업
• 개인사업
• 대학원(MIS)
• 일반행정회사원
풀칠만하는인생을피하기위해스터디를간간히하고있음
연구자추천시스템의시작
• 서로어떤연구를하는지몰라!
• 데이터가있는데분석을못해!
• 분석은하는데데이터가없어!
• 서로가진자원을공유하고함께협업할수있음좋겠다!
빅데이터관련연구자세미나
연구자추천시스템의시작
• 특정분야연구를하는교수는찾을수있을것같은데!!
아주 심플한 UX
Gensim Word2vec
아주 편리한 패키지
연구자추천 시스템을 만들자!
연구자추천시스템
• 관련성이높은무엇인가를전달하는것!• 나랑비슷한사용자들이보는컨텐츠를추천• 나랑비슷한사용자들이사는물건을추천
연구자 추천시스템
• 연구자추천시스템• 특정키워드와관련성이높은연구자를추천• 특정교수와관련성이높은연구자를추천
우리학교에풀칠잘하는사람누가있지?
풀칠연구정보처김성근
010-8956-495*
연구자추천시스템
• Word2vec• 인공신경망을활용해특정단어주변에서자주출현하는단어들끼리서로비슷한수치을갖게함
연구자추천시스템 -기획
• 1. 특정분야의단어를넣으면• 관련된연구키워드를알려주고
• 2. 연구키워드를입력하면• 관련된연구자들을알려주고
• 3. 연구자이름을입력하면• 그연구자의연구목록을보여주자
보안
악성코드
랜섬
취약점
악성코드
정보통신대학/홍길동
정보통신대학/임꺽정
공과대학/김두한
공과대학/김두한
• 안드로이드환경에서의랜섬웨어실시간탐지개선방안에관한연구• ZigBee 프로토콜취약점및보안요구사항분석• 단말장치및이에의한사이버공격애플리케이션의탐지방법
연구자추천시스템 -흐름
• 1. 특정분야의단어를넣으면• 관련된연구키워드를알려주고
• 2. 연구키워드를입력하면• 관련된연구자들을알려주고
• 3. 연구자이름을입력하면• 그연구자의연구목록을보여주자
연구자추천시스템 -흐름
• 1. 특정분야의단어를넣으면• 관련된연구키워드를알려주고
• 2. 연구키워드를입력하면• 관련된연구자들을알려주고
• 3. 연구자이름을입력하면• 그연구자의연구목록을보여주자
김성근
김성근
김성근
김성근
김성근
김성근
김성근
김성근
연구자추천시스템 -흐름
• 1. 특정분야의단어를넣으면• 관련된연구키워드를알려주고
• 2. 연구키워드를입력하면• 관련된연구자들을알려주고
• 3.1 연구자이름을입력하면• 그연구자의연구목록을보여주자
연구자추천시스템 -흐름
• 3.2 연구자이름을입력하면• 그연구자와관련성이높은연구키워드를주자
연구자추천시스템 -흐름
• 3.3 연구자이름을입력하면• 최근 5년간그연구자의연구제목에가장많이출현한단어를주자;;
김성근
연구자추천시스템 -흐름
• 4. 연구자 이름을 입력하면• 그 연구자의 연락처를 줘서 협업을 할 수 있게!! 마무리!
김성근
김성근 0000-0000
연구자추천시스템 – 데이터
• A대학 10년치논문데이터
김성근
김성근
연구자추천시스템 – 데이터
• 문제• 연구자를식별할고유값이없음
• 해결• 소속+이름으로연구자를식별할수있는고유값을만듦
김성근
연구자추천시스템 – 데이터전처리
• 문제• 영어, 한글이혼재되어있어서, 자연어처리를어찌할까..난감
김성근
김성근
김성근
김성근
연구자추천시스템 – 데이터전처리
• 문제• 영어, 한글이혼재되어있어서, 형태소분석하기난감함• Langdetect패키지로언어파악후한글, 영어각각형태소분석
김성근
김성근
김성근
김성근
연구자추천시스템 – 데이터전처리
• 문제• 연구분야 Stopwords set이없음…열심히만듦
연구자추천시스템 – 데이터전처리
•깔끔하게 word2vec 인풋데이터 만듦
연구자추천시스템 – w2v 모델
• 1. 특정분야의단어를넣으면• 관련된연구키워드를알려주고
• 2. 연구키워드를입력하면• 관련된연구자들을알려주고
보안
악성코드
랜섬
취약점
악성코드
정보통신대학/홍길동
정보통신대학/임꺽정
공과대학/김두한
연구자추천시스템 – w2v 모델
• 키워드 -> 관련연구키워드• most_similar() 로뚝딱
연구자추천시스템 – w2v 모델
• 키워드 -> 관련연구자• 논문제목에연구자이름을끼워넣고 w2v모델만듦
• most_similar() 결과물에서정규표현식으로이름만필터링
이것이야매추천시스템!!!
김성근’
김성근’
연구자추천시스템 – w2v 모델
• 키워드 -> 관련연구자• most_similar() 결과물• 정규표현식으로이름만필터링
연구자추천시스템 – Slack 연동
연구자추천시스템 – Slack 연동
API_TOKEN = "xoxb-334098964660-378937926466-J1ysgAOX2KIcbMV8GpH62irc"
연구자추천시스템 – Slack 연동
•슬랙봇 패키지로 간단히!
끝!