modeling irony in twitter
DESCRIPTION
Modeling Irony in TwitterTRANSCRIPT
文献紹介
修士1年
松本宏
Modeling Irony in Twitter
• Title: Modelling Irony in Twitter
• Author: Barbieri, Francesco and Saggion, Horacio
• Journal: EACL 2014
• Pages: 56
• Year: 2014
概要
• Tweetデータ内からのironyとなる文の検出
• Irony検出には機械学習の2値分類
• 様々な素性を試す
–今回の内容については素性の選択理由について
単語ironyについて
• Ironyとは?
–皮肉
• 日本語の皮肉とは若干異なる
–日本語の皮肉: sarcasm
– Ironyの皮肉: ユーモア溢れるモノ
Frequency
• 皮肉な文は意外性により生まれる
• 意外性を頻度を利用して検出
→頻出単語と反頻出単語が利用されている同
文での使用が不均衡を生み意外性へとつながる
Written-Spoken
• Twitterは書き言葉が多い
• 皮肉な文は意外性により生まれる
• 話し言葉で記述されている文から書き言葉に書き換わる意外性
• または、その逆も
Structure
• この素性はツイート構造を知るためのもの
• ツイートが– 長いのか短いのか、
– 長い単語か短いのか、
– どのような記号が利用されているか
– この素性の利用においては皮肉ツイートの傾向として他のツイートと比べ、
• 理由:– 長い文字列ツイートかつ、固有の記号、絵文字が使われていることが多い
Intensity
• 皮肉のテクニック
–意味裏腹な言葉
• 形容詞、副詞で脚色
– (“Do we hike that tiny hill now?” 実際は大きな山へ挑む直前のツイートだったり)
• 言葉に度合い付けされたツールの利用
Synonyms
• 皮肉には2つのメッセージがある
• リテラルな意味と比喩
• 比喩的意味の伝達のためにも語彙選択は重要
• 例えば:
–空が暗く雨が振りそうなとき、”sublimeな天気だね!“
• よって、言い換え可能数を素性
Ambiguity
• 皮肉においての曖昧性
• 皮肉コーパス: 皮肉文で集められたコーパス
• 単語の語義数:皮肉コーパス > 非皮肉コーパス
Sentiments
• 皮肉は感情分析によって調べられると仮定
• 感情の不均衡による意外性
データセット
• 実験は3種類のツイート・コーパス
• (ハッシュ・タグに#irony, #education, #humor, #politicsとある物を各10,000ツイートずつ)
• 10分割交差検定
Experiments
• 3種類のツイート・コーパス
– (#irony, #education, #humor, #politics ハッシュタグ付を各10,000ツイートずつ)
– 10分割交差検定
実験結果
• セルはベースライン/提案手法
実験結果
実験結果