crf

11
 BIONLP09 and CRFs Farzaneh Sarafraz 18 February 2009

Upload: farzanehs

Post on 03-Jul-2015

433 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Crf

   

BIONLP09and

CRFs

Farzaneh Sarafraz

18 February 2009

Page 2: Crf

   

BioNLP'09

Event rather than entity Most entities are given 3 tasks

− Event detection and characterization− Event argument recognition− Negations and speculations

Page 3: Crf

   

Example

"I kappa B/MAD­3 masks the nuclear localization signal of NF­kappa B p65 and requires the transactivation domain to inhibit NF­kappa B p65 DNA binding. "

Event: negative regulation

Trigger: masks

Theme1: the first p65

Cause: MAD­3

Site: nuclear localization signal

Page 4: Crf

   

Example

"In contrast, NF­kappa B p50 alone fails to stimulate kappa B­directed transcription, and based on prior in vitro studies, is not directly regulated by I kappa B. "

Event: regulation

Theme1: this p50

Trigger: regulated

Negation: true for this event

Speculation: none

Page 5: Crf

   

HMM and MEMM

Observations (X1, X2, ...)

labels (Y1, Y2, ...) p(Xi , Yi) 

X  ranges over observation sequence 

Y ranges over and label sequence

Requires independence assumption

i.e. each item is labelled independently

Page 6: Crf

   

Conditional Random Field

p(Y |X)

Y: label sequence

X: observation sequence

Maximise p

Page 7: Crf

   

MMEM Label Bias Problem

Probability given the current state− Transitions leaving a state compete against

each other not all states

− Per­state normalization− Probability bias towards states with few transitions− Demonstrated experimentall

Page 8: Crf

   

Label Bias Example

Training data:− A B C D− A B D D− A B C E− A B D C

Model says:− C > D 50%− C > E 50%

Why predict E when D is much more common?

Page 9: Crf

   

CRF Solution

Model probability of transitions and probability of states

CRFs− Models probability of transition between states− Probability is conditional on current observation− Not normalised − Considers many "features" of observations

Page 10: Crf

   

Features

"edge features" as well as "vertex features"− Word is capitalized− Word ends in "­ing"− Label is "proper noun"

Features are important!

Page 11: Crf

   

End.