04 извлечение информации

Download 04 извлечение информации

Post on 10-May-2015

2.938 views

Category:

Documents

0 download

Embed Size (px)

DESCRIPTION

Презентация

TRANSCRIPT

<ul><li>1. </li></ul> <p>2. </p> <ul><li>Information Extraction ( ) </li></ul> <p>Information Retrieval Text Understanding Information Extraction 3. </p> <ul><li> ( ) </li></ul> <p>4. </p> <ul><li>Message Understanding Conference </li></ul> <ul><li> : </li></ul> <ul><li>Named Entity Recognition </li></ul> <p>5. </p> <ul><li> . </li></ul> <p>MUC( Message Understanding Conference),1987-1997 , 1997 MUC-7 1995 MUC-6 , 1993 MUC-5 1992 MUC-4 1991 MUC-3 - 1989 MUC-2 - 1987 MUC-1 6. </p> <ul><li>Named Entity recognition- </li></ul> <ul><li>Coreference resolution - </li></ul> <ul><li>Template Element construction- , NE , CR</li></ul> <ul><li>Template Relation construction </li></ul> <ul><li>Scenario Template production () TETR</li></ul> <p>MUC 7. </p> <ul><li> . . - . </li></ul> <ul><li>Named Entity recognition : </li></ul> <ul><li> , , </li></ul> <ul><li>, </li></ul> <ul><li> oreference resolution :</li></ul> <ul><li>-&gt; </li></ul> <ul><li>Template Element construction :</li></ul> <p> 0267 8. </p> <ul><li> . . - . </li></ul> <ul><li>Template Relation construction : </li></ul> <ul><li>Scenario Template production : </li></ul> <p> 7824 0267 2345 452 7824 0267 18 9. </p> <ul><li>Recall = N correct/N all-correct </li></ul> <ul><li>Precision = N correct/(N correct +N incorrect) </li></ul> <ul><li>F-mera =( 2 +1 ) *r*p/( 2* r+p) </li></ul> <ul><li>Named Entity recognition F </li></ul> <ul><li>:</li></ul> <p>32. </p> <ul><li>1) </li></ul> <ul><li>2) </li></ul> <ul><li>3) </li></ul> <ul><li>4) </li></ul> <ul><li>5) , , , </li></ul> <ul><li>6) </li></ul> <p>33. </p> <ul><li>Message Understanding Conference </li></ul> <ul><li> : </li></ul> <ul><li>Named Entity Recognition </li></ul> <ul><li> : </li></ul> <p>34. </p> <ul><li><ul><li>V. Bocharov, L. Pivovarova, V. Rubashkin, B. ChuprinOntological Parsing of Encyclopedia Information . In Computational Linguistics and Intelligent Text Processing 11th International Conference, CICLing 2010, Iasi, Romania, March 21-27, 2010. Proceedings. Lecture Notes in Computer Science. - Springer Berlin / Heidelberg 2010 pp. 564 579 </li></ul></li></ul> <ul><li><ul><li> .., .., ..- // ( MegaLing2009) : . . . / , . -. [ .]; .: . . [ .]. . : , 2009 </li></ul></li></ul> <ul><li><ul><li> .., .., .., .. // : (, 26-30 2010 .). . 9 (16). - .: - , 2010.</li></ul></li></ul> <p> 35. </p> <ul><li>Ontology Learning - </li></ul> <p>36. </p> <ul><li><ul><li> - . .: . . .: , 2001 </li></ul></li></ul> <ul><li><ul><li> , </li></ul></li></ul> <ul><li><ul><li>26375 , 21782 </li></ul></li></ul> <p>37. </p> <ul><li> ( ) . </li></ul> <ul><li> - , , , . . </li></ul> <p>38. </p> <ul><li> - , , , 4 . </li></ul> <ul><li> - -( ) ( 16 .). </li></ul> <p>39. 40. </p> <ul><li> ( , ) </li></ul> <ul><li> () </li></ul> <ul><li> () </li></ul> <p> 41. </p> <ul><li> - . , </li></ul> <ul><li> - , </li></ul> <p> -( ) - 42. </p> <ul><li> ( Tomita- ) </li></ul> <p> 43. </p> <ul><li> + </li></ul> <ul><li>[ANP] -&gt; [A DJ ] [NP root] </li></ul> <ul><li>: $0.grm := case_number_gender($1.grm, $2.type_grm, $2.grm); </li></ul> <ul><li>[GP] -&gt; [NP root] [NP grm=""]; </li></ul> <ul><li>[PP] -&gt; [P REProot] [NP]; </li></ul> <ul><li>[NP] -&gt; [NOUN]; </li></ul> <ul><li>[NP] -&gt; [NP root] [PP] ; </li></ul> <ul><li>[NP] -&gt; [PP] | [GP] | [ANP]; </li></ul> <p> 44. </p> <ul><li> + </li></ul> <ul><li> - </li></ul> <ul><li> - </li></ul> <ul><li> - </li></ul> <p>45. : / 1,27 1,06 / 2,26 1,64 46. </p> <ul><li><ul><li> (..) </li></ul></li></ul> <ul><li><ul><li> (..) </li></ul></li></ul> <ul><li><ul><li> (..) </li></ul></li></ul> <p>: 47. </p> <ul><li> - , , , . </li></ul> <ul><li> - . </li></ul> <ul><li> - 2- (). </li></ul> <p> 48. Same ( ) Gen ( GEN) Spec Part Whole Func Other 49. </p> <ul><li> , . </li></ul> <p>50. : </p> <ul><li> Same </li></ul> <ul><li> ( ) </li></ul> <ul><li> - , , , . </li></ul> <p>51. </p> <ul><li> Same </li></ul> <ul><li> ( ) </li></ul> <ul><li> - , , . </li></ul> <p> : 52. </p> <ul><li> , </li></ul> <ul><li> - , - , , . </li></ul> <p> 53. </p> <ul><li> &lt; &gt; - </li></ul> <ul><li>&lt; &gt; - </li></ul> <p> 54. </p> <ul><li>, , </li></ul> <ul><li> - . </li></ul> <ul><li> - . </li></ul> <ul><li> - , . </li></ul> <p> : 55. </p> <ul><li> - - . </li></ul> <ul><li> - . </li></ul> <p> : 56. </p> <ul><li> - . </li></ul> <ul><li> - , , .</li></ul> <p> : 57. </p> <ul><li>C </li></ul> <ul><li> - - . </li></ul> <ul><li> - , . </li></ul> <ul><li>: </li></ul> <ul><li>- . </li></ul> <p> : 58. </p> <ul><li> - . </li></ul> <ul><li> - , .</li></ul> <p> : 59. </p> <ul><li> - - . </li></ul> <ul><li> - , . </li></ul> <ul><li>: </li></ul> <ul><li> - . </li></ul> <p> : 60. </p> <ul><li>, </li></ul> <ul><li> - . </li></ul> <ul><li> - .</li></ul> <ul><li> - , , . </li></ul> <p> : / 61. </p> <ul><li> - - . </li></ul> <ul><li> - ( ). </li></ul> <ul><li>: </li></ul> <p> : / 62. </p> <ul><li>, , </li></ul> <ul><li> :Func . </li></ul> <ul><li> - . </li></ul> <p> 63. </p> <ul><li> - - . </li></ul> <ul><li> - 28 ( , ). </li></ul> <ul><li> - , , . . </li></ul> <p> 64. 65. </p> <ul><li>18 </li></ul> <ul><li>91 , </li></ul> <ul><li>8484 , </li></ul> <ul><li>4679 </li></ul> <ul><li>1978 </li></ul> <p>: 66. </p> <ul><li> , 200 </li></ul> <ul><li>90% (179 ) , </li></ul> <ul><li>21 : </li></ul> <ul><li><ul><li>16 </li></ul></li></ul> <ul><li><ul><li>5 </li></ul></li></ul> <p> 67. </p> <ul><li> - ( , ). </li></ul> <ul><li>- . </li></ul> <ul><li> - - . </li></ul> <p>68. </p> <ul><li> - </li></ul> <p> GEN FUNC GEN FUNC GEN 69. </p> <p> 70. </p> <ul><li> : </li></ul> <ul><li> : </li></ul> <ul><li> - - </li></ul> <ul><li> : </li></ul> <ul><li> : </li></ul> <ul><li> : </li></ul> <p> : 71. </p> <ul><li>Gaizauskas, R., Wilks, Y., 1998. Information Extraction: Beyond Document Retrieval -http :// www.aclclp.org.tw / clclp /v3n2/v3n2a2.pdf </li></ul> <ul><li>Cunningham, H. Information Extraction, Automatic - http://gate.ac.uk/sale/ell2/ie/main.pdf </li></ul> <ul><li>Appelt D.Introduction to information extraction-AI Communications 12 (1999) 161172 </li></ul> <ul><li>Feldman R., Sanger J. The Text MiningHandbook Cambridge University Press, 2007 </li></ul> <ul><li>Dan Jurafsky From Languages to Information. Lecture 15:Relation Extraction - http :// www.stanford.edu / class /cs124/ </li></ul> <ul><li>Dan Jurafsky From Languages to Information. Lecture 7:Named Entity Tagging - http://www.stanford.edu/class/cs124/ </li></ul> <ul><li> .- http:// mathlingvo.ru / nlpseminar / archive /s_32 </li></ul>