gina-anne levow and douglas w.oard institute for advanced computer studies

November 17, 2000 TDT-2000 Workshop

Topic Tracking at Maryland:Lessons from the Johns Hopkins

Mandarin-English Information (MEI) Project

Gina-Anne Levow and Douglas W.OardInstitute for Advanced Computer Studies

University of Maryland, College Park

Roadmap

• MEI Overview (6 weeks in 5 minutes)

• MEI Results

• Adapting MEI to TDT

• TDT Results

• Conclusions

The MEI Team• Senior Members

• Students

Helen Meng Chinese University of Hong KongErika Grams Advanced Analytic ToolsSanjeev Khudanpur Johns Hopkins UniversityGina-Anne Levow University of MarylandDouglas Oard University of MarylandPatrick Schone US Department of DefenseHsin-Min Wang Academia Sinica, Taiwan

Berlin Chen National Taiwan UniversityWai-Kit Lo Chinese University of Hong KongKaren Tang Princeton UniversityJianqiang Wang University of Maryland

MEI: The Challenges

• Speech Recognition– Tokenization– Lexicon coverage– Selection among alternatives

• Translation– Tokenization– Lexicon coverage– Selection among alternatives

Term Granularity Options

MandarinWords

MandarinSyllables

MandarinCharacters

EnglishWords

EnglishPhrases

MEI Evaluation Collections

2265manually

segmentedstories

3371manually segmented

stories

DevelopmentCollection: TDT-2

EvaluationCollection: TDT-3

Mar 98

Oct 98 Dec 98

17 topics,variable number

of exemplars

Jun 98Jan 98

English texttopic exemplars:Associated PressNew York Times

Mandarin audiobroadcast news:Voice of America

56 topics,variable number

of exemplars

Jun 98

Mandarin Audio

Term Translation

President Bill Clinton and…

English Exemplar

Term Selection

BilingualTermList

Query Construction

MandarinIR System

StoryBoundaries

Evaluation

Named Entity

Tagging

DocumentConstruction

SpeechRecognition

Relevance Judgments

RankedList

U Mass

Cornell

DragonLDC

LDC 000100010000010100

MeanUninterpolated

AveragePrecision

LDCCETA

Query Translation

• Dictionary inversion for phrase translation– “Wall Street” “best interests” “human rights”

• Lemmatize remaining words if necessary– e.g. “televised” translates as “television

• filtering for query term selection– Compared to an English background model

0.0 0.2 0.4 0.6 0.8 1.0

Recall

onEvaluation Measure

Able to characterize variation across exemplars!

Balanced Translation Works Well

• Pirkola’s structured queries– Treat translation alternatives

as synonyms

– Inquery #syn() operator

• Balanced translation– Distribute probability mass

over translation alternatives

– Inquery #sum() operator 0

StructuredQueries

BalancedTranslation

StrategyTDT-2, phrase-based translation, word-based retrieval

Phrase Translation Beats Words

• Phrases beat words

• Three sources– Translation lexicon

– Named entities

– Numeric expressions

Words Phrases Phrases +NE/NUMEX

StrategyCondition: TDT-2, 12 exemplars, word-based retrieval

Character Bigram Indexing Wins

• Character bigrams are best

• Syllable bigrams do poorly

Words Char Syllable

TDT-2, single NYT exemplar, manual translation

Untranslatable Terms

Term Occurrencessuharto 97netanyahu 88starr 62arafat 50bjp 45vajpayee 44estrada 44….hsu 19zemin 7

# (by token)87,0043,028

# (by type)12,4021,122

TermstotalOOV

Cross-Language Phonetic Matching

• Small improvement– Not statistically significant

• Character bigrams are best– Form a unified index

• Character and syllable bigrams

– Translate words if possible• Then form character bigrams

– Otherwise translate syllables• Then form syllable bigrams

Indexing Terms

no CLPM CLPM

TDT-2, phrase-based translation

MEI: Comparing Collections

Words Character Bigrams Character Bigrams +CLPM

TDT2 TDT3

MEI Conclusions

• ASR Words

• Translation Phrases, Words, Lemmas, Syllables

• Indexing Character Bigrams

TDT-2000: What’s New Since ’99?

• Key ideas from MEI:– Dictionary inversion for phrase translation– Balanced translation– Post-translation resegmentation

• Adaptation to TDT:– Exploit negative exemplars– Improved Mandarin topic normalization– Round-robin balanced translation

Mandarin Audio

Term Translation

President Bill Clinton and…

English Exemplars

Term Selection

BilingualTermList

Query Construction

StoryBoundaries

ScoreNormalization

DocumentConstruction

SpeechRecognition

RankedList

DragonLDC

Scores

LDC/CETA

TDT-2000

IDFComputation

Training Epoch

Topic Tracking Improvements

• Improved filtering for query term selection– First compare to background model– Augment by comparison to negative exemplars

• Mandarin topic normalization (unofficial)– Language-specific strategy

• Mandarin: Best single training epoch score

• English: Average of exemplar scores

– Recomputed Mandarin source normalization

Effect of Negative Exemplars

Text Only DET Plots1st 60 topics (self-scored)

Mandarin TextNn=0 & Nn = 2

English TextNn=0 & Nn=2

Indexing Character Bigrams

Mandarin Speech Only1st 60 topics

(unofficial renormalization)

Character Bigrams

Round Robin 8-Best Translation

TDT-1999 2-best translation

Mandarin Text1st 60 Topics(self-scored)

TDT-2000Round-robin 8 best

Conclusions

• Top-8 round robin translation to Mandarin wins– Slightly outperforms top-2 translation to English

• Query translation is more efficient– Better suited to a stream of stories

• Match term extent to purpose– ASR, translation, indexing

Closing Thoughts

• Thanks to Jon and LDC !

• Normalization limits our insight– Need some way to see past it

• Availability of TDT-3 ground truth?

gina-anne levow and douglas w.oard institute for advanced computer studies

english texttopic exemplars

variable numberof exemplarsjun

minutesmei resultsadapting

wang academia sinica

voice of america56 topics

douglas w

query term selectioncompared

college parktdt

Documents

parcial gina

cop 3813 intro to internet computing prof. roy levow lecture...

gina alexander

overview of issues in discourse and dialogue gina-anne levow...

a inceput la londra - libris.ro inceput la... · 2018. 8....

translingual topic tracking with prise gina-anne levow and...

hotel gina

unsupervised and semi-supervised learning of tone and pitch...

cognitive interactivity gina a. richter...

the third chinese language processing bakeoff: word...

presentación: gina de rezkalah presentación: gina de...

fotografÃa de pÃ¡gina...

characterizing and recognizing spoken corrections in...

cap 4703 computer graphic methods prof. roy levow chapter 6

douglas o-38 douglas o-46 douglas b-18 bolo

introduction to deep processing techniques for nlp deep...

topics in artificial intelligence: discourse and dialogue cs...

technical report estimating the potential impacts of · pdf...

combining prosodic and text features for segmentation of...

cop 3813 intro to internet computing prof. roy levow lecture...