y cyfieithydd a’r cyfrifiadur : pa un yw’r meistr?

25
Y Cyfieithydd a’r Cyfrifiadur: The Translator and the Computer: Pa un yw’r meistr? Who’s the boss? Dewi Bryn Jones David Chan Uned Technolegau Iaith Language Technologies Unit Canolfan Bedwyr Prifysgol Bangor Bangor University

Upload: techiaith

Post on 27-Jun-2015

513 views

Category:

Technology


5 download

DESCRIPTION

Sleidiau'r cyflwyniad yng nghynhadledd TILT, Mehefin 12, 2014.

TRANSCRIPT

Page 1: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Y Cyfieithydd a’r Cyfrifiadur:The Translator and the Computer:

Pa un yw’r meistr?Who’s the boss?

Dewi Bryn JonesDavid Chan

Uned Technolegau Iaith Language Technologies UnitCanolfan Bedwyr

Prifysgol Bangor Bangor University

Page 2: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Eugene Goostman

Page 3: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Dyfodiad y Peiriannau? Rise of the Machines?

Page 4: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Cyfieithu peirianyddol (MT)Machine translation (MT)

● Bydd Deallusrwydd Artiffisial yn newid pob swyddArtificial Intelligence will change all professions

● Cyfieithu: un o’r proffesiynau cyntaf a weddnewidir Translation: one of first professions being transformed

● Google Translate: 1bn testun/dydd (i 200m o bobl)Google Translate: 1bn texts/day (for 200m people)

Page 5: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

http://www.slideshare.net/TAUS/10-april-2013-taus-mt-showcase-hunnects-use-case-sndor-sojnczky-hunnect-18664081

Page 6: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?
Page 7: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Chwyldroi’r diwydiant cyfieithuThe translation industry revolutionized

● ISO+eraill: MT i droi cyfieithwyr yn ôl-olygwyrISO+others: MT will make translators into post-editors

● Cyfieithwyr Cymraeg: ddim yn wahanol / ynysigWelsh translators: not different / isolated

● Dyfodol: cyfieithu â chymorth peiriant bob troFuture: MT-assisted translation always

Page 8: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Cyfieithu peirianyddol CymraegWelsh-language machine translation

Page 9: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Strategaeth Cymru: cwestiynau sylfaenolStrategy for Wales: basic questions

● A ddylai’r diwydiant ddibynnu ar Google/Microsoft?Should the industry be dependent on Google/Microsoft?

● A fyddent yn cyflawni ein hanghenion penodol?Will they fulfill our specific needs?

● Dibyniaeth tymor hir: buddiol i’r Gymraeg?Long-term dependence: beneficial to Welsh language?

Page 10: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Peiriannau cyfieithu Google/MicrosoftGoogle/Microsoft’s MT engines

Manteision: Advantages● Rhad/am ddim Cheap/free● Hawdd i’w defnyddio Easy to use● Eang eu defnydd Widely used

Anfanteision: Disadvantages● Un cywair/arddull yn unig Only one register/style● Cost cudd wrth ôl-olygu Hidden cost of post-edits● Diffyg dylanwad masnachol Lack of influence● Ansicrwydd strategol Strategic uncertainty

Page 11: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Y farchnad byd-eang: lle mae’r arian?The global market: where’s the funding?● Targedu nodweddion ieithoedd mawr: fr es de jp ...

Target the features of large languageso Problemus i ni! Trefn geiriau, negyddu, berfau ...

Problematic for us! Word order, negation, verbs ...● Pontio rhwng cymdeithasau unieithog

Bridge between monolingual societieso Problemau cynnal dwyieithrwydd: testun cyfochrog,

cofnodion cyfarfod, sleidiau, … Problems supporting bilingualism: parallel text, meeting notes, slides …

Page 12: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Cyfieithu yng Nghymru: y dyfodol?Translation in Wales: the future?● Cyfieithu â chymorth peiriant bob tro

MT-assisted translation always● Meddalwedd anaddas i’r Gymraeg / dwyieithrwydd

Software unsuited to Welsh / bilingualism

● Cyfieithu arafach / llai cywir / llai effeithiolTranslation is slower / less correct / less efficient

● Statws yr Iaith Gymraeg dan fygythiadStatus of the Welsh language threatened

Page 13: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Yr ateb: strategaeth newydd A new strategy

● Y diwydiant Cymraeg yn cynnal ein technoleg cyfieithuTranslation technology maintained by Welsh industry

● Anghenion Cymru a’r Gymraeg yn flaenoriaeth uchafThe requirements of Wales/Welsh as top priority

● Diogelu ein galluoedd i’r tymor hirSafeguarding our capabilities for the long term

Page 14: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Seiliau strategaeth MT CymraegStrategic basis for Welsh MT

● Peiriannau cyfaddas Tailored MT engines● Cynnal cystrawen yn well Better Welsh syntax support● Cynnal dwyieithrwydd yn well Better bilingualism support● Safonau/Ymchwil/Hyfforddi Standards/Research/Training● Data agored+caeedig Open+proprietary data● Amrywiaeth o drwyddedau Range of licences● Perchnogi a rhannu Ownership and sharing

Page 15: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Gwerthuso cynnal MT yng NghymruEvaluating Wales-maintained MT

Anfanteision: Disadvantages● Technegol heriol Technically challenging● Angen buddsoddi adnoddau Resource needs

Manteision: Advantages● Cyflawni ein hangenion penodol Meets our needs● Arddull+termau cyfaddas Custom style+terms● Rheoli+gwella ansawdd Quality control+improvement● Hyblyg i gwsmeriaid Flexibility for customers● Diogelwch strategol Strategic security

Page 16: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Cyfieithu peirianyddol yn CyfieithuCymruMachine translation in CyfieithuCymru

System cyfaddas ar gyfer: System customised for:

● Anghenion cyfieithwyr CymraegWelsh translator’s needs

● Anghenion sefydliadau cyhoeddus CymruThe requirements of Welsh public-sector organizations

● Parchu perchnogaeth/cyfrinachedd dataRespect for ownership/confidentiality of data

Page 17: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

CyfieithuCymru: MT

Page 18: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Cyfieithu peirianyddol yn CyfieithuCymruMachine translation in CyfieithuCymru

● Peiriannau cyfieithu a ddatblygwyd gan yr UnedMachine translation engines developed by the Unit

● Peiriant 1 ar sail data agored Cofnod y CynulliadEngine 1 based on Welsh Assembly Record open data

● Peiriant 2 (ar y gweill) ar sail corpws deddfwriaeth dwyieithog www.legislation.gov.uk Engine 2 (in progress) based on bilingual legislation corpus

● ...

Page 19: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Corpws deddfwriaeth ddwyieithogBilingual legislation corpus

Page 20: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

CyfieithuCymru: Dewis MT MT selection

Page 21: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Peiriannau eich hunain Your own engines

● “Hyfforddi” peiriant newydd ar sail unrhyw gof cyfieithu o fewn CyfieithuCymru“Train” a new engine from any CyfieithuCymru translation memory

● Darparu ar gyfer parth/project penodolPrepare for a particular subject/project

● Defnyddio o fewn CyfieithuCymru a thu allanUse in CyfieithuCymru and elsewhere

● Hawl i’w ddefnyddio fel y mynnochRights to use as you choose

Page 22: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

… gyda help yr Uned Techolegau Iaith… with the Language Technology Unit’s help

● Meddalwedd MT cod agored o’r enw Moses“Moses” open-source MT software

● Offer i hwyluso darparu / cynnal y peiriantTools to facilitate preparing / maintaining the engine

● Gallwn darparu / cynnal peiriannau ar eich rhanWe can prepare / maintain engines on your behalf

Page 23: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Cymuned o ymarferwyr MT Cymraeg?Community of Welsh MT practitioners?

Er mwyn hwyluso: to facilitate● Hyfforddiant Training● Rhannu ein hoffer darparu Sharing our preparation tools● Casglu corpws o ddata agored Collecting open data● Rhannu peiriannau Sharing engines● Rhannu adnoddau Sharing resources● Ymchwil pellach Further research

Page 24: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Casgliad: pwy yw’r meistr, felly?Conclusion: who’s the boss, then?

● Byddem yn feistri ar ein cyfrifiaduron, ein diwydiant cyfieithu a’n hiaith …We will be masters of our computers, translation industry and language ...

● DIM OND trwy strategaeth MT newydd lle rydym yn berchen ar ein peiriannau cyfieithu.ONLY through a new MT strategy whereby we are owners of our machine translation engines.

Page 25: Y Cyfieithydd a’r Cyfrifiadur : Pa un yw’r meistr?

Unrhyw gwestiynau?Any questions?

neu atebion?.... or answers?

Diolch yn fawr! :-)