case-study: thelanguageindustry.eu - #jd15nl
TRANSCRIPT
thelanguageindustry.eude grenzen van de meertaligheid binnen Joomla! afgetast
<menu> Wie is Dries?
Wie is Bart?
Een woordje over de taalsector & De Taalsector
Huwelijk tussen Joomla! en Drupal – de wondere wereld van CrossLang
Onder de motorkap van onze Joomla! installatie
Een paar tweaks waren nodig …
Toekomstvisie
</menu>
Wie is Dries?
Dries Debackere
Consultant (www.driesdebackere.com)
Begon een paar jaar geleden te spelen met het idee van een taalsector (language industry), in de zin van de sector voor iedereen die met taalwerk en taalgerelateerd werk zijn brood verdient > taalprofessionals.
Aanstoker
Wie is Bart?
• Afgestudeerd als Licentiaat Tolk.• Sinds 2002 werkzaam in de IT-sector.• Voorliefde voor alles wat met web en internet te maken
heeft.• Actief bezig met Jooma! sinds 2007 .• Maakt regelmatig een zijsprong richting Drupal &
Wordpress.• Niet alleen bezig met ontwikkeling maar ook met
systeembeheer.
En … vader van twee dochters die ik goed probeer op te voeden.
Een blik op de taalsectorPast, present & future
Een blik op de taalsector / De Taalsector
Wat is de taalsector? Wie is de taalsector?
Historiek De Taalsector:
1 artikel > 2 artikelen > knippen & plakken in Word > pdf-magazine
Van Word naar cms: taalsector.be / taalsector.nl op joomla 1.5 -> migratie naar joomla 2.5 (met betaalmuur)
1 taal > 24 talen = thelanguageindustry.eu
Volume: meer dan 3000 artikelen
Volume thelanguageindustry.eu: meer dan 3000 artikelen in x talen
De wondere wereld van CrossLang
een huwelijk tussen joomla! en Drupal
CrossLang Gateway
• Gent • innovatieve taaltechnologie• multi-translation-engine: verschillende vertaalengines (MT)
aanspreken binnen eenzelfde vertaalproject• toepassing ontwikkeld rond Drupal• biedt REST API
CrossLang Gateway
Waarom niet 1 MT-engine of Google Translate on the fly?
• Content is mix van1. original content, 2. human translation, 3. raw machine translation, 4. human assisted machine translation,5. machine assisted human translation
• postediteren moet bij ons• vertaalgeheugen moet bij ons• intellectueel eigendomsrecht moet bij auteur / post-editor blijven• thelanguageindustry.eu = neutraal > scala aan MT-engines laten zien
Onder de motorkapvan een v12 biturbo joomla! quattro
Een paar statistieken
Momenteel 150,000 records in de falang_content table
16 talen actief
106 gepostediteerde artikelen
54112 vertalingen
3391 artikelen
+/- 130 vertalingen kunnen per uur door het systeem gehaald worden in de vertaalflow.
Een paar tweaks …… voor een paar problemen
Any to Any translations
Momenteel geen voorziening in Falang om content in verschillende ‘brontalen’ in te voegen
Workaround via ‘taal-flagging’ in joomla!
Taggen anderstalige teksten als ‘toon enkel in Duits/Pools/…’
Vertaalflow doorlopen
Brontekst taggen als ‘toon in alle talen’
Vertalingen beschikbaar
Gebruik van ‘bugje’ in Falang dat een vertaling van de standaardtaal toelaat
Tuning
Aangepaste MySQL config : spelen met buffers en cache
joomla! file cache geeft problemen (door frequente updates)
tweaken van joomla! search om ook afgeschermde content in de search results te laten verschijnen (doorzoekbaarheid kan nog beter)
autologin – ip (Yireo-basis) aangepast voor CIDR-ranges
standaard sitevertalingen zijn niet altijd O.K., vertaling zit ook in bijzonder veel verschillende bestanden (component, modules, plugins, …)
Toekomstplannenover migraties, plugins & kopzorgen
2015 and beyond …
Migratie naar joomla 3.4.x
Uitbreiding aantal doeltalen & brontalen
Meer vertaalengines toevoegen (via CrossLang) (Moses!)
Mobile
Indexeren van aangepaste vertalingen en binden aan template (standaard languageoverride niet werkbaar bij deze grootteorde)