OmegaT HowTo:
Vertalen van bestanden van Word 2007 (Office Open XML, .docx) in OmegaT

Deze HOWTO verschaft tips over het vertalen van bestanden van MS Office 2007 (en later) in OmegaT.

Achtergrond

Met de komst van Microsoft Office 2007 hebben Microsoft Word, Excel en Powerpoint nieuwe standaard bestandsindelingen. Deze indelingen zijn formeel bekend als "Office Open XML", en hebben de respectievelijke extensies .docx, .xlsx en .pptx. De indelingen worden ook gebruikt in MS Office 2010. Gemakshalve zal er naar verwezen worden als "MS Office 2007-bestandsindelingen".

Vanaf versie 1.7.1 en verder is OmegaT in staat geweest om bestanden van Microsoft Office 2007 direct af te handelen, zonder conversie. Met het verschijnen van OmegaT versie 2.1.8, werd de afhandeling van deze bestandsindeling in OmegaT ook veel gebruikersvriendelijker.

De voordelen van het gebruiken van de indeling .docx in samenwerking met OmegaT

Als gebruikers/auteurs Microsoft Office/Word bijwerken naar meer recente versies, kunnen vertalers verwachten dat zij meer bestanden in de nieuwe indeling zullen ontvangen. Anders dan de oudere .doc-, .xls- en .ppt-indelingen, kunnen deze bestanden direct in OmegaT worden afgehandeld, zonder verlies van opmaak als resultaat van conversie naar en vanuit andere indelingen.

De nieuwe indeling kan ook dienen als een handige manier voor het afhandelen van de oudere .doc-, .xls- en .ppt-indelingen, omdat zij kunnen worden geconverteerd naar hun MS Office 2007 tegenhangers, vertaald in OmegaT, en terug worden geconverteerd. Deze procedure is daarom een alternatief voor vertalers die prefereren om niet OpenOffice.org voor dit doel te gebruiken.

Converteren naar MS Office 2007-indeling

U kunt bestanden van MS Office 1997/2000/2003/XP converteren naar de indeling van MS Office 2007 door ze te openen in MS Office 2007 en ze in de nieuwe indeling op te slaan met "Opslaan als". (Omdat dit nu de nieuwe standaard indeling is, worden ze eenvoudigweg beschreven als Word, Excel of Powerpoint in MS Office 2007).

Voor gebruikers die geen MS Office 2007 of 2010 hebben en het niet willen kopen, verschaft Microsoft een compatibiliteits plug-in voor eerdere versies.

Linux-gebruikers: zowel MS Office 2007 en de Microsoft compatibiliteits plug-in kunnen worden uitgevoerd op Crossover Linux.

Punten om op te letten bij het gebruiken van de indelingen .docx, .xlsx en .pptx in OmegaT

In de OmegaT versies vóór 2.1.8, resulteerde elke wijziging in opmaak in een bestand van MS Office 2007 in een lange rij van meerdere tags, die de afhandeling van deze bestandsindeling onpraktisch maakte. Vanaf versie 2.1.8 worden deze meerdere tags nu, standaard, samengevoegd (gecomprimeerd) tot één enkele tag. Gebruikers die bestanden van MS Office 2007 willen vertalen zouden daarom OmegaT moeten bijwerken naar versie 2.1.8 of later.

(Het grootste gemak van het afhandelen van tags met .docx-bestanden gaat ten koste van een licht verlies aan het beheren van de opmaak. Bijvoorbeeld: zonder de functie "samengevoegde tags", waarbij een woord in vet of cursief in de brontekst staat, zou de vertaler er voor kunnen kiezen om het slechts weg te zetten in alleen vet of alleen cursief. Met de functie "samengevoegde tags" ingeschakeld, is dit niet mogelijk. De meeste gebruikers zullen waarschijnlijk vinden dat het grotere gemak opweegt tegen dit gebrek.)

De indeling .docx is ook gevoelig voor de introductie van "storende" opmaakcode die resulteert in het verschijnen van ongewenste en onnodige tags in het bewerkingsvenster van OmegaT. Omdat deze onhandig zijn tijdens het vertalen, is het het waard om te proberen deze storende tags te verwijderen vóórdat wordt begonnen met de vertaling in OmegaT. OmegaT deelt dit probleem met andere CAT-programma's die de indeling .docx afhandelen, en de oplossingen zijn soortgelijk of hetzelfde.

Hoe ongewenste opmaakcode te verwijderen uit .docx-bestanden

Onthoud dat zelfs nadat de instellingen van Word zijn gewijzigd zodat het geen "storende" codes meer invoegt, bijvoorbeeld voor automatisch afbreken, kunnen zulke codes nog steeds aanwezig zijn in het bestand en niet zijn verwijderd door de wijziging in de configuratie. Verwijderen van deze codes wordt hieronder beschreven. Maak echter eerst, vóórdat de instructies hieronder voor het verwijderen van storende codes worden opgevolgd, de wijzigingen in de configuratie in Word, of Word kan eenvoudigweg opnieuw de storende codes invoegen als het bestand vervolgens wordt geopend.

Gereedschappen van derde partijen

Zoals reeds vermeld is dit probleem met MS Word niet uniek voor OmegaT. Gereedschappen zijn door derde partijen geproduceerd om het probleem te behandelen. Twee hiervan zijn:

CodeZapper (goedkoop)

Document Cleaner (gratis)

Op niveau brengen tekenopmaak

Een alternatief voor het uitvoeren van de macro CodeZapper macro op uw tekst is om de opmaak "op niveau te brengen". "Op niveau brengen" van de opmaak betekent het toepassen van de opmaak van het eerste teken in een selectie van tekst (zoals een gehele alinea) op alle volgende tekens. Onthoud dat dit niet hetzelfde is als het "verwijderen" van de opmaak, wat er voor zou zorgen dat de tekenopmaak terug zou keren naar de standaard van het document.

U kunt de opmaak van alinea's essentieel op niveau brengen door gehele alinea's in MS Word te kopiëren en ze over zichzelf heen te plakken zodat de gehele alinea de opmaak van het eerste teken aanneemt.

Handmatig op niveau brengen van de tekenopmaak van een alinea

Stap 1: Weergeven van de markering van een alinea. Markeer elke alinea door er herhaaldelijk op te klikken totdat de gehele alinea wordt geaccentueerd. Verplaats dan het einde van de markering één plaats naar links zodat het niet de markering van het alinea-einde omvat.

Stap 2: Kopieer deze geaccentueerde (Ctrl+C). Selecteer dan "Plakken speciaal" (Word 2003) of klik op de pijl aan de onderzijde van de knop "Invoegen" (Word 2007) om de uitgebreide opties voor Plakken te verkrijgen. Voeg tenslotte de inhoud in met behulp van de optie "Niet-opgemaakte Unicode-tekst".

Waar alinea's geen in-regelige opmaak hebben (vet, cursief, hyperlinks, etc.), kunt u ofwel:

- de opmaak vanuit deze alinea's op niveau brengen met behulp van de hierboven beschreven macro, en dan de opmaak opnieuw in te voegen; of

- markeer alleen de tekst tot aan het gedeelte dat is opgemaakt, kopieer deze tekst en plak het over zichzelf heen, en herhaal dat proces op de tekst na het opgemaakte gedeelte.

Maken van een macro om de tekenopmaak van een alinea op niveau te brengen

U kunt de hierboven vermelde procedure enigszins automatiseren door een macro te maken. Korte instructies voor het maken van de macro (in MS Office 2007) worden hieronder gegeven. (Voor meer gedetailleerde instructies, bekijk uw instructiehandleiding of klik hier, hier of hier.)

Als u dit nog niet gedaan hebt, voeg de tab Ontwikkelaar als volgt aan de ribbon toe: klik op de knop Office. Selecteer Word Opties. Klik op Populair in het dialoogvenster Word Opties. Op de ribbon, vink Tab ontwikkelaar weergeven aan en bevestig met OK. Sluit Word.

Start Word opnieuw op, maak een nieuw bestand in Word en voeg een alinea voorbeeldtekst toe, ten minste drie regels lang, bijv.:

Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea. Dit is een alinea.

Klik op de knop voor de markering van de alinea om de alinea-einden zichtbaar te maken.

Plaats de cursor in uw tekstalinea (niet in de eerst of laatste regels).

Maak de macro:

Klik, op de tab Ontwikkelaar, op Macro opnemen.

In het vak Macronaam, typ een naam voor de macro, zoals "niveau_opmaak". Selecteer Normal.dotm in het vak "Macro opslaan in" om de macro in alle documenten beschikbaar te maken. Als u al wijzigingen hebt gemaakt in uw Normal.dotm, wilt u daar misschien eerst een back-up van maken.

Klik op de knop Toetsenbord. Klik in het vak voor een nieuwe toetsencombinatie, en experimenteer met de toetsencombinaties om er een te vinden die nog niet is toegewezen. Als een combinatie die u probeert als is toegewezen, wordt een bericht met die mededeling weergegeven in het dialoogvenster, en kunt u de combinatie verwijderen en een andere proberen. Ctrl+Shift+9 schijnt niet te zijn toegewezen aan enige andere functie in de basis Word-installatie, maar u kunt elke andere combinatie gebruiken die nog niet is toegewezen.

Klik op Toewijzen om de sneltoets toe te wijzen aan de macro die u zult gaan opnemen. Alles wat u vanaf nu doet zal worden opgenomen in de macro, dus volg deze procedure zorgvuldig:

Ctrl+Cursor naar boven (dit brengt de cursor naar het begin van de alinea)

Ctrl+Shift+Cursor naar beneden (dit selecteert de alinea, inclusief de markering voor het alinea-einde)

Shift+Cursor naar links (dit verplaatst het einde van de selectie één teken naar links zodat de markering voor het alinea-einde niet langer is opgenomen)

Ctrl+C (dit kopieert de alinea)

Ctrl+V (dit plakt de tekst van de alinea terug over de alinea)

Klik op Opnemen stoppen na het invoeren van deze opdrachten.

Klik op Macro's en selecteer niveau_opmaak (of welke naam u ook gaf aan uw macro), en dan Bewerken. De code van uw macro(s) zal worden weergegeven. Voor niveau_opmaak zou dat moeten zijn:

___________________
Sub niveau_opmaak()
'
' macro niveau_opmaak
'
'
Selection.MoveUp Unit:=wdParagraph, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.MoveLeft Unit:=wdWord, Count:=1, Extend:=wdExtend
Selection.Copy
Selection.PasteAndFormat (wdPasteDefault)
End Sub
___________________

Wijzig de regel:

Selection.PasteAndFormat (wdPasteDefault)

naar:

Selection.PasteSpecial DataType:=wdPasteText

Sla op met Ctrl+S, en sluit het venster voor het bewerken van de macro.

Als alles volgens plan is gegaan zou uw macro nu moeten werken. Voeg enige opmaak aan uw Word-document toe, bijvoorbeeld door één woord vet te maken, om dit te testen. Plaats nu eenvoudigweg de cursor ergens in de alinea en druk op Ctrl+Shift+9 (of eender welke andere toetscombinatie u hebt geselecteerd), en u zou de opmaak moeten zien verdwijnen.

U kunt de toetsencombinatie op elke moment wijzigen. Klik op de hoofdknop "Office" en dan Word-opties (rechtsonder in het dialoogvenster) om dat te doen.

Klik op Aanpassen > Opdrachten kiezen. Kies Macro's uit de keuzelijst. Selecteer "niveau_opmaak" (of hoe u het ook noemde).

Klik op Aanpassen aan de onderzijde van het dialoogvenster naast de Toetsenbordsneltoetsen.

In het vak Categorieën, scroll naar beneden naar Macro's en selecteer dat. Selecteer dan rechts, onder Macro's, niveau_opmaak (of hoe u uw macro ook noemde). De huidige sneltoets zal worden weergegeven in het relevante vak. U kunt dat leeg maken door het te selecteren en op Verwijderen te drukken. U kunt dan een nieuwe sneltoets invoeren en die toewijzen met Toewijzen zoals u eerder hebt gedaan. Sluit/bevestig de dialoogvensters.

U kunt een soortgelijke procedure gebruiken om een knop voor uw macro te maken:

Klik opnieuw op de hoofdknop "Office", en dan Word-opties.

Klik op Aanpassen > Opdrachten kiezen. Kies Macro's uit de keuzelijst. Selecteer uw macro.

Klik op Toevoegen. U zou de opdracht voor de macro moeten zien verschijnen in de kolom aan de rechterkant. Klik op Aanpassen.

Kies een symbool en klik op OK > OK. Het symbool voor uw macro zou moeten verschijnen in de werkbalk.

Deze macro is handig voor het op niveau brengen van de opmaak van een hele alinea die geen zichtbare opmaak bevat. Waar een alinea gewenste opmaak bevat, moet u de verwijderde opmaak herstellen na het op niveau brengen van de alinea. In alinea's die veel opmaak bevatten kan het herstellen van de verwijderde opmaak behoorlijk veel werk zijn. Overweeg de volgende alternatieven voor zulke alinea's:

Copyright Marc Prior 2009-2011