Extraktion och standardisering

I princip alla företag har tagit ett antal implicita beslut om vilken terminologi som ska användas genom att man helt enkelt skrivit dokumentation och i denna kallat företeelser för någonting. Dessa beslut kan återvinnas ur tidigare dokumentation, för att slippa uppfinna hjulet på nytt för varje ny text som ska skrivas.

Termextraktion

När man ska formalisera sin termhantering genom att införa en termbank (dvs. en domänspecifik ordlista) har man ingen lust att sätta sig ner och manuellt lista alla termer man kan tänkas ha användning av. Istället vore det bättre att återanvända de termbeslut som har tagits genom att automatiskt skörda termer ur källor som redan finns inom företaget. Detta kallas termextraktion.

Extraktion av termer kan göras ur många olika källor exempelvis översättningsminnen och enskilda dokument. Att extrahera ur översättningsminnen eller dokument som översatts ger bäst effekt. Genom att matcha källspråkssträngar mot motsvarande översatta strängar kan vi identifiera varianter (synonymer) av termer som har använts. Med hjälp av Fodinas egenutvecklade metoder och verktyg för tvåspråkig extraktion får vi inte bara ut termer utan en hel del synonymer på två språk – en bonus som kan vara värd en hel del pengar.

Termstandardisering

När man extraherat termer ur existerande underlag med hjälp av automatiska verktyg får man alltid med ett antal termer och synonymer som måste sorteras bort manuellt. Att göra denna sortering samt att bestämma vilken eller vilka synonymer som är tillåtna respektive förbjudna kallas för standardisering. Eftersom standardisering av ett stort underlag är väldigt arbetskrävande krävs effektiva verktyg för detta jobb. Fodina har egenutvecklade, effektiva verktyg som underlättar standardiseringsarbetet i mycket stor grad och kan därmed avsevärt minska kostnaden för att bygga upp företagets termbank.

Om kunden har ont om egna resurser för att utföra termstandardisering kan Fodina utföra en hel del av standardiseringsarbetet och bara lämna de termer som är svårast att standardisera till kundens egna terminologer eller termexperter. På detta sätt behöver kundens interna resurser endast användas när det är som viktigast - de simplare fallen hanteras av Fodina.

Termdatabas

Resultatet av en termextraktion och standardisering är en standardiserad termbank. För att kunden ska kunna nyttja denna resurs på bästa vis bör den oftast göras tillgänglig för kundens anställda via någon form av termdatabas. Fodina har erfarenhet av ett flertal motorer för termdatabaser och kan levererera den standardiserade termbanken på det format som är lämpligast för kunden. Alternativt kan vi hjälpa kunden att utvärdera och införskaffa en termdatabas.

Termextraktion för maskinöversättning

Maskinöversättning ("automatisk översättning") underlättas liksom manuell översättning avsevärt av tillgång till domänspecifika termer. Fodina har en väl utvecklad process för framtagning av termer till maskinöversättning.

Skillnaden här, jämfört med vanlig extraktion och standardisering, är att standardiseringen byts ut mot validering i flera steg för att verifiera att de termer som extraherats är korrekta och hör hemma inom den aktuella domänen. Istället för att bara välja ut några termer som tillåtna och förbjuda andra, behålls här så många korrekta termer som möjligt, för att öka täckningsgraden och ge bättre översättningar.

Den här e-postadressen är skyddad från spamrobotar, du måste ha Javascript aktiverat för att visa den för mer information!

 
Fodina Language Technology AB | Teknikringen 7 | 583 30 Linköping | +46 (0)13 342 01 87 | Den här e-postadressen är skyddad från spamrobotar, du måste ha Javascript aktiverat för att visa den