Oversettelsesminneprogrammer. Oversettelsesminneteknologi. Oversettelsesminnestandarder og -formater

Beskrivelse

Én oppføring i en slik database tilsvarer et segment eller "oversettelsesenhet" (engelsk oversettelsesenhet), som vanligvis tas for å være én setning (sjeldnere, en del av en kompleks setning eller avsnitt). Hvis oversettelsesenheten til kildeteksten samsvarer nøyaktig med oversettelsesenheten som er lagret i databasen (eksakt samsvar), kan den automatisk erstattes med oversettelsen. Det nye segmentet kan også avvike litt fra det som er lagret i databasen (fuzzy match). Et slikt segment kan også settes inn i oversettelsen, men oversetteren må gjøre de nødvendige endringene.

I tillegg til å fremskynde oversettelsesprosessen av gjentatte fragmenter og endringer som er gjort i allerede oversatte tekster (for eksempel nye versjoner programvareprodukter eller endringer i lovgivning), sikrer PP-systemer også enhetlighet i oversettelsen av terminologi i de samme fragmentene, noe som er spesielt viktig når teknisk oversettelse. På den annen side, hvis en oversetter regelmessig erstatter eksakte samsvar hentet fra oversettelsesdatabaser i oversettelsen sin, uten å overvåke bruken i en ny kontekst, kan kvaliteten på den oversatte teksten forringes.

I hvert enkelt programvaresystem lagres data i sitt eget format (tekstformat i Wordfast, database Få tilgang til data i Deja Vu), men det er en internasjonal standard TMX (eng. Oversettelsesminne eXchange-format), som er basert på XML og kan genereres av nesten alle programvaresystemer. Takket være dette kan oversettelsene som er laget brukes i forskjellige applikasjoner, det vil si at en oversetter som jobber med OmegaT kan bruke en TM opprettet i Trados, og omvendt.

De fleste PP-systemer støtter i det minste opprettelse og bruk av brukerordbøker, opprettelse av nye databaser basert på parallelle tekster (engelsk justering), samt semi-automatisk utvinning av terminologi fra original og parallelle tekster.

Populære PP-programvaresystemer

I følge vurderinger av bruken av PP-systemer inkluderer de mest populære systemene:

Den engelske Wikipedia har en liste som sammenligner mulighetene til ulike systemer.

Oversettelsesminnestandarder og -formater

  • TMX (Translation Memory Exchange Format - Translation Memory Exchange). Denne standarden muliggjør utveksling mellom ulike leverandører av oversettelsesminne. TMX er et vanlig format blant oversettere og er best egnet for import og eksport av oversettelsesminner. Siste versjon Dette formatet - 1.4b lar deg gjenopprette kildedokumenter og deres oversettelse fra en TMX-fil.
  • TBX (Termbase Exchange format - Terminology base exchange). Dette LISA-formatet (Localization Industry Association) blir for tiden revidert og utgitt på nytt i henhold til ISO 30042. Denne standarden tillater utveksling av terminologi, inkludert detaljert leksikalsk informasjon. Hovedbasen til TBX er definert av standardene: ISO 12620, ISO 12200 og ISO 16642. ISO 12620 gir et register over veldefinerte "datakategorier" med standardiserte navn som fungerer som dataelementtyper eller forhåndsdefinerte verdier. ISO 12200 (også kjent som MARTIF) gir grunnlaget for TBX-rammeverket. ISO 16642 (også kjent som Terminological Markup Framework) inkluderer en strukturell metamodell for Terminology Markup Languages ​​generelt.
  • SRX er designet for å forbedre TMX-formatet og gjøre utveksling av oversettelsesminne mellom programmer mer effektiv. Evnen til å spesifisere segmenteringsreglene som ble brukt i den forrige oversettelsen øker effektiviteten av å identifisere segmenter i gjeldende tekst med innholdet i PP.
  • GMX GILT står for globalisering, internasjonalisering, lokalisering og oversettelse. GILT Metrics-standarden består av tre deler: GMX-V for volummålinger, GMX-C for kompleksitetsmålinger og GMX-Q for kvalitetsmålinger. Den foreslåtte GILT Metrics-standarden er rettet mot å kvantifisere arbeidsomfanget og kvalitetskrav ved implementering av GILT-oppgaver.
  • OLIF er en XML-kompatibel åpen standard som brukes til å utveksle terminologi og leksikalske data. Selv om det opprinnelig ble brukt som en måte å utveksle leksikalske data mellom proprietære maskinoversettelsesleksikon, har formatet gradvis utviklet seg til en mer generell standard for terminologiutveksling.
  • XLIFF (XML Localization Interchange File Format - XML-format for gjensidig utveksling under lokalisering), opprettet som et enkelt filformat for gjensidig utveksling som gjenkjennes av alle programvare lokalisering. XLIFF er oversettelsesbransjens beste måte å utveksle informasjon i XML-format. Noen verktøy bruker proprietære XLIFF-formater som ikke tillater at filer som er opprettet med dem, åpnes i andre programmer.
  • TransWS (Translation Web Services) definerer de nødvendige parameterne for å kalle webtjenester når du sender og mottar filer og meldinger relatert til lokaliseringsprosjekter. Det ble tenkt som et utvidet system for å automatisere lokaliseringsprosessen ved å bruke tjenester på Internett.
  • xml:tm , denne tilnærmingen til oversettelsesminne er basert på konseptet tekstminne, som tillater kombinasjonen av forfatterminne og oversettelsesminne. xml:tm-formatet ble levert til Lisa OSCAR av XML-INTL.

Fordeler og ulemper

Fordeler

  • Reduserer tiden og mengden arbeid for en oversetter.
  • Forbedret oversettelseskonsistens, spesielt når en gruppe oversettere jobber med samme prosjekt.
  • Øke fortjenesten ved å øke produktiviteten til en oversetter eller en gruppe oversettere.
  • Forbedre kvaliteten på tjenestene ved å øke nøyaktigheten og ensartetheten i oversettelsen av termer, spesielt i spesialiserte tekster.

Feil

  • Kan gjøre oversettelsen mer "tørr"; selve essensen av teksten går tapt hvis oversettelsen ved hjelp av et oversettelsesminne utføres av en lavkvalifisert oversetter.
  • Det er ofte ingen sammenheng mellom setningen/teksten som tilbys av programmet og nabosetninger og teksten som helhet.
  • Originalen skal være i elektronisk form.
  • En uoppdaget feil kan spre seg gjennom hele prosjektet.
  • Opplæring for å jobbe i selve programmet er nødvendig, og ved jobbbytte - kanskje mer enn én gang (hvis arbeidsgivere bruker forskjellige TM-programmer).
  • Ikke egnet for alle typer tekster.
  • Høye kostnader for lisensiert programvare.

se også

Litteratur

  • Grabovsky V.N. Oversettelsesminneteknologi // Broer. Journal of Translators. 2004. nr. 2. - S. 57-62.

Linker

  • Bruk av profesjonelle programmer av russiske oversettelsesfirmaer // Konstantin Dranch, 8. april 2015.

(sjeldnere - del av en kompleks setning, eller et avsnitt). Hvis oversettelsesenheten til kildeteksten samsvarer nøyaktig med oversettelsesenheten som er lagret i databasen (eksakt samsvar, engelsk. nøyaktig treff), kan den automatisk settes inn i oversettelsen. Det nye segmentet kan også avvike litt fra det som er lagret i databasen (fuzzy matching). uklar kamp). Et slikt segment kan også settes inn i oversettelsen, men oversetteren må gjøre de nødvendige endringene.

I tillegg til å fremskynde oversettelsesprosessen av gjentatte fragmenter og endringer i allerede oversatte tekster (for eksempel nye versjoner av programvareprodukter eller endringer i lovgivning), sikrer PP-systemer også enhetlighet i oversettelsen av terminologi i de samme fragmentene, som er spesielt viktig i teknisk oversettelse. På den annen side, hvis en oversetter regelmessig erstatter eksakte samsvar hentet fra oversettelsesdatabaser i oversettelsen sin, uten å overvåke bruken i en ny kontekst, kan kvaliteten på den oversatte teksten forringes.

I hvert spesifikke programvaresystem lagres data i sitt eget format (tekstformat i Wordfast, Access-database i Deja Vu), men det finnes en internasjonal standard TMX (eng. Oversettelsesminne eXchange-format ), som er basert på XML og som kan genereres av nesten alle programvaresystemer. Takket være dette kan oversettelsene som er laget brukes i forskjellige applikasjoner, det vil si at en oversetter som jobber med OmegaT kan bruke en programvare laget i TRADOS og omvendt.

De fleste programvaresystemer støtter i det minste opprettelse og bruk av brukerordbøker, opprettelse av nye databaser basert på parallelle tekster. Justering), samt semi-automatisk utvinning av terminologi fra originale og parallelle tekster.

Populære PP-programvaresystemer

I følge vurderinger av bruken av PP-systemer inkluderer de mest populære systemene:

Den engelske Wikipedia har en liste som sammenligner mulighetene til ulike systemer.

Oversettelsesminnestandarder og -formater

  • TMX (Translation Memory Exchange Format - Translation Memory Exchange) format. Denne standarden muliggjør utveksling mellom ulike leverandører av oversettelsesminne. TMX er et vanlig format blant oversettere og er best egnet for import og eksport av oversettelsesminner. Den nyeste versjonen av dette formatet - 1.4b lar deg gjenopprette kildedokumenter og deres oversettelse fra en TMX-fil.
  • TBX (Termbase Exchange format - Terminology base exchange). Dette LISA-formatet (Localization Industry Association) blir for tiden revidert og utgitt på nytt i henhold til ISO 30042. Denne standarden tillater utveksling av terminologi, inkludert detaljert leksikalsk informasjon. Kjernegrunnlaget til TBX er definert av standardene: ISO 12620, ISO 12200 og ISO 16642. ISO 12620 gir et register over veldefinerte "datakategorier" med standardiserte navn som fungerer som dataelementtyper eller forhåndsdefinerte verdier. ISO 12200 (også kjent som MARTIF) gir grunnlaget for TBX-rammeverket. ISO 16642 (også kjent som Terminological Markup Framework) inkluderer en strukturell metamodell for Terminology Markup Languages ​​generelt.
  • SRX er designet for å forbedre TMX-formatet og gjøre utveksling av oversettelsesminne mellom programmer mer effektiv. Evnen til å spesifisere segmenteringsreglene som ble brukt i den forrige oversettelsen øker effektiviteten av å identifisere segmenter i gjeldende tekst med innholdet i PP.
  • GMX GILT står for globalisering, internasjonalisering, lokalisering og oversettelse. GILT Metrics-standarden består av tre deler: GMX-V for volummålinger, GMX-C for kompleksitetsmålinger og GMX-Q for kvalitetsmålinger. Den foreslåtte GILT Metrics-standarden er rettet mot å kvantifisere arbeidsomfanget og kvalitetskrav ved implementering av GILT-oppgaver.
  • OLIF er en XML-kompatibel åpen standard som brukes til å utveksle terminologi og leksikalske data. Selv om det opprinnelig ble brukt som en måte å utveksle leksikalske data mellom proprietære maskinoversettelsesleksikon, har formatet gradvis utviklet seg til en mer generell standard for terminologiutveksling.
  • XLIFF (XML Localization Interchange File Format - XML-format for gjensidig utveksling under lokalisering), opprettet som et enkelt filformat for gjensidig utveksling, som gjenkjennes av all lokaliseringsprogramvare. XLIFF er oversettelsesbransjens beste måte å utveksle informasjon i XML-format.
  • TransWS (Translation Web Services) definerer de nødvendige parameterne for å kalle webtjenester når du sender og mottar filer og meldinger relatert til lokaliseringsprosjekter. Det ble tenkt som et omfattende system for å automatisere lokaliseringsprosessen ved å bruke tjenester på Internett.
  • xml:tm, denne tilnærmingen til oversettelsesminne er basert på konseptet tekstminne, som lar deg kombinere forfatterminne og oversettelsesminne. xml:tm-formatet ble levert til Lisa OSCAR av XML-INTL.

Fordeler og ulemper

Fordeler

  • Reduserer tiden og mengden av oversetterarbeid
  • Forbedret oversettelseskonsistens, spesielt når en gruppe oversettere jobber med samme prosjekt.
  • Øke fortjenesten ved å øke produktiviteten til en oversetter eller gruppe av oversettere
  • Forbedre kvaliteten på tjenestene ved å øke nøyaktigheten og ensartetheten i oversettelsen av termer, spesielt i spesialiserte tekster.

Feil

  • Kan gjøre oversettelsen mer "tørr"; selve essensen av teksten går tapt hvis oversettelsen ved hjelp av et oversettelsesminne utføres av en lavkvalifisert oversetter
  • Det er ofte ingen sammenheng mellom setningen/teksten som tilbys av programmet og nabosetninger og teksten som helhet.
  • Originalen skal være i elektronisk form
  • En uoppdaget feil kan spre seg gjennom hele prosjektet
  • Det er nødvendig å trene selve programmet, og når du bytter jobb - kanskje mer enn én gang (hvis arbeidsgivere jobber med forskjellige TM-programmer)
  • Ikke egnet for alle typer tekster
  • Høye kostnader for lisensiert programvare

se også

Litteratur

  • Grabovsky V.N. Oversettelsesminneteknologi // Broer. Journal of Translators. 2004. nr. 2. - S. 57-62.

Linker

  • Ikke gjør den samme oversettelsen to ganger // Computerra Online, 14. februar 2005.

Notater


Wikimedia Foundation. 2010.

Se hva "Oversettelsesminne" er i andre ordbøker:

    Innhold 1 I psykologi 2 In datateknologi... Wikipedia

    Mosaikk som viser ... Wikipedia

    Tekst på ett språk sammen med oversettelsen til et annet språk. "Parallell tekstjustering" er identifiseringen av samsvarende setninger i begge halvdelene av en parallell tekst. Store samlinger av parallelle tekster kalles... ... Wikipedia

    Parallell tekst (bitekst) tekst på ett språk sammen med oversettelsen til et annet språk. "Parallell tekstjustering" er identifiseringen av samsvarende setninger i begge halvdelene av en parallell tekst. Store møter... ... Wikipedia

    Oversettelsesminne (TM, noen ganger kalt "Oversettelsesminne") er en database som inneholder et sett med tidligere oversatte tekster. Én oppføring i en slik database tilsvarer et segment eller "oversettelsesenhet" (engelsk... ... Wikipedia

Nøkkelord

OVERSETTELSE MINNE / OVERSETTINGSAKKUMULATOR / YRKESUTDANNING/ OVERSETTELSE / TRENING I OVERSETTELSE/ TM-PROGRAM / OVERSETTELSE MINNE / PROFESJONELL UTDANNING / OVERSETTELSE / UNDERVISNING I OVERSETTELSE / TM-PROGRAMVAREN

merknad vitenskapelig artikkel om data- og informasjonsvitenskap, forfatter av det vitenskapelige arbeidet - Olga Ivanovna Babina, Pavel Grigorievich Osminin

Problemet med å lære elevene å jobbe med spesialisert programvare vurderes. Historien om utviklingen av oversettelsesminneprogrammer er dekket, eksempler på de mest kjente programmene, inkludert russisk utvikling, og kriterier for deres forskjeller er gitt, og generell prosess arbeider med programmer, er de mest typiske bruksområdene for oversettelsesminneteknologi angitt. Fordelene med oversettelsesminneprogrammer er angitt, som består i å øke oversetterens produktivitet og forenkle overholdelse av terminologiens enhet i oversettelsesteksten. Ulempene med slike programmer er gitt; øke arbeidseffektiviteten er bare mulig når du oversetter tekster som inneholder et stort antall repetisjoner; opplæring for å jobbe med programmer krever vanligvis tid og økonomiske kostnader. Bruken av oversettelsesminneteknologi i utdanningsprosessen er begrunnet, og gir også Forskjellige typer oppgaver for studenter rettet mot å utvikle ferdighetene til å bruke oversettelsesminne. Oppdragene gjenspeiler de virkelige spesifikasjonene til en oversetters arbeid, noe som øker konkurranseevnen til den fremtidige kandidaten på arbeidsmarkedet. En metodikk for vurdering av læringsutbytte presenteres. Resultatene av artikkelen kan brukes i kompilering metodiske anbefalinger til kursen oversettelsestrening.

relaterte temaer vitenskapelige arbeider om data- og informasjonsvitenskap, forfatter av det vitenskapelige arbeidet - Olga Ivanovna Babina, Pavel Grigorievich Osminin

  • Oversettelsesminne som et middel til å forbedre oversetterproduktiviteten

    2017 / Chemezov Yan Robertovich
  • Om opplæring og videreutdanning av tekniske oversettere

    2014 / Popov S.A.
  • Bruke TQI-indeksen for å forbedre oversettelseskvaliteten

    2017 / Chemezov Yan Robertovich
  • Den innledende fasen av mestring av oversettelsesminneprogrammer ved å bruke eksemplet med Wordfast-produktet

    2011 / Naugolnykh A. Yu.
  • Bruk av informasjonsteknologi for å optimalisere oversettelsesprosessen

    2012 / Morozkina E. A., Shakirova N. R.
  • Integrering av prosjektmetoden i prosessen med undervisning i oversettelse

    2018 / Kondrashova Elena Valerievna, Drygina Inna Valerievna
  • Fra erfaring med bruk av prosjektarbeid i opplæring av oversettere

    2017 / Nagovitsyna I. A., Lekomtseva I. A.
  • En moderne modell for profesjonell kompetanse til en oversetter i sammenheng med oversetteropplæringssystemet ved russiskspråklige universiteter

    2012 / Lipatova Victoria Valerievna, Litvinov Alexander Viktorovich
  • Metodikk for bruk av kvantitative beregninger for å vurdere kvaliteten på skriftlig militær-teknisk oversettelse i utdanningsprosessen

    2018 / Shvets T.P.
  • Bruk av IKT i organisering av prosessen med opplæring av oversettere på grunnlag av språkavdelinger

    2012 / Marutyan Mikhail Borisovich

Denne artikkelen tar for seg en aktuell problemstilling av moderne profesjonsutdanning som består i å lære studenter å bruke spesiell programvare i profesjonell aktivitet. Artikkelen presenterer en historisk bakgrunn for utviklingen av programvare for Translation Memory (TM); mest populære TM-programvare (inkludert russiske prestasjoner på dette feltet) er eksemplifisert og sammenlignet. Den generelle prosessen med å bruke TM-programvare i oversetteres aktivitet er beskrevet; typiske sfærer for bruk av oversettelsesminne er oppregnet. Fordelene ved å bruke TM-programvaren (øke oversetteres arbeidseffektivitet, lette terminologiening i teksten på målspråket) vises. Noen ulemper med disse dataprogrammene (en evne til å øke effektiviteten kun innenfor begrensede domener i tekster som inneholder mange repetisjoner, høy pris på programvaren, tid for å lære å bruke programvaren) er også nevnt. Bruken av programvare for oversettelsesminne i utdanning er begrunnet. Ulike typer oppgaver for studenter som tar sikte på å mestre sine praktiske ferdigheter i bruk av programvare for oversettelsesminne, foreslås. Disse oppgavene gjenspeiler en spesifikk karakter ved oversetternes arbeid, som gjør at alumni kan oppnå konkurransefortrinn på arbeidsmarkedet. Prosedyre for evaluering av treningsresultater er gitt. Resultatene av oppgaven kan brukes til å utarbeide faglige retningslinjer for oversetteres utdanning.

Tekst av vitenskapelig arbeid om emnet "Oversettelsesminne i oversetterutdanning"

UDC 378,16 BBK Sh11

OVERSETTSMINNE I TRENING AV OVERSETTER

O.I. Babina, P.G. Osminin South Ural State University (Chelyabinsk)

Problemet med å lære elevene å jobbe med spesialisert programvare vurderes. Historien om utviklingen av oversettelsesminneprogrammer er dekket, eksempler på de mest kjente programmene, inkludert russisk utvikling, og kriterier for deres forskjeller er gitt, den generelle prosessen med å jobbe med programmer er beskrevet, og de mest typiske bruksområdene for oversettelse minneteknologi er indikert. Fordelene med oversettelsesminneprogrammer er angitt, som inkluderer å øke oversetterens produktivitet og forenkle overholdelse av terminologiens enhet i oversettelsesteksten. Ulempene med slike programmer er gitt - å øke arbeidseffektiviteten er bare mulig når du oversetter tekster som inneholder et stort antall repetisjoner; trening for å jobbe med programmer krever vanligvis tid og økonomiske kostnader. Bruk av oversettelsesminneteknologi i utdanningsløpet er begrunnet, og det gis ulike typer oppgaver for studentene, rettet mot å utvikle ferdighetene til å bruke oversettelsesminne. Oppdragene gjenspeiler de virkelige spesifikasjonene til en oversetters arbeid, noe som øker konkurranseevnen til den fremtidige kandidaten på arbeidsmarkedet. En metodikk for vurdering av læringsutbytte presenteres. Resultatene av artikkelen kan brukes til å utarbeide metodiske anbefalinger for et kurs i oversettelse.

Stikkord: oversettelsesminne, oversettelsesminne, yrkesopplæring, oversettelse, oversettelsesopplæring, TM-program.

Introduksjon

I moderne verden Behovet for oversettelsestjenester øker. Volumet av oversettelsesmarkedet vokser, behovet for kvalifiserte oversettere øker, og produktiviteten til oversettere må øke. Rollen har økt betydelig informasjonsteknologier oversatt - ble utbredt som generelle programmer(tekstredigerere) og spesialiserte oversettelsesprogrammer (elektroniske ordbøker, tekstkorpus, oversettelsesminneprogrammer, terminologidatabaser). Selve stoffet for oversettelse har gjennomgått endringer - stadig mer digitalt materiell tilbys for oversettelse i form av presentasjoner og multimediemateriell. En rekke forfattere bemerker at når man trener oversettere, er det nødvendig å ta hensyn til endringer i oversetternes arbeid, lære moderne ferdigheter og evner og bruke moderne informasjonsteknologi i opplæringen.

Oversikt over TM-programmer

Translation Memory (TM)-teknologi er utviklet for gjenbruk

i oversettelsesaktiviteter av tidligere oversatte tekster.

Noen av de første forsøkene på å bruke en datamaskin for å hjelpe til med manuell oversettelse dateres tilbake til 1966. I Mannheim brukte det tyske oversettelsesbyrået en datamaskin til å lage ordlister for visse typer tekster. Arbeidet foregikk som følger: oversetteren leste Engelsk tekst og understreket ord som han trengte tyske ekvivalenter til. Dataoperatøren matet deretter denne informasjonen inn i datamaskinen, som kunne sette sammen tre eller fire ordlister for teksten på ti minutters arbeid.

I Luxembourg brukte terminologikontoret til European Coal and Steel Community et automatisk ordboksøk etter termer. I følge byråets anslag brukte oversetteren minst en fjerdedel av tiden sin på å søke etter termer. Når han jobbet med systemet, understreket oversetteren ord som var ukjent for ham. Deretter ble hele setningen lagt inn i datamaskinen, et automatisk søk ​​ble utført, og de mest like setningene ble skrevet ut, samt ord med oversettelse i rekkefølgen av opptreden i teksten. Jo flere kom

forespørsler fra oversetteren, jo flere setninger ble søkt i, noe som økte sannsynligheten for at termer dukker opp i riktig kontekst. Dermed var byrået i stand til ikke bare å lette arbeidet til oversetteren, men også å sette sammen spesialiserte ordlister på kort tid.

I 1979 kom Peter Arten til den konklusjon at tekstene til EU-kommisjonen, som måtte oversettes til flere språk, inneholdt et meget stort antall repetisjoner og sitater fra ulike kommisjonsdokumenter, slik at oversettere ble tvunget til å kaste bort tid på å oversette allerede. oversatte tekster. Arten foreslo at det er nødvendig å ha et stort felles sentralminne med en søkefunksjon, der alle organisasjonens dokumenter og deres oversettelser vil bli lagret. Når du skriver inn tekst, vil det være mulig å spesifisere de nødvendige språkene for oversettelse og sammenligne dokumentet med dokumenter i det delte minnet, hvorfra de nærmeste oversettelsene av setninger av originalteksten på de nødvendige språkene vil bli skrevet ut.

Martin Kaye beskrev i en rapport fra 1980 en foreslått oversetterhjelpeenhet bestående av en tekstbehandler og en ordbok. Tekstredigeringsprogrammet består av to vinduer - det øverste, der originalteksten er inneholdt, og det nederste, der oversettelsen legges inn. Oversetteren har muligheten til å markere et ord eller en setning i teksten og søke i ordboken; det skulle være mulig å redigere oppføringer i ordboken.

De første kommersielle TM-programmene dukket opp på begynnelsen av 1990-tallet. I 1984 ble STAR (et akronym for Software Translation Artwork Recording) grunnlagt i Stein am Rhein, Sveits. Selskapet var i utvikling programvare, leverer oversettelsestjenester. I 1991 ga selskapet ut Transit-programmet for operativsystem DOS, programmet inkluderte en terminologistyringsmodul TermStar.

I 1984 ble TRADOS (et akronym for TRanslation & Documentation Software) grunnlagt i den tyske byen Stuttgart og i 1992 ga selskapet ut Translator's Workbench for operasjonssalen DOS-systemer. Programmet inkluderte et oversettelsesminne, en tekstredigerer og en MultiTerm terminologistyringsmodul.

I 1992 ble SDL International, en leverandør av språklige tjenester, grunnlagt i den engelske byen Maidenhead. Selskapet vokste raskt, kjøpte opp mindre selskaper og ble en av markedslederne. I 1998 ga SDL ut sitt eget TM-program, SDLX. I 2005 kjøpte SDL TRADOS.

I 1993 ble ATRIL grunnlagt i Madrid og ga ut Deja Vu, den første TM-programvaren for operasjonssalen. Windows-systemer 3.1. Programmet ble bygget inn i Microsoft Word for Windows 2.0. I 1996-1997 Deja Vu har blitt redesignet til et program med et eget grensesnitt.

I vårt land er det ganske mange utviklinger knyttet til TM-programmer. MT2007 TM-programmet har blitt utviklet siden ca. 2007 av en enkelt utvikler og er tilgjengelig som en separat applikasjon. Utviklingen av programmet ble suspendert i noen tid; programmet kan være tilgjengelig under navnet CATnip. ABBYY tilbyr ABBYY Aligner, et verktøy for å lage oversettelsesminner fra parallelle tekster. russisk selskap PROMT tilbyr en kombinasjon av teknologi for maskinoversettelse (MT) og oversettelsesminne (TM).

Det er mange forskjellige TM-programmer tilgjengelig i dag. De mest populære er Across, Deja Vu, MemoQ, OmegaT, SDL Trados Studio, STAR Transit, Wordfast.

Vanligvis er både betalt og gratis opplæringsmateriell tilgjengelig på nettstedet til selskapet som utvikler programmet. For Deja Vu- og SDL Trados-programmene er gratis opplæringsmateriell tilgjengelig på russisk fra de offisielle distributørene av programmene i Russland og CIS-landene - Okay-oversettelsesbyrået og T-Service-selskapet.

På det nåværende stadiet er oversettelsesminne en database som lagrer tekstsegmenter på kildespråket og målspråket. Det originale segmentet og oversettelsessegmentet som er knyttet til det, utgjør en oversettelsesenhet (TU). Rollen til et segment er vanligvis tekstsetninger.

TM-programmer kan skilles ut etter flere kriterier.

1) Basert på teknisk implementering kan vi skille mellom lokale TM-programmer og de som er tilgjengelige online. Ved hjelp av

nettversjoner (for eksempel Google Translator Toolkit og Wordfast Anywhere) fungerer i et nettleservindu. I fig. Figur 1 viser et eksempel på arbeid med Wordfast Anywhere. Samtidig kan resultatene av arbeidet (oversettelsesminner, ordlister) i Google Translator Toolkit gjøres tilgjengelig for andre brukere.

Lokale programmer kan være frittstående applikasjoner eller innebygde applikasjoner.

lagres i et tekstredigeringsprogram (for eksempel Microsoft Word). Oversettelsen skjer direkte i tekstredigerer. Fordelen med denne tilnærmingen er at brukeren arbeider med det velkjente redigeringsgrensesnittet og har tilgang til avanserte tekstredigeringsmuligheter. Ulempen er at støtten for filformater er begrenset - vanligvis er bare tekstredigeringsformater tilgjengelige.

Når du arbeider med individuelle applikasjoner, foregår hele oversettelsesprosessen i applikasjonsmiljøet. Imidlertid kan flere formater være tilgjengelige. Ulempen kan være behovet for å venne seg til programgrensesnittet.

2) Ved tillegg funksjonalitet. Terminologistyringsprogrammer er ofte innebygd i TM-programmer - de lar deg tilby generell tilgang til terminologidatabaser, lagre og behandle terminologi. Dette lar oss sikre enhet av terminologi i oversettelse, sikre samsvar med språket

politikk innenfor et bestemt foretak eller fagområde.

For å bygge et oversettelsesminne må du kunne sammenligne deler av kildeteksten og oversettelsen for deretter å legge inn disse parene i programdatabasen. Derfor er TM-programmer ofte utstyrt med en funksjon for å justere tekstsegmenter (vanligvis setninger).

I tillegg, direkte under oversettelsesprosessen for å løse tvetydighet

se bruken av et bestemt ord i kontekst. TM-programmer gir som regel muligheten til å bygge en konkordans av et ord - finn en liste over all bruk av ordet i konteksten, samtidig som de presenterer metoder for å oversette den leksikalske enheten i hvert enkelt tilfelle. Faktisk gir denne funksjonen tilgang til et flerspråklig tekstkorpus, og søket etter leksikale elementer utføres gjennom grensesnitt som ligner på de som brukes når man arbeider med tekstkorpus. Noen parallelle korpus for individuelle språkpar med grensesnitt for kompilering av en konkordans er tilgjengelig online (som Tran88earcs, WeBiText, Tranlogi, SupbroTerri og andre). Siden søk i en informasjonsressurs allerede er en ganske kraftig kilde til språklig informasjon for en oversetter, blir parallelle tekstkorpus med et søkeverktøy for det noen ganger separert i en egen type oversettelsesminne og kontrastert med oversettelsesminneprogrammer i seg selv, hvor søket etter gjentatt

» Fil Rediger Visningsverktøy? & | ^ | o = |<^? | □ | ^ ■=£>] O @ , Q. Ei | lSi ♦«*

100 % (TM ENsRU) Privat TU

Kommersielle TM-programmer har som regel innebygde systemer for å trekke ut terminologi og komposisjon.

legge til en ordliste med termer (SDL MultiTerm Extract, SDL MultiTerm, PROMT Term, Mono-Conc Pro, Simple Concordance Program, etc.).

Den "rå" teksten, som inkluderer automatisk erstattede termer og tekstsegmenter med deres oversatte motstykker, blir gjenstand for etterredigering i sluttfasen.

3. Kvalitetskontroll: inkluderer en formell kontroll av den fullførte oversettelsen for fullstendighet, grammatisk korrekthet, korrekt oversettelse av relevant terminologi, som kan utføres av oversetteren selv, (eventuelt) kunden, samt ved en mellomledd som gir kommunikasjon mellom oversetteren og kunden. I dette tilfellet er prosessen med å registrere fullførte redigeringer i oversettelsesminnet av stor betydning, ellers kan feil gjentas i etterfølgende oversettelser.

Når man arbeider med et TM-program, skilles altså innholdet (inkludert bruk av en rekke funksjoner for automatisering av oversettelsesaktiviteter), formelle og økonomiske aspekter ved oversettelse. De identifiserte aspektene er en viktig komponent i bruken av oversettelsesminne i oversetteres profesjonelle aktiviteter. I denne forbindelse bør hvert av disse aspektene gjenspeiles i praktisk opplæring av fremtidige oversettere i bruken av TM-programmer i oversettelsesaktiviteter. Samtidig ser det ut til at det er nødvendig å "veilede" den fremtidige oversetteren sekvensielt gjennom alle stadier av den virkelige oversettelsesprosessen under simulerte forhold, noe som gir oppgaven med å utvikle meningsfylt konsistente oppgaver når man lærer å bruke TM-programmer.

Opplæring i bruk av TM-programmer

Når vi underviser studenter ved et universitet, anser vi det som tilrådelig å bruke nettbaserte versjoner av TM-programmer, siden denne tilnærmingen har en rekke fordeler:

Online TM-er er gratis, noe som forenkler deres introduksjon i utdanningsprosessen.

Online TM kan brukes på ulike enheter (stasjonære datamaskiner, bærbare datamaskiner, nettbrett) og operativsystemer (Windows, Linux, Mac OS).

Online TM kan brukes overalt hvor det er Internett-tilgang, det er ikke nødvendig å installere programmet på et visst antall datamaskiner på forhånd. Denne tilnærmingen tillater oss å utvide antallet elever som trenes betydelig. For eksempel,

klasser kan gjennomføres med studenter av spesialiserte spesialiteter (lingvister, oversettere), med studenter av ikke-kjerne spesialiteter (tilleggsutdanningskurs).

Når du arbeider med et TM-program, må en oversetter vite hvordan du bruker og oppdaterer programmets database. Det må huskes at ethvert verktøy fungerer bedre hvis det brukes riktig.

Oppgavetypene som utføres av elevene i klasserommet er varierte og gjenspeiler spesifikasjonene til det faktiske arbeidet til en oversetter. La oss liste noen oppgaver.

Oppgave med å sette sammen et korpus av tekster. Elevene får parametrene til tekstene som skal inkluderes i korpus (navn på fagområde, sjanger, tekststil, dato for opprettelse osv.), og blir bedt om å lage et pedagogisk korpus av flere tekster. Denne oppgaven er på grunn av en rekke forfatteres oppfatning om at TM-er kan brukes sammen med andre læremidler (for eksempel tekstkorpus), noe som ytterligere øker effektiviteten av timene. Samtidig kan enkelte metoder for å bruke et tekstkorpus i undervisning i fremmedspråk gjenbrukes ved opplæring av oversettere.

I den "myke" versjonen foreslås et visst generelt korpus av tekster tilgjengelig på nettet som en kilde til tekster (for eksempel National Corpus of the Russian Language, British National Corpus, Michigan Corpus of Academic Spoken English, etc.). Mange nettkorpora har tekst meta-markup som klassifiserer tekster i henhold til en rekke parametere. I denne forbindelse er det en ganske enkel oppgave å velge tekster fra et slikt korpus; bare prosessen med å bruke søkeverktøy for et tekstkorpus kan forårsake vanskeligheter. Derfor bør bruk av søkemotorer for tekstkorpus tilgjengelig på nettet være en integrert del av opplæringen til en profesjonell oversetter.

Det "harde" alternativet er rettet mot å løse et mer komplekst problem - et uavhengig søk etter tekster i henhold til parametere på Internett. Dette utgjør i sin tur oppgaven med å bruke mulighetene til Internett-søkemotorer, og derfor er informasjonsinnhenting og søkeverktøy også nødvendige for en oversetter i sin profesjonelle virksomhet.

Opprettet under denne oppgaven

tekstkorpus kan brukes til å utføre påfølgende oppgaver ved opplæring av oversettere.

Oppgave om å sette sammen en ordliste over teksten. Studentene mottar en tekst fra et bestemt fagområde og setter sammen en ordliste med begreper med oversettelse fra den for å bruke denne ordlisten til å kontrollere terminologiens enhetlighet i oversettelsen de utfører. Som nevnt tidligere, for å velge terminologi, brukes som regel verktøy for automatisk å trekke ut leksikale enheter fra tekster, som kan bygges inn i kommersielle TM-programmer, men som ofte er fraværende i nettbaserte systemer. I læringsprosessen foreslår vi å bruke et verktøy for å trekke ut substantivfraser, som kan brukes både til undervisning i fremmedspråk og som en integrert del av oversetteropplæringen. Å bli kjent med metodene for å bruke et verktøy for automatisk å trekke ut terminologi fra tekster er en nødvendig komponent i prosessen med å lære å bruke oversettelsesminneprogrammer i profesjonelle aktiviteter.

En utvidelse av en slik oppgave kan være oppgaven med å presentere den resulterende ordlisten med termer på en strukturert måte, i form av en leksikalsk ontologi. Sammen med oversettelsesminner utvikles terminologiontologier som et viktig verktøy for å overholde bedriftens språkpolicyer. I tillegg er det studier om bruk og sammenligning av terminologiske ontologier til forskjellige språk for å skape en ressurs som kan brukes både i oversettelsesminneteknologi og i automatisk oversettelse av tekster.

Tekstjusteringsoppgave og

oversettelse. Elevene mottar en tekst og dens oversettelse og utfører tekstjustering for å få et fullt oversettelsesminne. En variant av denne oppgaven er å bruke den automatiserte, interaktive termjusteringsprosedyren.

Oppgave for en foreløpig analyse av effektiviteten av å bruke TM. Eleven får utdelt to tekster og informert om at den første teksten brukes til å lage et oversettelsesminne, den andre teksten vil bli oversatt ved hjelp av oversettelsesminnet. Eleven blir bedt om å analysere hvor effektiv bruken av oversettelsesminne er for et gitt tekstpar. Eksempler på slike tekster er presentert i fig. 2. For å opprettholde kontinuiteten i oppgaver, kan teksten for å lage en TM være et underkorpus av korpuset av tekster som brukes til å lage en ordliste med termer.

Denne oppgaven koker ned til å identifisere gjentatte blokker i begge tekstene og beregne andelen av slike blokker i teksten som brukes til oversettelse. For å løse dette problemet er det i den utvidede versjonen av oppgaven mulig å bruke hjelpeautomatiseringsverktøy (kompilere frekvenslister, bruke programmer for å trekke ut terminologi fra tekster, verktøy for komparativ analyse av brukte leksikale enheter, etc.).

En oppgave for å oversette en tekst ved hjelp av TM. Elevene mottar teksten og oversetter den selvstendig ved hjelp av TM. Teksten er gitt fra fagområdet tidligere brukt til å danne en ordliste og oversettelsesminne, som gjør det mulig å bruke resultatene fra tidligere oppgaver. I første omgang foreslås det å oversette teksten som ble gitt under forrige oppgave. Lengre

Tekst for å lage TM Tekst for oversettelse ved bruk av TM

Et innledende grenseverdiproblem for Boussinesq-Love-ligningen definert på en graf studeres. En reduksjon til det abstrakte Cauchy-problemet for en andreordens Sobolev-typeligning utføres. Et teorem om faserommet til den opprinnelige ligningen oppnås. Artikkelen tar for seg den optimale kontrollen av løsninger på det innledende-sluttlige problemet for en lineær ligning av Sobolev-typen med en (b, p)-seksjonsoperator. Det innledende-sluttlige problemet for Boussinesq-Love-ligningen, som modellerer de langsgående vibrasjonene til en bjelke, vurderes. En reduksjon til et abstrakt initial-sluttproblem for en andreordens Sobolev-typeligning utføres. Teoremer om den unike løseligheten til de originale og abstrakte problemene oppnås

Ris. 2. Eksempel på tekster for å analysere effektiviteten ved bruk av TM

Det er mulig å selvstendig søke etter tekst fra samme fagområde og prøve å oversette den med samme oversettelsesminne.

En oppgave for å sammenligne oversettelser laget med TM. Oppgaven er lik den forrige. Studentene mottar imidlertid flere tekster fra ulike fagområder. Oppgaven kan utføres på flere måter.

Alternativ 1: studentene inviteres til å bruke det tidligere opprettede oversettelsesminnet og "prøve ut" å oversette tekster om ulike emner med dets hjelp.

Alternativ 2: studentene blir bedt om å selvstendig kompilere tekstkorpus for fagområdene som de utgitte tekstene for oversettelse er viet, og bruke dem til å lage et oversettelsesminne. Og oversett deretter hver tekst ved å bruke oversettelsesminnet som er relevant for den.

Som et resultat blir studentene bedt om å sammenligne de resulterende oversettelsene av tekster for å bestemme nytten av oversettelsesminne for å oversette hver av dem. I det første alternativet vil det åpenbart være mer effektivt å bruke oversettelsesminne til å oversette tekst fra samme fagområde som TM ble kompilert for enn når man oversetter tekster fra andre fagområder. I det andre tilfellet er alternativer mulige. Avhengig av nærheten til tekstene som brukes som korpus til teksten som skal oversettes, kan effektiviteten til den opprettede TM variere. I hvert alternativ blir elevene bedt om å forklare hva som forårsaker forskjellen i effektiviteten av TM-bruk.

Vurderingsmetodikk

læringsutbytte

For å sjekke resultatene av opplæring i bruk av TM-programmer har vi utviklet følgende metodikk, basert på prinsippet om feilakkumulering - feil utførte oppgaver vurderes etter en rekke kriterier. For endelig kontroll under trening brukes følgende kriterier:

Evne til å jobbe med programvare;

Kvaliteten på den utførte oversettelsen.

Vurder etter det første kriteriet

hensiktsmessig fra et teoretisk og praktisk synspunkt. Den teoretiske siden av vurderingen gjennomføres i form av en flervalgsminitest, som inkluderer generelle spørsmål om TM-teknologi og spesifikke spørsmål

spørsmål om dataprogrammene som studeres. Et feil svar er verdt ett poeng.

Den praktiske siden består i å vurdere evnen til å bruke funksjonene til TM-programmet som studeres når man selvstendig utfører oppgaver av ulike typer, beskrevet tidligere i denne artikkelen. Resultatet vurderes på en binær skala (oppgave fullført / ikke fullført). Ved manglende fullføring av oppgaven legges 2 poeng til elevens samlede karakter.

Terskelfeilraten som testoppgaven anses som fullført er 40 % av maksimalt mulig antall poeng som gis for feil (som tilsvarer 60 % korrekthet av resultatene). Så hvis testen inkluderer 4 testspørsmål og en vurdering av 2 praktiske oppgaver, er den akseptable feilraten 3 poeng.

For å evaluere det andre kriteriet er det mange tilnærminger, for eksempel en subjektiv tilnærming, sammenligning med originalen i henhold til visse parametere og andre.

Vi foreslår å bruke en tilnærming basert på feilvekting, som brukes i ulike oversettelsesfirmaer, både utenlandske, for eksempel Lionbridge, og russiske, for eksempel Logrus, Pa1ex. Grunnlaget for denne tilnærmingen er å klassifisere feil avhengig av hvor mye hver feil forstyrrer vellykket kommunikasjon. Oversettelsesfeil tildeles "vekter" - numeriske mål som karakteriserer graden av innflytelse av feilen på prosessen med å oppfatte teksten i meldingen. Mer alvorlige feil som forvrenger betydningen av meldingen vurderes høyere. I fig. 3 viser en feilklassifiserer for bruk i trening.

Når du sjekker en oversettelse, telles antall feil av hver type og oversettelseskvalitetsindeksen TQI beregnes ved å bruke følgende formel:

TQI = (E16 + B2-2 + E3 1) / W 1000, hvor E1 er antall grove feil, E2 er antall middels feil, E3 er antall mindre feil, W er volumet av originalteksten i ordbruk.

Akseptabiliteten av en oversettelse bestemmes av terskelverdien til TQI-koeffisienten, som kan settes avhengig av graden av toleranse for ulike typer feil i oversettelsen. For pedagogiske formål empirisk

E1 (grov feil) E2 (middels feil) E3 (mindre feil)

Forvrengning av originalens betydning; uberettiget utelatelse av tekst for oversettelse Feil oversettelse av et begrep; inkonsekvens av terminologi i oversettelse; inkonsistens med ordlisten; manglende overholdelse av normene for målspråket Skrivefeil (for eksempel manglende mellomrom)

Ris. 3. Feilklassifiserer

Ris. 4. Eksempel på automatisering ved vurdering av oversettelseskvalitet

På denne måten etablerte vi en akseptabel kvalitetsfaktor for den endelige kontrollen - mindre enn 24 poeng, som tilsvarer 1 grov feil eller 3 gjennomsnittsfeil eller 6 mindre feil per 250 ordbruk. Denne koeffisienten kan også brukes til mellomstyring. Det er klart at terskelverdien til koeffisienten kan strammes inn (reduseres) for å styrke elevenes vane med å strebe etter maksimal oversettelsesevne, eller svekkes (økes) når man vurderer studentenes arbeid i det innledende stadiet av å utvikle oversettelsesferdigheter ved bruk av TM.

Sluttpoengsummen er lik summen av poeng for evnen til å jobbe med programvaren og kvaliteten på oversettelsen som utføres. Jo lavere antall oppnådd, jo mer vellykkede læringsresultater. Vi anbefaler å sette sammen testmateriell for den endelige kontrollen på en slik måte at totalskåren er minst 80 % basert på vurderingen av oversettelseskvalitetskriteriet. Ved vurdering av evnen til å arbeide med programvare ved bruk av 4 teoretiske spørsmål om bruk av TM og 2 praktiske oppgaver på "bestått/ikke bestått"-skalaen og vurdering av kvaliteten på én oversettelsestekst ved bruk av TQI-koeffisienten, fordeles de tillatte feilkoeffisientene. i forhold til hverandre 11 % (3 poeng) og 89 % (24 poeng).

Den foreslåtte metodikken for å vurdere læringsutbytte har en rekke fordeler.

Hver elevs arbeid vurderes individuelt. Eleven kan se typene feil og jobbe for å rette dem. I tillegg kan vurdering av oversettelseskvalitet brukes separat i oversettelsesklasser, etter å ha konfigurert feilklassifisereren for fagområdet eller teksttypene.

Det er enkelt å automatisere scoring ved hjelp av den angitte metoden. I fig. 4 viser et eksempel på slik automatisering ved vurdering av oversettelseskvalitet. Læreren fyller ut et regneark som angir nummeret på hver type feil. Den samlede poengsummen vises automatisk.

Som nevnt tidligere bruker store oversettelsesfirmaer lignende metoder for å vurdere arbeidet til en oversetter. Når du bruker denne teknikken, simuleres de virkelige arbeidsforholdene til en oversetter, noe som gjør det mulig å forberede studentene på de virkelige kravene i markedet.

Konklusjon

Avslutningsvis merker vi oss at bruken av TM-programmer, som bruken av all informasjonsteknologi, kan støte på problemer forårsaket av problemet med avvisning av det nye. Dette problemet er spesielt akutt i mentaliteten til det moderne russiske samfunnet. Samtidig skyldes det tidsånden å overvinne denne hemmende faktoren. I følge resultatene av en studie fra oversettelsesbyrået EnRus er et av hovedkravene for oversettelse

chiku - tilgjengelighet og evne til å bruke TM-programmer. I denne forbindelse er integrering i utdanningsprosessen av metoder og metoder for kunnskapsstyring i programmer for oversettelsesminne for tiden et spørsmål om konkurranseevnen til den fremtidige oversetteren på arbeidsmarkedet. Bruk av oversettelsesminneteknologi i undervisningen er derfor et effektivt middel for å utvikle praktiske ferdigheter hos elevene og forberede dem på markedskrav.

Litteratur

1. Zhang, Y. Datastøttet oversettelsesundervisning ved hjelp av moderne informasjonsteknologi / Y. Zhang // 7th International Conference on Computer Science & Education (ICCSE). -Mudanjiang, 2012. - S. 1628-1632.

2. Porshneva, E.R. Opplæring av profesjonelle oversettere i lys av den nye statlige standarden / E.R. Porshneva, I.Yu. Zinovieva // Høyere utdanning i Russland. - 2011. - Nr. 3. - S. 63-69.

3. Canovas, M. Programvare med åpen kildekode i oversetteropplæring / M. Canovas, R. Samson // Tradumatica: traduccio i tecnologies de la in-formacio i la comunicacio. - 2011. - Nr. 9. -P. 46-56.

4. Språk og maskiner - datamaskiner i oversettelse og lingvistikk: En LPA C-rapport / National Academy of Sciences, National Research Council; John R. Pierce. - Washington, DC, 1966. - 138 s.

5. Arthern, P.J. Maskinoversettelse og datastyrte terminologisystemer: A Translator's Viewpoint / P.J. Arthern // Translating and the Computer, Proceedings of a Seminar / red.

B.M. Snell. - London; Amsterdam, 1978. -P. 77-108.

6. Menns og maskiners rette plass i språkoversettelse: Forskningsrapport CSL-80-11 / Xerox Palo Alto Research Center; Martin Kay. - Palo Alto, CA, 1980. - 21 s.

7.MT2007. - http://mt2007-cat.ru/.

8. ABBYY Aligner. - http://www.abbyy.ru/aligner/.

9. PROMT selskapets nettsted. - http://www. promt.ru/.

10. Russisk side Deja Vu X2. - http://www.tmemory.ru/.

11. Nettstedet til T-Service-selskapet. - http://www.tra-service.ru/.

12. Google Translator Toolkit. - http://translate.google.com/toolkit.

13. Wordfast hvor som helst. - http://www. freetm. no/.

14. Macklovitch, E. Two Types of Translation Memory / Elliott Macklovitch // Proceedings of the Twenty-Second International Conference Translating and the Computer 22 (16.-17. november 2000). - London: Aslib, 2000. - 15 s.

15. Ilner, A. O. Opplæring av oversettere i Russland og i utlandet: en komparativ analyse / A. O. Ilner // Utdanning og vitenskap. -2010. - Nr. 8. - S. 65-70.

16. Li, Q. Anvendelse av CAT i oversettelsesundervisning / Qingjun Li, Likun Zhang // 2010 Second International Workshop on Education Technology and Computer Science (ETCS). -Wuhan, 2010. - Vol. 2. - S. 559-562.

17. Seewald-Heg, Yu Lokalisering av programvare, krav til informasjonsteknologi for en oversetter i globaliseringens tid / Yu. Seewald-Heg // Vestnik Perm. nasjonal forsket på Polyteknisk høyskole un-ta. Samfunnsøkonomiske vitenskaper. - 2012. -Nr. 16. - S. 85-96.

18. Frantzi, K. Automatisk gjenkjennelse av termer med flere ord: C-verdi/NC-verdimetoden / K. Frantzi, S. Ananiadou, H. Mima // International Journal on Digital Libraries. - 2000. - Nr. 3. - S. 115-130.

19. Å kombinere lingvistikk med statistikk for flerordsutdrag: En fruktbar forening? / Gael Dias, Sylvie Guillore, Jean-Claude Bassano, Jose Gabriel Pereira Lopes // Proceedings of the 6th International Conference Computer-Assisted Information Retrieval (Recherche d"Informations Assistee par Ordinateur) (RIA0"2000) / ed. Joseph-Jean Mariani, Donna Harman. - Frankrike: College de France, 2000. -P. 1473-1491.

20. Chen, J. A Multi-word Term Extraction System / Jisong Chen, Chung-Hsing Yeh, Rowena Chau // Proceedings of the 9th Pacific Rim International Conference on Artificial Intelligence 2006: Trends in Artificial Intelligence / ed. Q.Yang,

G. Webb. - Guilin, 2006. - Lecture Notes in Computer Science/ - Vol. 4099. - S. 1160-1165.

21. Sheremetyeva, S. Om å trekke ut flerords NP-terminologi for MT / S. Sheremetyeva // EAMT-2009: Proceedings of the 13th Annual Conference of the European Association for Machine Translation / ed. Lluis Marquez og Harold Somers (14.–15. mai 2009). - Barcelona, ​​​​Spania: Universitat Politecnica de Catalunya, 2009. - S. 205-212.

22. Ruiz Yepes, G. Parallelle korpus i

oversetterutdanning / G. Ruiz Yepes // Redit. Revista Electronica de Didactica de la Traduccion y la Interpretacion. - 2011. - Nr. 7. - S. 65-80.

23. Zheng, W. Design of a CAI System for Translation Teaching / Wang Zheng // Proceedings of International Conference CESM 2011, Part II / ed. S. Lin og X. Huang. - Wuhan, 2011. -P. 457-462.

24. Babina, O.I. Bruke et korpus av tekster for undervisning i et fremmedspråk / O.I. Babina // Moderne videregående skole: Innovativt aspekt. - Chelyabinsk: ChGI Publishing House, 2008. - Nr. 1. - S. 21-24.

25. Sheremetyeva, S.O. Om bruk av tekstbehandlingsprogrammer for undervisning i fremmedspråk / S. O. Sheremetyeva // Bulletin of SUSU. Ser. "Lingvistikk". -2012. - Vol. 15. - nr. 25 (284). - s. 56-59.

26. Khomutova, T.N. Vitenskapelig tekst: linguokognitiv tilnærming / T.N. Khomutova, O.I. Babina // Bulletin of SUSU. Ser. "Lingvistikk". - 2009. - Utgave. 9. - nr. 25 (158). -

27. Madsen, B.N. Prinsipper for et system for terminologisk konseptmodellering / B.N. Madsen,

HAN. Thomsen, C. Vikner // Proceedings of the 4th International Conference on Language Resources and Evaluation (Lisboa, Portugal). -Lisboa: ELRA, 2004. - S. 15-19.

28. Gluckstad, F.K. Terminologisk ontologi og kognitive prosesser i oversettelse / F.K. Gluckstad // Proceedings of the 24th Pacific Asia Conference on Language, Information and Computation / red. av Ryo Otoguro, Kiyoshi Ishi-kawa, Hiroshi Umemoto, Key Yoshimoto, Yasu-nari Harada (Sendai, Japan, 4.–7. november 2010). - Sendai: Tohoku University, 2010. -P. 629-636.

29. Dyumin, N.Yu. Automatisk ordjustering som en måte å bygge tospråklige leksikon / N.Yu. Dyumin // Lingvistikk i kultursammenheng: materialer fra V International. vitenskapelig-praktisk konf. (Tsjelyabinsk, 28.-30. november 2012) /general. utg. E.V. Kharchenko. - Chelyabinsk: Forlag. SUSU-senteret, 2012. - s. 92-94.

30. Petrosyan, A.E. Mental "blindhet" (røttene til ufølsomhet for nye ideer) / A.E. Petrosyan // Vitenskaps- og teknologisosiologi. - 2012. - T. 3, nr. 3. - S. 24-42.

31. Shakhova, N. Hvordan finne en god oversetter / N. Shakhova // Russian Translators Forum, St. Petersburg, 23.-25. september. 2011 - http://www.enrus.ru/ru/publications/TFRussia_ru s.pdf.

32. Tishin, D. Vurdering av kvaliteten på oversettelser fra TQI til kompetanse / D. Tishin. -http://www.slideshare.net/justm/tqi.

Babina Olga Ivanovna, kandidat for filologiske vitenskaper, førsteamanuensis, førsteamanuensis ved Institutt for lingvistikk og interkulturell kommunikasjon, South Ural State University, [e-postbeskyttet].

Osminin Pavel Grigorievich, hovedfagsstudent ved Institutt for lingvistikk og interkulturell kommunikasjon, South Ural State University, [e-postbeskyttet].

Bulletin fra South Ural State University-serien "Education. Pedagogikk» ______________________________________________________2013, bd. 5, nei. 3, s. 98-108

OVERSETTELSESMINNE I OVERSETTERNES UTDANNING

O.l. Babina, P.G. Osminin

Denne artikkelen tar for seg en aktuell problemstilling av moderne profesjonsutdanning som består i å lære studenter å bruke spesiell programvare i profesjonell aktivitet. Artikkelen presenterer en historisk bakgrunn for utviklingen av programvare for Translation Memory (TM); mest populære TM-programvare (inkludert russiske prestasjoner på dette feltet) er eksemplifisert og sammenlignet. Den generelle prosessen med å bruke TM-programvare i oversetteres aktivitet er beskrevet; typiske sfærer for bruk av oversettelsesminne er oppregnet. Fordelene ved å bruke TM-programvaren (øker oversetteres arbeidseffektivitet, lindrer terminologi

enhet i teksten på målspråket) vises. Noen ulemper med disse dataprogrammene (en evne til å øke effektiviteten kun innenfor begrensede domener i tekster som inneholder mange repetisjoner, høy pris på programvaren, tid for å lære å bruke programvaren) er også nevnt. Bruken av programvare for oversettelsesminne i utdanning er begrunnet. Ulike typer oppgaver for studenter som tar sikte på å mestre sine praktiske ferdigheter i bruk av programvare for oversettelsesminne, foreslås. Disse oppgavene gjenspeiler en spesifikk karakter ved oversetternes arbeid, som gjør at alumni kan oppnå konkurransefortrinn på arbeidsmarkedet. Prosedyre for evaluering av treningsresultater er gitt. Resultatene av oppgaven kan brukes til å utarbeide faglige retningslinjer for oversetteres utdanning.

Nøkkelord: oversettelsesminne, profesjonell utdanning, oversettelse, undervisning i oversettelse, TM-programvare.

Babina Olga, filologikandidat (PhD), førsteamanuensis, førsteamanuensis ved styreleder for lingvistikk og interkulturell kommunikasjon, South Ural State University (Chelyabinsk), babinaoi@ susu.ac.ru.

Osminin Pavel, doktorgradsstudent ved styreleder for lingvistikk og interkulturell kommunikasjon, South Ural State University (Chelyabinsk), [e-postbeskyttet].

Når vi snakker om automatisert oversettelse, mener vi vanligvis programmer som utfører oversettelse basert på maskinoversettelsesteknologi (Machine Translation). Imidlertid er det en annen teknologi - Oversettelsesminne, som, selv om det ikke er så allment kjent for russiske brukere, likevel har en rekke fordeler.

Den raske utviklingen av teknologisk fremgang har ført til en økning i antall tekniske enheter, maskiner og annet komplekst utstyr, uten hvilket livet til en moderne person er nesten utenkelig. For eksempel utgjør dokumentasjonsvolumet for det europeiske Airbus-flyet titusenvis av sider. Som data fra en studie utført i slutten av 2004 av LISA-foreningen (LISA 2004 Translation Memory Survey) viser, oversetter 42 % av respondentene omtrent 1 million ord per år, 24 % av selskapene som deltar i undersøkelsen har et årlig volum av oversettelser på 1-5 millioner, 12 % oversetter fra 5 til 10 millioner, volumet av oversettelser fra andre selskaper er fra 10 til 500 eller flere millioner ord per år. Spesielt er de fleste produsenter i dag ikke begrenset til sitt lokale marked og utvikler aktivt regionale markeder. Samtidig er produktlokalisering, inkludert oversettelse av produktbeskrivelser til det lokale språket, en av forutsetningene for å komme inn i et nytt marked.

På samme tid, selv om produsenter jevnlig slipper nye versjoner av produktene sine - biler, gravemaskiner, datamaskiner og mobiltelefoner, programvare - er ikke alle fundamentalt forskjellige fra tidligere modeller. Noen ganger er en ny telefonmodell en litt modifisert (eller omstilt) tidligere modell. Nye versjoner selger bedre, så produsentene må oppdatere produktene sine regelmessig. Som et resultat er dokumentasjonen for hvert av disse produktene ofte 70-90 % identisk med den i forrige versjon.

To faktorer - det store volumet av dokumenter som krever oversettelse og deres høye repetisjon - fungerte som et insentiv til å lage oversettelsesminneteknologien (forkortet TM, det er ingen generelt akseptert russisk oversettelse av dette begrepet). Essensen av TM-teknologi kan formidles billedlig i én setning: "Ikke oversett den samme teksten to ganger." Med andre ord, oversettelsesminne brukes til å gjenbruke tidligere laget oversettelser. Dette gjør at du kan redusere tiden det tar å forberede en oversettelse betydelig, spesielt når du arbeider med tekster som har høy grad av repetisjon.

Oversettelsesminneteknologi forveksles ofte med maskinoversettelse, som absolutt også er nyttig og interessant, men beskrivelsen er ikke hensikten med denne artikkelen. Bruken av TM-teknologi øker oversettelseshastigheten ved å redusere mengden mekanisk arbeid. Det er imidlertid viktig å merke seg at TM ikke utfører oversettelsen for oversetteren, men er et kraftig verktøy for å redusere kostnader ved oversettelse av repeterende tekster.

TM-teknologien fungerer etter prinsippet om å samle oversettelsesresultater: under oversettelsesprosessen lagres kildeteksten og oversettelsen i TM-databasen. For å gjøre det enklere å behandle informasjon og sammenligne ulike dokumenter, deler oversettelsesminnesystemet opp all tekst i separate deler som kalles segmenter. Disse segmentene er oftest setninger, men andre segmenteringsregler kan tas i bruk. Når du laster inn ny tekst, utfører TM-systemet segmentering og sammenligner segmentene av kildeteksten med de som allerede er tilgjengelige i den tilkoblede oversettelsesdatabasen. Hvis systemet klarer å finne et helt eller delvis samsvarende segment, vises dets oversettelse og indikerer samsvaret som en prosentandel. Segmenter som skiller seg fra den lagrede teksten er uthevet. Dermed kan oversetteren bare oversette nye segmenter og redigere delvis samsvarende.

Som regel settes samsvarsterskelen på et nivå som ikke er lavere enn 75 %, siden hvis du setter en lavere samsvarsprosent, vil kostnadene ved tekstredigering øke. Hver endring eller ny oversettelse lagres i TM, så det er ikke nødvendig å oversette det samme to ganger!

Det er også viktig å hele tiden fylle på oversettelsesminnedatabasen ved å lagre i databasen (eller i databaser, hvis oversettelsen utføres på ulike emner) par med "kildetekst - korrekt oversettelse"-segmenter. Dette vil redusere tiden det tar å oversette lignende tekster betydelig. I tillegg til å redusere arbeidsintensiteten ved oversettelse, gjør TM-systemet det mulig å opprettholde enhet av terminologi og stil gjennom all dokumentasjon.

Bruken av TM-teknologi gir oversetteren følgende fordeler:

  • øke arbeidsproduktiviteten. Å erstatte til og med 80 % av samsvarende segmenter fra oversettelsesdatabasen kan redusere tiden brukt på oversettelse med 50–60 %. Som praksis viser, er det mye mer effektivt å redigere en fullført oversettelse enn å oversette den igjen - "fra bunnen av";
  • enhet av terminologi og stil i nærvær av en oversettelsesdatabase om emnet for dokumentet som oversettes. Dette er spesielt viktig ved oversettelse av høyt spesialisert dokumentasjon;
  • organisere arbeidet til et team av oversettere med garantert oversettelseskvalitet takket være tilgang til en felles oversettelsesminnedatabase.

Separat bemerker vi at i vestlige land, hvor oversettelsesminneteknologi lenge har blitt et de facto obligatorisk verktøy for oversettere, regnes ikke midler brukt på å lage en oversettelsesdatabase som kostnader, men snarere som investeringer i stabilt arbeid av høy kvalitet, som øker kostnadene for kun profitt, men også verdien av selskapet selv.

Marked for oversettelsesminnesystemer

Den ubestridte lederen på markedet for oversettelsesminnesystemer er SDL-TRADOS-programmet. Sommeren 2005 fusjonerte de to største utviklerne av TM-systemer - selskapene SDL og TRADOS (programvareprodukter under TRADOS-merket er godt kjent for mange brukere), og nå slipper de et felles produkt, som er en standardsetter innen oversettelsesminne.

Det nye SDL-TRADOS-systemet har utvidet (brukerkonfigurerbar) fuzzy matching-funksjonalitet (søk etter treff i oversettelsesdatabasen), samt verktøy for å sjekke kvaliteten på oversatte dokumenter. Programmet kontrollerer stavemåten og beskytter innholdet i minneblokker ved hjelp av krypteringsteknologi.

Systemet støtter formater som Word DOC og RTF, online hjelp RTF, PowerPoint, FrameMaker, FrameMaker +SGML, FrameBuilder, Interleaf, QuickSilver, Ventura, QuarkXPress, PageMaker, SGML/HTML/XML, inkludert HTML Help, RC (Windows Resource) , Bookmaster (DCF) og Troff. I tillegg til SDL-TRADOS-systemet finnes det andre TM-systemer på IT-markedet. Franske produsenter er spesielt godt representert.

Systemet til det franske selskapet Atril (www.atril.com) kalles. Utviklerne organiserte først sitt eget oversettelsesbyrå for teknisk dokumentasjon, hvoretter ideen oppsto om å lage spesialisert programvare basert på Translation Memory-teknologi.

Dette er en frittstående applikasjon med en systematisert meny. Systemet kan lage TM-databaser, samt terminologidatabaser og koble ordbøker. Oversettelsesprosessen utføres i et spesielt Project-shell, hvor, når du oppretter det, legges ved filen som skal oversettes, og tilleggsinnstillinger kobles til: TM-database, ordbøker osv. Teksten oversettes i en spesiell tabell, der overfor hver kolonne i originalen må du fylle ut oversettelsesalternativet. Fordelene inkluderer også en tilleggsfunksjon for å oversette filer i forskjellige formater, som lar deg bevare den originale formateringen av filen.

V.N. Grabovsky; Journal for en praktiserende oversetter "BRIDGES" 2/2004

Artikkelen snakker om et nytt oversetterverktøy - Translation Memory (TM) teknologi, takket være hvilken mekanisering av oversettelsesaktiviteter utføres.

Nevrale nettverk i arbeidet til en oversetter

Maskinoversettelsesteorier, som har blitt utviklet i et sakte tempo siden uminnelige tider, har fått et stort løft siden 1970-tallet. Dette skyldtes betydelige fremskritt innen modellering av intellektuell aktivitet. I tillegg til rent vitenskapelig interesse, ble dette forklart av den økende rollen til interlingual kommunikasjon i den moderne verden.

I tillegg til elektroniske ordbøker og samtaleordbøker, på midten av 1990-tallet, ble "elektroniske oversettere" (de begynte å bli kalt MT-teknologi) ganske utbredt. I prinsippet er "elektroniske oversettere" programmer som kan behandle en hel tekst. Riktignok var utgangen ikke helt det som var nødvendig, og ærlig talt var det ikke i det hele tatt det som var nødvendig. For at resultatet av MT-teknologien skulle bli en virkelig sammenhengende tekst, måtte en person jobbe mye med den.

Konseptet "maskinoversettelse" har blitt godt kjent. Innenlandske programmer Stylus (nå kalt Promt Og Sokrates). Interessen for slike programmer avtok imidlertid gradvis etter en periode med innledende nysgjerrighet, og nå er den lav, selv om de har blitt betydelig forbedret. For tiden brukes de hovedsakelig til å gjøre seg kjent med innholdet på fremmedspråklige nettsteder på Internett, samt til å lese og skrive e-poster på et fremmedspråk.

I det store og hele har ikke arbeidet til en oversetter endret seg fundamentalt gjennom århundrene. Ja, datamaskiner dukket opp, liksom raske og praktiske skrivemaskiner. Ja, "elektroniske oversettere" har dukket opp. Men mens MT-teknologiene har blitt bedre, har de ikke blitt et verktøy med et bredt spekter av applikasjoner og sparer virkelig tid og krefter.

Hva er oversettelsesminneteknologi

Teknologi har blitt et nytt verktøy for oversettere Oversettelse_minne(TM). I Vesten er TM-teknologi og oversetterverktøyene som er laget på grunnlag av det - Translation Memory Tools (TMT) - velkjente og mye brukt. Et trekk ved denne teknologien er mekaniseringen av oversettelsesaktiviteter, og ikke dens automatisering i den formen som skaperne av MT-teknologi så det. Dessuten ga denne mer beskjedne, ved første øyekast, løsningen umåtelig flere praktiske fordeler enn det globale konseptet «elektroniske oversettere».

Forskjellen fra elektroniske ordbøker og andre oversetterverktøy er at et typisk TM-klasseprogram er basert på nevrale nettverk, som til en viss grad er i stand til å simulere funksjonen til den menneskelige hjernen ved behandling av data. Disse nettverkene er i stand til å lære og analysere komplekse datasett som er vanskelige å behandle ved hjelp av lineære algoritmer.

Disse programmene bruker en uklar algoritme for å søke etter ord ikke bare i ordbokformene, men også i andre former, for eksempel i et annet tilfelle. I tillegg kan de finne uttrykk i en annen ordrekkefølge. Et selvorganiserende kunstig nevralt nettverk er i stand til å finne mønstre og bestemme forhold mellom dem. Programmet sammenligner stykket du jobber med med innholdet i databasen og gir denne informasjonen til skjermen. Den kan fastslå at et gitt fragment ligner på et lignende fragment som finnes i systemets minne, for eksempel 99 %, 74 % eller til og med 20 %.

Enhver oversetter er kjent med følelsen av at uttrykket han for øyeblikket sliter med allerede har blitt møtt et sted, en gang i tiden, i det minste i en omtrentlig form. Dessuten kom den over enten i det samme materialet, eller i et annet oversatt tidligere. Det er bare en slags déjà vu... Jeg vil gjerne se på det, denne setningen, i det minste for referanse, for fornuftig å formulere den du jobber med nå...

Du begynner å bla tilbake i originalen, rote gjennom bokhyllen. Og det hendte ofte at den søkte frasen faktisk ble funnet. Oftest, når det er for sent, etter at arbeidet med oversettelsen er fullført. Jeg tror jeg i et slikt øyeblikk ville gitt hva som helst for et verktøy som ville hjelpe meg å finne den nødvendige teksten. Selv nå, når du skriver en oversettelsestekst ved hjelp av en datamaskin i stedet for på en skrivemaskin, er det alltid synd å gjøre om noe som er komponert med så vanskeligheter. En oversetters langvarige drøm er å komme opp med noen midler som vil frigjøre ham fra behovet for å oversette den samme setningen flere ganger.

Denne typen idé ligger til grunn for etableringen av Translation Memory-teknologi, eller ganske enkelt TM, på grunnlag av hvilke mer eller mindre brukbare programmer begynte å dukke opp på slutten av 80-tallet - begynnelsen av 90-tallet. Faktisk er et slikt program et kontrollskall som fungerer med en eller annen plug-in database (TM) og som jeg vil kalle en oversettelsesbank. TM er en datastyrt versjon av et stort arkivskap der hver setning du noen gang har oversatt er lagret, i par – både på originalspråket og på målspråket. Hvert slikt par kalles tospråklig. Programmet vil umiddelbart minne deg på hvordan denne setningen ble oversatt forrige gang. Tilgang til informasjon er enkel og rask.

Oversikt over hovedprogrammene i Oversettelsesminne-klassen

For tiden er det flere programvareprodukter som bruker TM-teknologi på verdensmarkedet. De skiller seg fra hverandre, og noen ganger betydelig. Imidlertid deler de alle noen felles funksjonalitet.

For eksempel har de vanligvis et tekstredigeringsprogram med to parallelle vinduer. Ett vindu er beregnet på originalteksten, det andre for oversettelse. Når det originale tekstfragmentet vises i originalvinduet (det kan være en setning, et avsnitt, et enkelt ord), starter et søk etter et lignende fragment i databasen. Hvis det er nøyaktig det samme fragmentet i minnet, vises det automatisk i oversettelsesvinduet. Hvis nøyaktig det samme fragmentet ikke ble funnet, men noe lignende ble funnet, vises det funnet fragmentet i programvinduet, og indikerer prosentandelen av samsvar.

Oversetteren redigerer oversettelsesteksten foreslått av programmet, bringer den i tråd med originalen, sender den til databaseminnet og går videre til neste. Hvis ingenting blir funnet i det hele tatt, oversetter oversetteren det fra bunnen av ved å skrive teksten inn i oversettelsesvinduet. Etter å ha arbeidet ferdig med dette fragmentet, sender oversetteren det til databaseminnet og går videre til neste. Dermed skjer TM-påfylling automatisk etter hvert som arbeidet skrider frem. Umiddelbart etter at den tospråklige har gått inn i TM, blir den tilgjengelig for brukeren. Hvis TM-programmet er plassert på en nettverksstasjon og andre brukere jobber med det, blir den nye tospråklige umiddelbart tilgjengelig for andre oversettere. Etter at originalfragmentet og oversettelsesfragmentet er sendt til databasen, vises neste fragment i originalvinduet.

Det første programmet av denne typen, kalt Translation Manager, ble utviklet av IBM. Opprinnelig brukte IBM Translation Manager til sine egne behov – for lokalisering (tilpasning til fremmedspråk) av egen programvare. Translation Manager ble deretter tilbudt markedet som et kommersielt produkt, og hadde en tid monopol på dette området. Dette programmet er ganske enkelt å bruke, raskt og gir gode muligheter for individuelle brukerinnstillinger. Det er separate vinduer for hver av de tre hovedfunksjonene - Oversettelse, Oversettelsesminne og Ordbok. Oversettelsesminne-vinduet viser treff funnet i minnet, hvis noen, og Ordbok-vinduet viser terminologi fra ordbøker utviklet av IBM. Dette programmet har også noen ulemper, for eksempel en komplisert prosedyre for å søke etter individuelle ord i oversettelsesminnet.

Et annet program - SDLX - ble utviklet for sine egne behov av et engelsk selskap SDL, engasjert i programvarelokalisering. Hvert program som er inkludert i settet, installeres separat. SDL Edit er faktisk selve programmet som oversettelse utføres med. Den har tre vinduer som viser kildeteksten, oversettelsen og oversettelsesminnet. Det skal bemerkes at dokumentet som skal oversettes ikke kan importeres direkte til SDL Edit. Den må først konverteres ved hjelp av SDL Convert, som er en klar ulempe.

Program Déjà Vu er populær blant oversettere i Europa på grunn av sin fleksibilitet og tilpasningsevne. I tillegg til bekvemmelighet, skiller Déjà Vu seg fra andre produkter ved å ha det høyeste pris/kvalitetsforholdet. Sammenlignet med de to foregående programmene har det aktuelle produktet en rekke praktiske funksjoner. Eksperter bemerker at dette programmet helt fra begynnelsen ble utviklet i kontakt med fremtidige brukere. Det er kjent at den siste versjonen av Déjà Vu ble testet, spesielt av russiske oversettere. En av dem, Andrey Gerasimov, skrev en positiv anmeldelse av dette programmet i magasinet MultiLingual Computing & Technology

Programmet er godt kjent i vårt land og populært i Europa. STAR Transit. I sin ideologi er den helt annerledes enn andre produkter av den aktuelle klassen. Du har allerede fått en viss forståelse av dem, og du vet at de alle har en sentral database med stor kapasitet, et arkiv med oversettelser, der de nødvendige dataene blir funnet umiddelbart (hvis de er der, selvfølgelig). Som Bill Gates ville sagt: "Informasjon til fingerspissene." Så alle Translation Memory-programmer har et elektronisk katalogskap, men Transit har ikke det. Alt er annerledes med ham. Kildedataene og oversettelsen lagres i tekstformat som filer, som oversetteren plasserer i kataloger etter eget skjønn. Oversetteren kan da ganske enkelt fortelle programmet hvilke kataloger og til og med hvilke filer han trenger. Transit danner deretter et assosiativt nettverk av lenker, som det fungerer med. Til tross for noen fordeler er Transit ikke mye brukt i Russland. Til slutt byttet Promt, den offisielle distributøren av Transit, til å distribuere Trados' Translator's Workbench.

Men Translator's Workbench, eller ganske enkelt Trados, ble raskt utbredt i Russland, først blant oversettelsesfirmaer, og deretter blant individuelle oversettere. Dette kan nok forklares med at det gjør det mulig å jobbe uten å forlate Word, noe som er psykologisk mer behagelig. Hvem liker å se på tekst med alle slags koder i hakeparenteser? Translator's Workbench (Trados), sammenlignet med andre programmer, er mer praktisk for en vanlig oversetter som ikke er en programmeringsspesialist; den er mer forståelig enn andre programmer av denne typen. Spesielt er kontrollknappene utstyrt med verktøytips. Når du er i et kjent og forståelig Word, kan du bruke alle verktøyene (for eksempel autotekst).

Dette produktet har et komplett utvalg av nyttige verktøy som bare finnes i andre programmer i en eller annen grad. Et av disse verktøyene er Analise, som lar deg analysere originalteksten på forhånd og finne ut om det er (og i hvilket antall) komplette og ufullstendige treff. Det er verdt å nevne et så praktisk verktøy som Placeables, som lar for eksempel automatisk endre tall i teksten hvis alt annet i det oversatte fragmentet samsvarer med det som finnes i oversettelsesbanken (TM). Den automatiske funksjonen med å erstatte desimaltegn og/eller komma, tidsformater, forkortelser osv. i tall er veldig praktisk. til de aktuelle parameterne spesifisert av oversetteren.

De aller fleste russiske oversettere som bruker TM-teknologi foretrekker Translator's Workbench (Trados).

Hva har oversettelsesminneprogrammer til felles?

For å oppsummere beskrivelsen av hovedprogramvareproduktene i Translation Memory-klassen, skal det bemerkes at de som regel har en rekke felles funksjoner.

Blanding - Justering

Denne funksjonen lar deg lage oversettelsesbanker (TM) fra eksisterende filer. Fra to filer - en med originalteksten og den andre med oversettelsesteksten - lages et sett med tospråklige. På motsatt side av setningen i kildeteksten er oversettelsen bygget. Og så videre for alle filene som oversetteren kompilerte til en enkelt samling. Graden av bekvemmelighet av kombinasjonsfunksjonen varierer fra program til program.

Vedlikehold

Ettersom tospråklige hoper seg opp i databasen, kan antallet øke så mye at innholdet i databasen kan gå utover alle grenser. Noen unøyaktigheter og til og med feil kan vises, spesielt hvis programmet brukes av mange brukere på nettverket. Det vil være behov for å redigere eller avklare noe, eller til og med bare slette det. For å være rettferdig må det sies at det nevnte programvedlikeholdsverktøyet ikke helt løser dette problemet - i praksis er det fortsatt vanskelig å håndtere tilstopping av oversettelsesbanker.

Terminologiordbok - Terminologiprogram

Alle programmene som vurderes har sine egne terminologiske ordbøker, som i hovedsak er elektroniske ordbøker kjent for alle. Terminologiordbøker kan importere filer i ordbok- eller ordlisteformat; de kan også oppdateres manuelt.

Tekstredigering - Dokumentredigerer

Det er her oversettelsesprosessen faktisk finner sted. For dette formålet har alle programmer de to vinduene nevnt ovenfor - for kildeteksten og for dens oversettelse. Alle tekstredigerere har muligheten til å sette, i prosent, graden av likhet mellom kildeteksten som for øyeblikket oversettes og teksten i oversettelsesbiblioteket. Jo høyere du setter likhetsprosenten, for eksempel 90 % eller 95 %, jo mindre sannsynlig er det å finne samsvarende tekst der. Imidlertid kan du angi en mindre prosentandel, da kan du samle mye materiale som i det minste vil være nyttig for referanse.

Konkordans (Knytte ordbruk med kontekst) - Konkordans

Dette er en veldig nyttig funksjon for alle programmene som vurderes. Det hender ofte at et begrep (eller kombinasjon av begreper) kan ha flere betydninger eller nyanser av betydning. Ved å velge et begrep kan du i vinduet se alle de tospråklige i samlingen, og i en rekke sammenhenger. Dette gjør det alltid lettere å velge den mest nøyaktige oversettelsen av et gitt begrep eller kombinasjon.

Natalya Shakhova, direktør for EnRus-byrået, mener at de fleste TM-produktene avlaster brukeren for behovet for å bli kjent med ulike tekstbehandlere. Det er nok å studere funksjonene til tekstredigereren til selve produktet, og du vil kunne kontrollere alle forskjellige tekster, enten de presenteres i QuarkXPress, FrameMaker eller Adobe Illustrator. Det er selvfølgelig en hake her: for å mestre det neste tekstbehandlings- eller publiseringssystemet, trenger du det riktige filterprogrammet, hvilket - hva? Det stemmer – det selges for noen penger! Generelt er pengespørsmålet det mest alvorlige når det gjelder TMT. De er ikke billige (vanligvis flere hundre dollar), og det er selvfølgelig ingen kompatibilitet. Derfor, hvis du kjøpte (og mestret!) et produkt for ett prosjekt, må du kanskje kjøpe et annet produkt for det neste og bruke tid på å lære det på nytt.

Natalia Shakhova bemerker videre at Vesten allerede aktivt diskuterer konsekvensene av den utbredte spredningen av slike programmer. En av dem er at en ny oversetter mister muligheten til å komme inn på markedet. Akkurat som i Russland er det allerede veldig vanskelig for en oversetter å få en bestilling hvis han ikke har en datamaskin og en skriver, så i utlandet er det problemer med ansettelse for oversettere som ikke har et TM-program. Dette fenomenet har også en positiv side - ved å ansette eieren av et TM-program får kunden en viss garanti for sin profesjonalitet. Men selv nybegynnere bør ha muligheten til å starte!

Holdningene til oversettelsesminneteknologi i vårt land er forskjellige.

Da oversettelsesbyrået Phonetics begynte å jobbe med Trados Translator’s Workbench i 1999, under kontaktene med kunder, snakket vi naturligvis om overgangen til den nye teknologien. Mot forventning var reaksjonen forsiktig og noen ganger direkte negativ. Det viste seg at ideen om maskinoversettelse allerede var kompromittert av den tankeløse bruken av programmer som Stylus og Socrat på 90-tallet. Dessuten ble de ofte brukt av oversettere, for eksempel ikke særlig kvalifiserte, som ikke brydde seg om å redigere det de "elektroniske oversetterne" produserte. Imidlertid kan brukerne av disse programmene også forstås - å redigere disse tekstene krevde mye tid og krefter.

Selv nå kan du noen ganger finne kunder fra russiske organisasjoner som viser en forsiktig holdning til alle innovasjoner innen oversettelsesprogramvare. Samtidig krever utenlandske selskaper tvert imot bruk av oversettelsesminne-klasseprogrammer. De har ofte etablerte preferanser, hovedsakelig Trados Translator's Workbench, samt Star Transit. De har ofte ferdige TM-er (oversettelsesbanker) som de tilbyr å bruke.

Når det gjelder oversettere, har de en forståelig interesse for teknologi for oversettelsesminne. Oversettelsesbyråer er enda mer forståelig nok interessert i dem. De omhandler ikke så mye skjønnlitteratur, journalistikk, poesi osv., men med bruksanvisninger, feilsøkingsveiledninger og programvarelokalisering, dvs. med de materialene der det er gjentatte eller lignende tekstfragmenter.

I sin nåværende form ser det ut til at Translation Memory-programmer har nådd et tak. Videre arbeid med foredlingen deres følger veien for å forbedre deres eksisterende funksjonalitet. Dette fører til at programmene blir mer og mer tungvinte og komplekse, og dette til tross for at det ikke er grunnleggende nye ideer der. Den samme Translator's Workbench (Trados) i sin siste versjon har fått et slikt sett med verktøy at det er svært vanskelig for en vanlig bruker å forstå dem.

Driften av dette programmet krever tilstedeværelse av en egen ansatt i staben til oversettelsesbyrået. I tillegg til brukermanualen inkluderer dokumentasjonen en TRADOS spesialistveiledning. I tillegg inkluderer dokumentasjonspakken en Project Management Guide, MultiTerm User Guide og WinAlign User Guide. Selv en utdannet oversetter vil kreve mye innsats og tid for å se gjennom hundrevis av sider med disse dokumentene.

En gruppe forskere ved University of Maryland, Baltimore County (USA), under ledelse av professor S. Nirenburg, en velkjent spesialist innen kunstig intelligens og maskinoversettelse, søker etter nye løsninger. Så langt er utviklingen på stadiet av teoretisk forskning, og mest sannsynlig vil det kreve betydelig tid å bringe denne forskningen til stadiet av et kommersielt produkt.

Det er bemerkelsesverdig at markedet for oversetterverktøy hovedsakelig er okkupert av utenlandske selskaper. Jeg vil gjerne håpe at dette ikke vil vare for alltid. Potensialet for teoretisk utvikling av russiske spesialister innen semantisk analyse er svært stort. Vår forskning på dette området har nådd et meget høyt nivå. Det er all grunn til å forvente at denne utviklingen vil materialiseres i form av fundamentalt nye språklige teknologier som fullt ut vil frigjøre det kreative potensialet til oversetteren.

Tidsskrift for en praktiserende oversetter"Bridges", et av få profesjonelle tidsskrifter for oversettere. Tidsskriftet publiserer artikler av oversettere av ulike spesialiteter, både muntlig og skriftlig. På sidene til magasinet har oversettere som spesialiserer seg på ulike kunnskapsfelt muligheten til å diskutere aktuelle saker, debattere med hverandre og dele hemmelighetene til sine faglige ferdigheter.




Topp