Zarządzanie terminologią

Ulepsz wiedzę specjalistyczną swojej firmy dzięki innowacyjnej ekstrakcji terminologii przy użyciu procesów wspieranych przez sztuczną inteligencję.

Zarządzanie terminologią w procesach tłumaczeniowych

Terminy techniczne muszą być tłumaczone jednolicie we wszystkich językach obcych. Tłumacze mogą zazwyczaj przetłumaczyć terminy specyficzne dla firmy na dany język obcy tylko we współpracy z klientem. Aktywne zarządzanie terminologią dla produktów, terminów technicznych i innowacji jest zatem ważną częścią procesu tłumaczenia.

Wykorzystując wysoce rozwinięte Systemy Translation-Memory oraz istniejące terminologiczne bazy danych tworzone we współpracy z klientem, KERN Polska może gwarantować zoptymalizowany proces tłumaczenia, maksymalną spójność stosowanej terminologii i lepsze zapewnienie jakości.

Czym jest zarządzanie terminologią?

Zarządzanie terminologią jest ważnym procesem w branży językowej, który ma na celu systematyczne zarządzanie specjalistyczną terminologią w firmie lub projekcie. Obejmuje otworzenie, utrzymywanie i organizowanie terminologicznych baz danych w celu zapewnienia spójnego stosowania określonych terminów i wyrażeń we wszystkich materiałach komunikacji językowej.

Głównym celem zarządzania terminologią jest umożliwienie jasnej i spójnej komunikacji, zarówno wewnętrznej, jak i zewnętrznej. Dzięki tworzeniu wiarygodnej bazy terminologicznej wszyscy pracownicy, tłumacze i redaktorzy mają dostęp do ujednoliconych terminów i definicji. Minimalizuje to ryzyko nieporozumień i zapewnia spójne przekazywanie zamierzonego znaczenia we wszystkich językach.

Zarządzanie terminologią odgrywa kluczową rolę w procesie tłumaczenia. Dzięki dostępowi do predefiniowanych baz terminologicznych, tłumacze mogą korzystać z poprawnych terminów technicznych, co przekłada się na wyższą jakość i dokładność tłumaczeń. Sprawia to, że proces tłumaczenia jest bardziej wydajny, a tłumaczenia mają ustandaryzowaną terminologię.

Zarządzanie terminologią jest szczególnie ważne w branżach ze specyficznymi terminami technicznymi, takich jak sektor techniczny, medyczny lub prawny. Konsekwentne stosowanie prawidłowej terminologii w tych obszarach ma kluczowe znaczenie dla zapewnienia zrozumiałości i dokładności komunikacji.

Wie unterstützt die KERN AG Sie bei der Erstellung einer Terminologiedatenbank?

In Zusammenarbeit mit Ihnen erstellt die KERN AG Datenbanken, Glossare, Äquivalenztabellen und Terminologielisten, die dabei helfen, das Know-how Ihres Unternehmens zu fixieren. Ein firmenspezifisches Wörterbuch oder Glossar ist ein unentbehrliches und vielseitig verwendbares Hilfsmittel, welches den Sprachgebrauch des Unternehmens – von der Forschung bis zum Vertrieb – vereinheitlicht, die Konsistenz der Dokumentation und der Übersetzungen erhöht, externen Übersetzerinnen und Übersetzern eine wertvolle Hilfe ist und die Einarbeitung neuer Mitarbeiterinnen und Mitarbeitern beschleunigt.

Unter Einsatz von Softwaretools analysiert die KERN AG die bestehende Kundendokumentation, extrahiert die Fachbegriffe und erstellt Äquivalenztabellen.

Bei der Erstellung firmenspezifischer Wörterbücher richten sich die KERN-Terminologen nach dem Bedarf einzelner Benutzer und Abteilungen sowie den Vorgaben firmenspezifischer Software. Im Zuge weiterer Übersetzungen werden die Tabellen ergänzt und aktualisiert. Mit Hilfe von Datenverwaltungsprogrammen werden die Tabellen in mehreren Sprachen gepflegt.

Was umfasst der Datenbank-Service der KERN AG?

Der Datenbank-Service der KERN AG umfasst unter anderem:

  • Softwareunterstützte Terminologieextraktion

  • Aufbau kundenspezifischer Terminologiedatenbanken

  • Bereinigung und Pflege von Terminologiedatenbankbeständen 

Ihr Unternehmen kann nach Vereinbarung die bei der KERN AG vorhandenen Ressourcen jederzeit für die Erstellung terminologisch konsistenter Ausgangstexte nutzen, anstatt eigene Datenbankbestände aufzubauen, und somit die Übersetzungsgeschwindigkeit sowie die Qualität und Konsistenz der Übersetzungen verbessern.

Czym jest ekstrakcja terminologii?

Ekstrakcja terminologii jest niezbędnym krokiem w dziedzinie zarządzania terminologią i technologii językowej. Proces ten zajmuje się automatyczną identyfikacją oraz ekstrakcją określonych terminów technicznych i terminologii z dużych ilości tekstu lub zbiorów dokumentów. Celem ekstrakcji terminologii jest rozpoznanie i sklasyfikowanie odpowiednich terminów technicznych i przechowywanie ich w specjalnej bazie danych terminologii.

Wykorzystując metody statystyczne, uczenie maszynowe i przetwarzanie języka naturalnego (NLP), narzędzia do ekstrakcji terminologii mogą analizować złożone teksty i identyfikować najczęściej używane i specyficzne terminy. Wyodrębnione terminy są szczególnie interesujące dla branż o określonych specjalizacjach, takich jak medycyna, technologia lub prawo.

Specjalistyczne terminologie uzyskane w wyniku ekstrakcji terminologii służą jako podstawa do tworzenia terminologicznych baz danych, które są wykorzystywane w dalszych etapach zarządzania terminologią i procesach tłumaczeniowych. Precyzyjna i skuteczna ekstrakcja terminologii pomoże poprawić jakość i spójność komunikacji, zoptymalizować procesy tłumaczeniowe oraz zapewnić dokładność tekstów w specjalistycznych dziedzinach.

Korzyści z wykorzystania LLM do ekstrakcji  terminologii: LLM są szczególnie przydatne, ponieważ potrafią zrozumieć kontekst i rozpoznać relacje semantyczne. Są w stanie dokładniej identyfikować terminy i ich tłumaczenia oraz lepiej oceniać podobieństwa niż konwencjonalne podejścia oparte na regułach.

Co oferuje KERN Polska w dziedzinie ekstrakcji terminologii?

KERN Polska wspiera klientów przy ekstrakcji terminologii i utrwalaniu know-how firmy poprzez swoją fachową wiedzę, długoletnie doświadczenie w zakresie zarządzania terminologią oraz techniczne możliwości ekstrakcji. Wyodrębnianie związanych z firmą terminów technicznych i terminologii daje możliwość zapewnienia i zdefiniowania wewnętrznej spójności językowej.

Z pomocą narzędzi do ekstrakcji, ekstrakcja terminologii może być przeprowadzona przez tłumacza native speakera lub terminologa w złożonym procesie. Ekstrakcja następuje z reguły na podstawie tekstu wyjściowego i jego tłumaczenia, może jednak zostać wykonana również przed przystąpieniem do realizacji projektu tłumaczeniowego. Narzędzia do ekstrakcji generują listę kandydatów na terminologię, którzy są następnie wybierani przez osobistego kierownika projektu i uzgadniani z użytkownikiem.

Jak można opisać proces ekstrakcji terminologii?

Proces ekstrakcji i walidacji terminologii składa się z kilku etapów, które są przeprowadzane zarówno automatycznie, jak i ręcznie. Zagwarantuje to, że wyodrębnione terminy będą precyzyjne i zorientowane na stosowanie:

1. ekstrakcja terminów dwujęzycznych:

  • Wprowadzanie pliku dwujęzycznego (XLIFF, TMX, XLSX, CSV).
  • Analizowanie tekstów w języku źródłowym i docelowym przy użyciu LLM, który rozumie kontekst i rozpoznaje odpowiednie terminy.
  • Zastosowanie parametrów ekstrakcji (patrz niżej).
  • Wyjście tabeli strukturalnej lub termbazy.

2. ręczna walidacja przez terminologa:

  • Sprawdzanie terminów kandydatów.
  • Uzupełnienie lub dostosowanie terminów w celu ich doprecyzowania lub uszczegółowienia.
  • Kategoryzacja i tagowanie w ramach przygotowań do późniejszej integracji termbazy z innymi systemami i aplikacjami.
  • Tworzenie definicji i przykładów kontekstowych.

3. dostosowanie termbazy do konkretnych zastosowań, np:

  • Sformułowanie korporacyjne dla CMS.
  • Glosariusze dla Machine Translation Engines.
  • Terminologiczna baza danych dla systemu zarządzania tłumaczeniami (TMS) lub systemu edycji.
  • Słowa kluczowe dla optymalizacji pod kątem wyszukiwarek (SEO).

Na podstawie jakich parametrów przeprowadzana jest ekstrakcja terminu?

Ekstrakcja opiera się na następujących parametrach:

  • Source Language (język źródłowy): Język, z którego mają zostać wyodrębnione terminy.
  • Target Language (język docelowy): Język, na który tłumaczone są terminy.
  • Maksymalna długość terminu: maksymalna długość terminów, tj. ile słów może zawierać termin (np. termin z maksymalnie 3 słowami).
  • Podobieństwo: Wskazuje podobieństwo terminów między językiem źródłowym a docelowym. Opiera się na dopasowaniu procentowym. Im wyższa wartość, tym bardziej podobne są terminy w obu językach.

Jakie formaty wejściowe i wyjściowe są możliwe dla ekstrakcji terminów?

Formaty wejściowe: Ekstrakcja terminów obsługuje różne dwujęzyczne formaty plików do przetwarzania treści wielojęzycznych. Obejmują one oparty na XML format XLIFF, który został opracowany specjalnie dla procesów tłumaczeniowych, oraz TMX do wymiany pamięci tłumaczeniowych. Formaty tabelaryczne, takie jak XLSX i CSV, mogą być również używane do przetwarzania terminów i ich tłumaczeń.

Formaty wyjściowe: Wyodrębnione terminy mogą być eksportowane w różnych formatach: jako arkusz kalkulacyjny Excel (XLSX) lub plik CSV, który zawiera szczegółową listę wszystkich znalezionych terminów. Format TBX, który został opracowany specjalnie dla terminologicznych baz danych, jest dostępny do profesjonalnego zarządzania terminologią.

Jaką strukturę mają dane wyjściowe programu Excel?

Wynik ekstrakcji terminologii w programie Excel zapewnia przejrzystą strukturę, która umożliwia szczegółową analizę wyodrębnionych terminów. Ważne informacje na temat każdego terminu są zapisywane w kolumnach: Na przykład można znaleźć termin w języku źródłowym i docelowym, segment, z którego został wyodrębniony, a także jego tagi i ranking zgodnie z określonymi parametrami wyodrębniania. Wreszcie, ostatnia kolumna wskazuje częstotliwość występowania terminu i pomaga wyraźnie zidentyfikować odpowiednie terminy i skutecznie zintegrować je z istniejącą terminologią.

Innowacyjna ekstrakcja terminologii za pomocą procesów wspieranych przez sztuczną inteligencję

Ekstrakcja terminologii za pomocą Pythona i LLM zapewni zautomatyzowaną, kontekstową metodę skutecznej identyfikacji i tłumaczenia terminów wielojęzycznych. Proces można dostosowywać za pomocą elastycznych parametrów, takich jak "Podobieństwo" i "Maksymalna długość terminu". Łącząc to z wiedzą terminologiczną, tworzy się precyzyjna baza terminologiczna, której ręczne sprawdzanie zapewnia prawidłową terminologię. Ustrukturyzowane dane wyjściowe w formacie Excel lub TBX oraz dostosowanie do określonych wymagań (CMS, TMS, SEO) umożliwiają płynną integrację z istniejącymi przepływami pracy i różnymi systemami. Kern Polska gwarantuje najwyższą jakość tłumaczeń dzięki doświadczonym tłumaczom specjalistycznym i najnowocześniejszej technologii wspieranej przez sztuczną inteligencję.

Zapytanie &porada

Czy jesteś zainteresowany zarządzaniem terminologią? Skontaktuj się nami telefonicznie 0800 5376 5376, mailowo info@e-kern.com lub przez nasz Formularz kontaktowy.

Twoje zapytanie lub skontaktuj się z nami bezpośrednio

Pola oznaczone * są obowiązkowe.

Twoja wiadomość z formularza kontaktowego, w tym dane kontaktowe podane przez Ciebie, zostaną wykorzystane wyłącznie w celu przetworzenia wniosku i przechowywania w przypadku dalszych pytań. Nie udostępnimy tych informacji bez Twojej zgody. Aby uzyskać szczegółowe informacje na temat prywatności, zobacz: Polityka prywatności firmy KERN AG .

Chętnie pomożemy

Jesteśmy do Twojej dyspozycji od poniedziałku do piątku w godzinach od 8:00 do 19:00.

Tel.: 022 477 2715
E-mail: kern.warszawa@e-kern.com