Параллельный текст
-
Определение и примеры параллельных текстов
- Параллельный текст – текст на двух языках, расположенный рядом.
- Примеры: классические библиотеки, библии с переводами и оригиналами, Розеттский камень.
-
Типы параллельных корпусов
- Параллельные корпуса содержат переводы одного документа на разные языки.
- Зашумленные параллельные корпуса содержат двуязычные предложения с некачественным переводом.
- Сопоставимые корпуса основаны на двуязычных документах с согласованными темами.
- Квазисовместимые корпуса включают разнородные двуязычные документы без полного совпадения.
-
Методы извлечения параллельных данных
- Извлечение параллельных данных из больших массивов данных, таких как новостные статьи.
- Методы извлечения позволяют различать двуязычные и одноязычные элементы.
-
Битексты и их использование
- Битексты – объединенные версии текста на исходном и целевом языках.
- Битексты создаются с помощью инструментов выравнивания, которые сопоставляют предложения.
- Битексты сохраняют исходный порядок предложений и используются для работы с человеком-переводчиком.
-
Онлайн-битексты и память переводов
- Некоторые онлайн-битексты доступны в интернете, например, Linguée, Reverso, Tradooit.
- Онлайн-битексты могут быть названы онлайн-двуязычными согласованиями.
-
Примеры параллельных корпусов
- Список включает многоязычные параллельные корпуса для различных языков и областей.
- Упомянуты конкретные параллельные корпуса, такие как JRC-Acquis, материалы Европейского парламента, и другие.
-
Инструменты для выравнивания параллельных текстов
- Перечислены инструменты для выравнивания параллельных текстов, включая GIZA++, Uplug, и другие.