ДОСЛІДЖЕННЯ ПРОБЛЕМ МАШИННОГО ПЕРЕКЛАДУ ЗАСОБАМИ БАГАТОМОВНИХ ПАРАЛЕЛЬНИХ КОРПУСІВ

Автор(и)

DOI:

https://doi.org/10.32782/2522-4077-2024-210-16

Ключові слова:

машинний переклад (МП), система машинного перекладу (СМП), багатомовний паралельний корпус, контекстний маркер

Анотація

Стаття присвячена виділенню та аналізу основних проблем, що виникають в результаті застосування машинного перекладу. Об'єктом дослідження стала система машинного перекладу eTranslation, що використовується на офіційному сайті Європейського Союзу. Головним інструментом проведеного дослідження є багатомовний паралельний корпус EU History, сформований нами з метою порівняння та аналізу текстів різними мовами. Він містить оригінальні статті про історію створення та розвиток Європейського Союзу англійською мовою та їхні переклади німецькою й українською мовами. Вказаний корпус дозволив виявити та проаналізувати помилки і неточності, допущені системою машинного перекладу eTranslation. У результаті дослідження було виділено кілька основних проблем машинного перекладу, серед яких неадекватне врахування полісемії та контекстних маркерів, оскільки система машинного перекладу часто не розпізнає багатозначність понять та не враховує контекст, в якому вони використовуються, що призводить до помилок у перекладі. Система машинного перекладу може також мати труднощі з перекладом складних граматичних конструкцій, абревіатур та власних назв, що робить переклад неточним або незрозумілим. У процесі дослідження було виявлено проблему відсутності універсальних способів транскрибування з латиниці на кирилицю, що унеможливлює адекватне відображення власних назв системою машинного перекладу. Згадана система не завжди дотримується правил узгодження в українській мові, що також негативно впливає на якість перекладу. Отримані результати свідчать про те, що машинний переклад на сучасному етапі ще не може повністю замінити людський переклад, особливо коли йдеться про складні тексти, що потребують глибокого розуміння контексту та знання тонкощів мови. Стаття розглядає також потенціал машинного перекладу в поєднанні з антропогенним перекладом для досягнення кращих результатів у міжмовній комунікації та доступі до інформації.

Посилання

Стахмич Ю. С. Адекватність та еквівалентність перекладу в контексті комп’ютерної лінгвістики. Вісник Житомирського державного університету імені Івана Франка. 2012. № 66. С. 235–238.

Веселовська Г., Радецька С. Машинний переклад: його типологiя, переваги та недолiки. Актуальнi питання гуманiтарних наук. 2021. Вип 35, том 7. С. 23–27.

Черноватий Л. Проблеми машинного перекладу та його застосування у навчанні майбутніх перекладачів. Наукові записки. Серія: Філологічні науки. 2022. №202. С. 84–93.

Галій Л. Г., Шачковська, Т. Ю. Типові помилки систем машинного перекладу. 2017. С. 1–8.

Okpor M. D. Machine translation approaches: issues and challenges. International Journal of Computer Science Issues (IJCSI). 2014. 159 p.

Hearne M., Way A. Statistical machine translation: a guide for linguists and translators. Language and Linguistics Compass. 2011. pp. 205–226.

Lifeng H., Jones G., Smeaton A. AlphaMWE: Construction of multilingual parallel corpora with MWE annotations. arXiv preprint arXiv. 2011.03783, 2020.

Baker M. Corpora in Translation Studies. An Overview and Suggestions for Future Research. 1995. pp. 223–243.

Choudhary N., Jha G. N. Creating multilingual parallel corpora in Indian languages. Human Language Technology Challenges for Computer Science and Linguistics: 5th Language and Technology Conference, LTC 2011, Poznań, Poland, November 25–27, 2011, Revised Selected Papers 5. Springer International Publishing, 2014.

Rosen A., Vavrín M. Building a multilingual parallel corpus for human users. Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12). 2012. 2447–2452 p.

Widdows D., Dorow B., Chan C-K. Using Parallel Corpora to enrich Multilingual Lexical Resources. In Proceedings of the Third International Conference on Language Resources and Evaluation (LREC’02). 2002. URL: http://www.lrec-conf.org/proceedings/lrec2002/pdf/103.pdf (дата звернення: 20.07.2024)

Website of the European Union. URL: https://european-union.europa.eu/principles-countries-history/history-eu_en (дата звернення: 20.07.2024)

##submission.downloads##

Опубліковано

2024-10-03

Як цитувати

Дужа-Задорожна, М., & Качур, Я. (2024). ДОСЛІДЖЕННЯ ПРОБЛЕМ МАШИННОГО ПЕРЕКЛАДУ ЗАСОБАМИ БАГАТОМОВНИХ ПАРАЛЕЛЬНИХ КОРПУСІВ. Наукові записки. Серія: Філологічні науки, (210), 108–115. https://doi.org/10.32782/2522-4077-2024-210-16