КОРПУСНІ ТА ШІ-ТЕХНОЛОГІЇ УПРАВЛІННЯ ТЕРМІНОЛОГІЄЮ В ЛОКАЛІЗАЦІЙНИХ ПРОЄКТАХ

Автор(и)

  • О. С. Бондаренко Центральноукраїнський державний університет імені Володимира Винниченка https://orcid.org/0000-0002-3148-8753
  • К. Л. Бондаренко Центральноукраїнський державний університет імені Володимира Винниченка https://orcid.org/0000-0002-2964-5123

DOI:

https://doi.org/10.32782/2522-4077-2025-212-9

Ключові слова:

управління термінологією, локалізаційний проєкт, корпусні технології, автоматизоване видобування термінів, термінна база

Анотація

Статтю присвячено особливостям управління термінологією в локалізаційних проєктах, зокрема, процесу видобування термінів із фахових текстів за допомогою корпусних технологій та технологій, що передбачають використання ШІ. Враховуючи складність і багатошаровість процесу локалізації, ефективність управління термінологією, починаючи з етапу її видобування, безпосередньо впливає на якість надання локалізаційної послуги. Розглянуто стратегії і тактики видобування термінів, які застосовуються на ринку лінгвістичних послуг. Уточнено термін «видобування термінів», з’ясовано принципи, які використовуються в сучасних інструментах. Проведено експериментальне дослідження видобування термінів інструментами SketchEngine, OpenAir (Plus) та Fodina TermCatch. Визначення ефективності видобування передбачало створення корпусу фахових текстів галузі автоматизованого програмного забезпечення загальним обсягом 29374 слів (36912 токенів). Результат видобування оцінювався за критеріями відповідності вимогам до термінів та терміносполук (стійкість, точність, нероздільність, дефінітивність). За допомогою інструмента SketchEngine було видобуто 400 пропозицій, з яких лише 25% можуть уважатися терміносполуками. Використання продукту OpenAir (Plus) на основі ШІ надало 81 пропозицію, з яких відповідними вимогам виявились 38%. Инструментом Fodina TermCatch tool було видобуто 1460 пропозицій, з яких лише 15.93% виявились відповідними. Виявлена варіативність видобутої термінології може бути корисною задля покращення якості вихідного фахового тексту. Результати статистичного видобування демонструють більшу точність, однак залишають поза увагою нечастотні терміни. Технології ШІ надають більшу кількість кандидатів у терміни, однак потребують фільтрування нерелевантних результатів. Дослідження доводить ефективність гібридного використання корпусних інструментів на основі статистичних принципів та тих, що використовують ШІ. Автоматизація процесу управління термніологією – важливий крок із оптимізації менеджменту локалізаційних проєктів.

Посилання

Schäler R. Translators and localization: Education and training in the context of the Global Initiative for Local Computing (GILC). The Interpreter and Translator Trainer. 2007. P. 119–135.

Warburton K. Managing terminology in commercial environments. Handbook of Terminology. 2015. № 1. P. 359–391.

Kageura K., Marshman E. Terminology extraction and management. The Routledge Handbook of Translation and Technology. Routledge, 2019. P. 61–77.

Popiolek M. Terminology management within a translation quality assurance process. Handbook of Terminology. 2015. № 1. P. 341–359.

Seljan S. Quality Assurance (QA) of Terminology in a Translation Quality Management System (QMS) in the business environment. European Parliament: Translation Services in the Digital World. 2018. P. 92–145.

Fulford H. Exploring terms and their linguistic environment in text: A domain-independent approach to automated term extraction. Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication. 2001. № 7(2). P. 259–279.

Борисова Н. В., Решетило С. С. Автоматизоване видобування термінологічних одиниць з науково-технічних текстів. Матеріали ІІІ Всеукраїнської науково-практичної конференції «Інтелектуальні системи та прикладна лінгвістика». Харків, 2014. С. 43–45.

Бармак В. Виявлення використань графової бази даних GraphDB за допомогою автоматичного добування термінів. Запоріжжя: ЗНУ, 2023. 50с.

Бондаренко К. Л., Булгакова К. В. Розвиток української IT-термінології в процесі локалізації (на прикладі поштових клієнтів Microsoft Office Outlook та Google Gmail). Наукові записки. Серія: Філологічні науки. 2024. Вип. 210. С. 58–65.

Бодюл Д. Структурні особливості термінів ІТ на прикладі вебпереглядачів Google Chrome і Microsoft Edge. Студентський науковий вісник. 2024. Вип. 31. Кропивницький : РВВ ЦДУ ім. В. Винниченка. С. 231–234.

Folaron D. Technology, technical translation and localization. The Routledge Handbook of Translation and Technology. 2019. P. 203–219.

Bowker L. Terminology management. The Bloomsbury Companion to Language Industry Studies. 2020. С. 261–284.

Туркевич О. Семантична структура терміносполук методики викладання української мови як іноземної. Вісник Нац. ун-ту «Львівська політехніка». Серія «Проблеми української термінології». 2011. № 709. С. 121–124.

Bilyk K. M., Makhachashvili R. K. The analysis of the corpus of texts «Covid-19» using the software «Sketch Engine». Scientific Trends in Basic and Applied Materials Research of the International Scientific and Practical Conference. October 30, 2020. Strasbourg : ΛΌГOΣ. 2020. Vol. 3. P. 59–65.

Бондаренко К. Л., Булгакова К. В. Варіативність термінології програмного забезпечення в контексті локалізації. Наукові записки. Серія: Філологічні науки. 2024. Вип. 211. С. 14–19.

Kovačević A., Konjović Z., Milosavljević B., Nenadic G. Mining methodologies from NLP publications: A case study in automatic terminology recognition. Computer Speech & Language. 2012. № 26(2). P. 105–126.

Arora C., Sabetzadeh M., Briand L., Zimmer F. Automated extraction and clustering of requirements glossary terms. IEEE Transactions on Software Engineering. 2016. № 43(10). С. 918–945.

Dagan I., Church K. Termight: Coordinating humans and machines in bilingual terminology acquisition. Machine Translation. 1997. № 12. С. 89–107.

Амеліна С. М., Тарасенко Р. О. Вивчення технологій створення електронних термінологічних баз у процесі професійної підготовки перекладачів. Інформаційні технології і засоби навчання. 2017. № 60(4). С. 105–115.

ISO 704:2009. Terminology work – Principles and methods. Geneva : ISO, 2009.

Russo M. ASK THE EXPERTS' 2 – Introduction to prompting. URL: https://www.youtube.com/watch?v=8bLVcmEX55I. (дата звернення: 29 січня 2025 р.)

Bhaskar B., Braşoveanu C., Rausch I. Contributing to better multilingual AI in Europe. URL: https://www.youtube.com/watch?v=yOjdEQntOhs&t=8s. (дата звернення: 29 січня 2025 р.)

Goldsmith J. AI-powered terminology extraction: A hands-on guide for translators. URL: https://www.youtube.com/watch?v=5Y5PhzyeMGI. (дата звернення: 29 січня 2025 р.)

Kaleidoscope. URL: https://kaleidoscope.at/en/products/fodina-termcatch.

##submission.downloads##

Опубліковано

2025-04-10

Як цитувати

Бондаренко, О. С., & Бондаренко, К. Л. (2025). КОРПУСНІ ТА ШІ-ТЕХНОЛОГІЇ УПРАВЛІННЯ ТЕРМІНОЛОГІЄЮ В ЛОКАЛІЗАЦІЙНИХ ПРОЄКТАХ. Наукові записки. Серія: Філологічні науки, (212), 63–69. https://doi.org/10.32782/2522-4077-2025-212-9