Коли машинний переклад замінить людський переклад?

Блог

У науково-фантастичному циклі Дугласа Адамса «Автостопом по галактиці» пристрій-істота Вавилонська рибка, перебуваючи у вусі власника, передає звернене до нього інопланетне мовлення його рідною мовою. Сьогодні цей артефакт не такий вже неправдоподібний.

Машинний переклад істотно зменшив мовні бар’єри: ґаджети дозволяють вловити суть новини, твіту, приблизно зрозуміти рецепт або опис товару. Можна навіть говорити з іноземцями в реальному часі. Нарешті, минулого року досить пристойну якість перекладу запропонував вбудований функціонал Google Docs. Чи настав уже час поставити машинний переклад в один ряд з виконаним людиною?

Машинний переклад (МП) застосовує чотири підходи: на основі правил, статистичний, нейронний, та гібридний (поєднує переваги перших двох). Системи на основі правил (напр. Linguatec, Promt, Systrans) аналізують дані одномовних, двомовних чи багатомовних словників та граматики вихідної й цільової мови. Вони враховують семантичні, морфологічні та синтаксичні закономірності мов, тому генерують переклад високої якості, але вельми повільно.

Статистичний програмний МП ґрунтується на порівнянні великих обсягів мовних пар ‒ текстів із реченнями однією мовою і їхніми відповідниками іншою, заздалегідь перекладених людьми. Він керується великими масивами даних (Big Data) та статистичними ймовірностями, тобто, на основі граматичних та орфографічних правил, поширених прикладів вживання слів і висловів, вираховує вірогідність збігів.

У квітні 2006 року розпочала роботу служба статистичного МП Google Translate, яка збирала мовні дані з документів ООН, Європейського економічного співтовариства, Європарламенту, та мала функціонал «самонавчання». Якість перших (дослівних) перекладів цього безкоштовного сервісу була значно нижчою, ніж у комерційних. Але невдовзі розробники впровадили нейронний підхід. Він прагне до відтворення роботи людського мозку засобами технології «глибокого навчання». Такий переклад покликаний врахувати контекст фрази та ідіоми, адаптуючи значення речення до цільової мови. Слідом за Google, у 2017 році SDL, KantanMT та інші виробники перекладацького ПЗ також стали застосовувати цей підхід. Важливу роль у подоланні неоднозначностей відіграють онтологічні бази даних, такі як WordNet.

Стрімке примноження обсягів контенту ‒ рушій зростання попиту на переклад. Більшість текстів, однак, ніколи не буде перекладена навіть на одну мову. Величезний обсяг сповненого повторень контенту, що безперервно змінюється, не охопити всім перекладачам світу, адже жива людина перекладає близько двох тисяч слів на день. Саме тому, наприклад, Amazon використовує машинний переклад. Сучасні засоби МП можна налаштувати за галуззю, таким чином, обмежуючи сферу можливих замін, отримаємо кращий переклад.

Там, де використовуються формалізми і шаблони (юридичні, урядові документи), ці інструменти забезпечують більш якісний результат, ніж для «живих» текстів. Для особистого повсякденного спілкування Google Translate дозволяє побіжно зрозуміти більше ста мов, серед них сім ‒ за фото, тридцять дві ‒ за голосом, і двадцять сім ‒ за відео в режимі реального часу!

Засоби МП безперечно стануть в нагоді мандрівникові, аби зрозуміти місцеві меню, вивіски та розклад, онлайн-покупцеві на зарубіжних сайтах.

Однак для компаній приблизного розуміння вже замало. Наслідки неякісного перекладу завдають шкоди репутації бренду і прибуткам.

Дослідження Shotfarm 2016 року показало, що сорок відсотків інтернет-покупців полишають «Кошик» через поганий опис товару, а сорок два відсотки повернули отримані товари через невідповідність їх опису дійсності.

Якісний переклад охоплює три ключові елементи: зміст, контекст, і стиль абзацу. Не варто перекладати машинним способом медичні та фармацевтичні документи, літературні твори з тонкими нюансами, звіти, договори, адже Google та Microsoft збирають всі дані саме задля покращення засобів МП. Отже, втрати компаній від неякісного перекладу, хоча подекуди приховані, цілком реальні.

Машина не здатна зрозуміти культуру: розпізнати характерні сленг, ідіоми, та добрати до них відповідники може лише живий носій мови. У певній культурі певні слова означають щось одне, а в іншій вони мають зовсім інше значення. А скільки існує слів з кількома значеннями! Визначити, яке з них відтворює справжній зміст, може лише людина, прив’язавши їх до контексту. Саме тому машинні переклади містять так багато неточностей, а подекуди – втрачають логічний сенс. Ані стиль, ані тональність, машина не здатна передати. Наприклад, аргументативне есе, перекладене автоматично, втратить ефективність, адже не апелюватиме до читача. Те саме стосується і почуття гумору.

Переклад, виконаний людиною, вочевидь дорожчий і довший, але його якість нескінченно переважає.

Насправді, штучний інтелект не несе загрози професії перекладача. Про це свідчить і минулорічне дослідження, опубліковане Університетом Цюріха. Машинний переклад оцінюється за двома показниками: відповідністю та вільністю (fluency). Відповідність зазвичай визначає людина-перекладач, якій доручено прочитати текст і машинний переклад, і визначити, наскільки добре останній передає зміст оригіналу. Вільність перевіряється одномовними читачами, яким пропонують оцінити, наскільки добре перекладений текст виражений їхньою рідною мовою. Справа в тому, що попередні оцінювання здійснювались на рівні окремих речень. Швейцарські ж дослідники застосували протокол, що оцінює ці показники на рівні документу. Вони виявили, що з цього кута зору автоматичний перекладач лишається далеко позаду. Цей результат вчергове наголошує на значенні контексту, способу, в який ми сприймаємо документ як єдине ціле, враховуючи омоніми і зв’язність тексту.

Як підсумок, машинний та людський переклад є взаємодоповнюваними. Перший істотно скорочує часові витрати на підготовку чернеток перекладів. Але без людського втручання чернетки ніколи не будуть завершеними.

Фахові перекладачі вичитують текст на граматичні та орфографічні помилки, переробляють та переформульовують його, поліпшуючи стиль і локалізуючи відповідно до контексту й споживачів у цільових країнах – роблять його зрозумілим.

Збільшуються конверсії, зростає лояльність клієнтів, покращується «природня» пошукова оптимізація для різних маркетплейсів і пошуковиків. Найгеніальніші розробники систем автоматичного перекладу визнають, що складність тої чи іншої мови доступна лише людському мозку. Таким чином, технології штучного інтелекту приходять на службу перекладачам, а не витісняють цю професію у минуле.

Кожевнікова Олена,
перекладач англійської мови

Замовляйте онлайн!
Отримайте миттєву знижку 5%
Замовте для отримання знижки
Замовити дзвінок
Наші Контакти
  • Пн. - Пт.:
    09:00 — 18:00
  • Сб. - Нд.:
    Вихідний