uk

Особливості підготовки файлів, що не редагуються

Що робити, якщо клієнту потрібно перекласти скановану інструкцію на багато сторінок із численними схемами або договір у форматі .pdf, текст у якому не редагується? Ми часто отримуємо в роботу подібні файли — це можуть бути документи у форматі .pdf, .jpeg, .png або .tiff, які фактично є зображеннями. З текстом у такому зображенні працювати не вийде.

Рішень може бути кілька, наприклад:

  • набрати весь текст оригіналу вручну, а потім уже завантажити його для роботи в CAT-інструмент;
  • спробувати «розшифрувати» документ за допомогою якоїсь онлайн-програми й працювати з отриманим результатом.

Ці варіанти мають очевидні недоліки: у першому випадку буде витрачено невиправдано багато часу (і нервів), а в другому можна отримати непридатний для CAT-інструмента матеріал, якщо, наприклад, програма розіб’є один блок тексту на кілька частин і розкидає їх по всьому документу або не розпізнає всі потрібні символи.

Як же чинимо ми? З 2019 року всі подібні документи проходять спеціальну попередню підготовку для перетворення на формат .docx, який підходить для CAT-інструментів. Ця підготовка охоплює професійне розпізнавання файлів OCR*-фахівцями й може бути двох видів залежно від переслідуваної мети:

  1. Підготовка файлу .docx, ідентичного оригіналу.
  2. Підготовка файлу для подальшої верстки.

Файл .docx, ідентичний оригіналу, ми готуємо в тому разі, якщо клієнтові потрібно віддати переклад у форматі .docx. Такий файл підходить для подальшого перекладу за допомогою будь-якого CAT-інструмента. У результаті ми отримаємо переклад (у тому-таки форматі .docx) з форматуванням оригіналу й усіма його структурними елементами: відступами, вирівнюванням, колонтитулами, виносками, нумерованими чи маркованими списками, типами шрифтів. OCR-фахівці обробляють зокрема й текст на зображеннях і поміщають його в текстові поля, розмір яких регулюється, — вони розтягуються відповідно до обсягу тексту.

Підготовка файлу для подальшої верстки потрібна, якщо клієнту потрібен кінцевий файл, зверстаний у форматі .pdf. У цьому разі документ .docx є проміжним: спочатку OCR-фахівець розпізнає файл оригіналу, потім файл перекладається в CAT-інструменті, а вже переклад верстається згідно з форматом оригіналу. Тому тут файл .docx містить тільки текст, витягнутий з оригіналу (клієнт після верстки отримує відформатований документ).

Отже, тип обробки файлу, що не редагується, залежить від типу замовлення й потреб замовника. Головне — професійний і продуманий підхід до справи та виконання кожної ділянки роботи відповідними фахівцями.

*OCR — оптичне розпізнавання символів за допомогою спеціального програмного забезпечення.

Автор статті:

Юрій Цвєркун

15 років у бізнесі професійних перекладів. Засновник і директор бюро перекладів «Профпереклад». Ключові компетенції: менеджмент, стратегічний маркетинг, лінгвістичні технології. Освіта: Києво-Могилянська бізнес-школа (KMBS) та IE Business School.

Дізнатись вартість
Заповніть форму та прикріпіть документ, і ми повідомимо точну вартість усієї роботи на email
Прикріпіть документ для оцінки вартості перекладу
Контакти
Ви також можете зв'язатися з нашим офісом у Києві у будь-який зручний спосіб, і ми відповімо на всі питання.
Україна, 03150,
м. Київ, вул. Ділова, 5Б, 6-й поверх
Понеділок – П'ятниця з 9:00 до 18:00