Закодированные PDF. Как скопировать закодированный текст.

Декабрь, 22nd 2013
Рубрика: Tips and Tricks
Подписаться на комментарии по RSS

Про защиту pdf файлов от печати и копирования думаю слышали многие. Наверняка кому-то довелось и убирать такую защиту, всё это довольно просто снимается, при желании. Однако, сегодня речь пойдет немного о другом, более редком виде защиты pdf документов, в которых на первый взгляд нет никакой видимой защиты и всё разрешено. Текст скопировать можно... вот только вместо текста копируются непонятные символы.

Вы можете спокойно читать и распечатывать файл – перед вами нормальный текст, а при копировании получаем набор левых символов.

Для чего это нужно? Скажем, PDF лежит в открытом доступе на сайте и необходимо запретить копирование текста или избежать индексирования содержимого pdf документа поисковиками.

Что же делать, если вам попался такой PDF-файл, а перспектива набора 10-20 страниц вручную не добавляет радости в жизнь. Искать другой источник или распечатать и потом распознать? Можно поступить проще.

Возможно для кого-то станет откровением, но ABBYY FineReader распознает pdf-файлы как обычные графические! Открываем в FineReader закодированную pdf, указываем язык распознавания и сохраняем результат в нужном формате (мне было просто необходимо в html). Вот и весь секрет. Если кто-то знает иной, более простой или правильный способ, не поленитесь, напишите о нем в комментариях.

Если вы считаете статью полезной,
не ленитесь ставить лайки и делиться с друзьями.

Комментариев: 5

  1. 2013-12-23 в 11:11:45 | AlexKan

    Не думаю, что это защита pdf файла.

    Скорее, это отсутствие нужного шрифта в системе.

    Я как-то с таким сталкивался, однако, найти нужный шрифт так и не удалось. Честно говоря не помню, как именно вышел из ситуации. Может, и через распознавание в FR.

  2. 2013-12-23 в 19:09:39 | dre@mer]]>avatar]]>

    Возможно вы правы. Где-то встречал упоминание программы Infix Pro, позволяющей создавать PDF с неправильной кодировкой. Надо будет опробовать в свободное время, потому как ответа на вопрос в сети не нашел.

    Даже если это просто такой побочный эффект неверной кодировки или шрифта, то как защита он крайне эффективен.

  3. 2014-08-01 в 23:27:41 | Алексей

    На днях распознавал белорусский язык с такого документа, затем как вебстраницу загнал в Хром и перевёл

    В итоге основная масса текста на русском, но есть над чем посмеяться после перевода

  4. 2015-05-26 в 15:30:11 | Set

    http://www.pdfdecrypter.com/ поможет

  5. 2017-08-26 в 17:04:49 | Серега

    Способ рабочий, хорошо, что нашел эту статью, помогла, очень благодарен автору

comments powered by HyperComments
Без регистрации
ваш комментарий будет опубликован после проверки
Регистрация на сайте

На указанный адрес будет отправлено письмо с кодом активации. Вы можете настроить собственный профиль и стать активным участником или автором.