Закодированные PDF. Как скопировать закодированный текст.

Декабрь, 22nd 2013Рубрика: Tips and Tricks 24041
Подписаться на комментарии по RSS

Про защиту pdf файлов от печати и копирования думаю слышали многие. Наверняка кому-то довелось и убирать такую защиту, всё это довольно просто снимается, при желании. Однако, сегодня речь пойдет немного о другом, более редком виде защиты pdf документов, в которых на первый взгляд нет никакой видимой защиты и всё разрешено. Текст скопировать можно... вот только вместо текста копируются непонятные символы.

Вы можете спокойно читать и распечатывать файл – перед вами нормальный текст, а при копировании получаем набор левых символов.

Для чего это нужно? Скажем, PDF лежит в открытом доступе на сайте и необходимо запретить копирование текста или избежать индексирования содержимого pdf документа поисковиками.

Что же делать, если вам попался такой PDF-файл, а перспектива набора 10-20 страниц вручную не добавляет радости в жизнь. Искать другой источник или распечатать и потом распознать? Можно поступить проще.

Возможно для кого-то станет откровением, но ABBYY FineReader распознает pdf-файлы как обычные графические! Открываем в FineReader закодированную pdf, указываем язык распознавания и сохраняем результат в нужном формате (мне было просто необходимо в html). Вот и весь секрет. Если кто-то знает иной, более простой или правильный способ, не поленитесь, напишите о нем в комментариях.

Если считаете статью полезной,
не ленитесь ставить лайки и делиться с друзьями.

Комментариев: 8

  1. 2013-12-23 в 11:11:45 | AlexKan

    Не думаю, что это защита pdf файла.

    Скорее, это отсутствие нужного шрифта в системе.

    Я как-то с таким сталкивался, однако, найти нужный шрифт так и не удалось. Честно говоря не помню, как именно вышел из ситуации. Может, и через распознавание в FR.

  2. 2013-12-23 в 19:09:39 | dre@mer]]>avatar]]>

    Возможно вы правы. Где-то встречал упоминание программы Infix Pro, позволяющей создавать PDF с неправильной кодировкой. Надо будет опробовать в свободное время, потому как ответа на вопрос в сети не нашел.

    Даже если это просто такой побочный эффект неверной кодировки или шрифта, то как защита он крайне эффективен.

  3. 2014-08-01 в 23:27:41 | Алексей

    На днях распознавал белорусский язык с такого документа, затем как вебстраницу загнал в Хром и перевёл

    В итоге основная масса текста на русском, но есть над чем посмеяться после перевода

  4. 2015-05-26 в 15:30:11 | Set

    http://www.pdfdecrypter.com/ поможет

  5. 2015-06-17 в 08:50:59 | Виктор

    А не проще ли отправить в печать на виртуальный принтер для сохранения в новый PDF файл, чтобы потом спокойно скопировать данные?

  6. 2016-06-08 в 11:04:10 | Иван Мещеряков

    Спасибо! сколько искал программу, которая сможет помочь скопировать текст без иероглифов всяких, и наконец то нашел, ваш совет помог! ABBYY FineReader распознала без проблем))

  7. 2017-08-26 в 17:04:49 | Серега

    Способ рабочий, хорошо, что нашел эту статью, помогла, очень благодарен автору

  8. 2017-12-10 в 04:09:51 | Павел

    Текст можно копировать открыв pdf-документ в программе STDU Viewer

ваш комментарий будет опубликован после проверки
на указанный адрес будет отправлено письмо с кодом активации. Вы можете настроить собственный профиль и стать активным участником или автором.