Закодированные PDF. Как скопировать закодированный текст.

Декабрь, 22nd 2013Рубрика: Советы 35450
Подписаться на комментарии по RSS

Про защиту pdf файлов от печати и копирования думаю слышали многие. Наверняка кому-то довелось и убирать такую защиту, всё это довольно просто снимается, при желании. Однако, сегодня речь пойдет немного о другом, более редком виде защиты pdf документов, в которых на первый взгляд нет никакой видимой защиты и всё разрешено. Текст скопировать можно... вот только вместо текста копируются непонятные символы.

Вы можете спокойно читать и распечатывать файл – перед вами нормальный текст, а при копировании получаем набор левых символов.

Для чего это нужно? Скажем, PDF лежит в открытом доступе на сайте и необходимо запретить копирование текста или избежать индексирования содержимого pdf документа поисковиками.

Что же делать, если вам попался такой PDF-файл, а перспектива набора 10-20 страниц вручную не добавляет радости в жизнь. Искать другой источник или распечатать и потом распознать? Можно поступить проще.

Возможно для кого-то станет откровением, но ABBYY FineReader распознает pdf-файлы как обычные графические! Открываем в FineReader закодированную pdf, указываем язык распознавания и сохраняем результат в нужном формате (мне было просто необходимо в html). Вот и весь секрет. Если кто-то знает иной, более простой или правильный способ, не поленитесь, напишите о нем в комментариях.

Подписывайтесь на канал Яндекс.Дзен и узнавайте первыми о новых материалах, опубликованных на сайте.

Если считаете статью полезной,
не ленитесь ставить лайки и делиться с друзьями.

Комментариев: 10

  1. 2013-12-23 в 11:11:45 | AlexKan

    Не думаю, что это защита pdf файла.

    Скорее, это отсутствие нужного шрифта в системе.

    Я как-то с таким сталкивался, однако, найти нужный шрифт так и не удалось. Честно говоря не помню, как именно вышел из ситуации. Может, и через распознавание в FR.

  2. 2013-12-23 в 19:09:39 | dre@mer]]>avatar]]>

    Возможно вы правы. Где-то встречал упоминание программы Infix Pro, позволяющей создавать PDF с неправильной кодировкой. Надо будет опробовать в свободное время, потому как ответа на вопрос в сети не нашел.

    Даже если это просто такой побочный эффект неверной кодировки или шрифта, то как защита он крайне эффективен.

  3. 2014-08-01 в 23:27:41 | Алексей

    На днях распознавал белорусский язык с такого документа, затем как вебстраницу загнал в Хром и перевёл

    В итоге основная масса текста на русском, но есть над чем посмеяться после перевода

  4. 2015-05-26 в 15:30:11 | Set

    http://www.pdfdecrypter.com/ поможет

  5. 2015-06-17 в 08:50:59 | Виктор

    А не проще ли отправить в печать на виртуальный принтер для сохранения в новый PDF файл, чтобы потом спокойно скопировать данные?

  6. 2016-06-08 в 11:04:10 | Иван Мещеряков

    Спасибо! сколько искал программу, которая сможет помочь скопировать текст без иероглифов всяких, и наконец то нашел, ваш совет помог! ABBYY FineReader распознала без проблем))

  7. 2017-08-26 в 17:04:49 | Серега

    Способ рабочий, хорошо, что нашел эту статью, помогла, очень благодарен автору

  8. 2017-12-10 в 04:09:51 | Павел

    Текст можно копировать открыв pdf-документ в программе STDU Viewer

  9. 2018-06-21 в 00:51:40 | Павел

    Спасибо, целый вечер промучался, а при помощи Вашего варианта все получилось!

  10. 2019-02-19 в 10:34:55 | Бонд, Джеймс Бонд

    pdf decrypter вскрывает запароленный pdf, обычный он игнорирует (проверено на версии 4.2.0). STDU лично мне тж не помог. Так что да, пока только распознавание (((

ваш комментарий будет опубликован после проверки
на указанный адрес будет отправлено письмо с кодом активации. Вы можете настроить собственный профиль и стать активным участником или автором.