Закодированные PDF. Как скопировать закодированный текст.

Декабрь, 22nd 2013Рубрика: Советы 91417
Подписаться на комментарии по RSS

Про защиту pdf файлов от печати и копирования думаю слышали многие. Наверняка кому-то довелось и убирать такую защиту, всё это довольно просто снимается, при желании. Однако, сегодня речь пойдет немного о другом, более редком виде защиты pdf документов, в которых на первый взгляд нет никакой видимой защиты и всё разрешено. Текст скопировать можно... вот только вместо текста копируются непонятные символы.

Вы можете спокойно читать и распечатывать файл – перед вами нормальный текст, а при копировании получаем набор левых символов.

Для чего это нужно? Скажем, PDF лежит в открытом доступе на сайте и необходимо запретить копирование текста или избежать индексирования содержимого pdf документа поисковиками.

Что же делать, если вам попался такой PDF-файл, а перспектива набора 10-20 страниц вручную не добавляет радости в жизнь. Искать другой источник или распечатать и потом распознать? Можно поступить проще.

Возможно для кого-то станет откровением, но ABBYY FineReader распознает pdf-файлы как обычные графические! Открываем в FineReader закодированную pdf, указываем язык распознавания и сохраняем результат в нужном формате (мне было просто необходимо в html). Вот и весь секрет. Если кто-то знает иной, более простой или правильный способ, не поленитесь, напишите о нем в комментариях.

Подписывайтесь на канал Яндекс.Дзен и узнавайте первыми о новых материалах, опубликованных на сайте.

Если считаете статью полезной,
не ленитесь ставить лайки и делиться с друзьями.

Комментариев: 13

  1. 2013-12-23 в 11:11:45 | AlexKan

    Не думаю, что это защита pdf файла.

    Скорее, это отсутствие нужного шрифта в системе.

    Я как-то с таким сталкивался, однако, найти нужный шрифт так и не удалось. Честно говоря не помню, как именно вышел из ситуации. Может, и через распознавание в FR.

  2. 2013-12-23 в 19:09:39 | dre@mer]]>avatar]]>

    Возможно вы правы. Где-то встречал упоминание программы Infix Pro, позволяющей создавать PDF с неправильной кодировкой. Надо будет опробовать в свободное время, потому как ответа на вопрос в сети не нашел.

    Даже если это просто такой побочный эффект неверной кодировки или шрифта, то как защита он крайне эффективен.

  3. 2014-08-01 в 23:27:41 | Алексей

    На днях распознавал белорусский язык с такого документа, затем как вебстраницу загнал в Хром и перевёл

    В итоге основная масса текста на русском, но есть над чем посмеяться после перевода

  4. 2015-05-26 в 15:30:11 | Set

    http://www.pdfdecrypter.com/ поможет

  5. 2015-06-17 в 08:50:59 | Виктор

    А не проще ли отправить в печать на виртуальный принтер для сохранения в новый PDF файл, чтобы потом спокойно скопировать данные?

  6. 2016-06-08 в 11:04:10 | Иван Мещеряков

    Спасибо! сколько искал программу, которая сможет помочь скопировать текст без иероглифов всяких, и наконец то нашел, ваш совет помог! ABBYY FineReader распознала без проблем))

  7. 2017-08-26 в 17:04:49 | Серега

    Способ рабочий, хорошо, что нашел эту статью, помогла, очень благодарен автору

  8. 2017-12-10 в 04:09:51 | Павел

    Текст можно копировать открыв pdf-документ в программе STDU Viewer

  9. 2018-06-21 в 00:51:40 | Павел

    Спасибо, целый вечер промучался, а при помощи Вашего варианта все получилось!

  10. 2019-02-19 в 10:34:55 | Бонд, Джеймс Бонд

    pdf decrypter вскрывает запароленный pdf, обычный он игнорирует (проверено на версии 4.2.0). STDU лично мне тж не помог. Так что да, пока только распознавание (((

  11. 2019-11-04 в 12:54:35 | Аноним

    Спасибо!

  12. 2021-08-09 в 17:17:54 | mAsh

    Adobe Acrobat XI Standard

    Файл/сохранить как/ html

    и ву-а-ля

  13. 2023-11-05 в 21:00:02 | Аноним

    https://www.onlineocr.net/ru/

ваш комментарий будет опубликован после проверки
на указанный адрес будет отправлено письмо с кодом активации. Вы можете настроить собственный профиль и стать активным участником или автором.