Закодированные PDF. Как скопировать закодированный текст.

Декабрь, 22nd 2013Рубрика: Советы 91908
Подписаться на комментарии по RSS

Про защиту pdf файлов от печати и копирования думаю слышали многие. Наверняка кому-то довелось и убирать такую защиту, всё это довольно просто снимается, при желании. Однако, сегодня речь пойдет немного о другом, более редком виде защиты pdf документов, в которых на первый взгляд нет никакой видимой защиты и всё разрешено. Текст скопировать можно... вот только вместо текста копируются непонятные символы.

Вы можете спокойно читать и распечатывать файл – перед вами нормальный текст, а при копировании получаем набор левых символов.

Для чего это нужно? Скажем, PDF лежит в открытом доступе на сайте и необходимо запретить копирование текста или избежать индексирования содержимого pdf документа поисковиками.

Что же делать, если вам попался такой PDF-файл, а перспектива набора 10-20 страниц вручную не добавляет радости в жизнь. Искать другой источник или распечатать и потом распознать? Можно поступить проще.

Возможно для кого-то станет откровением, но ABBYY FineReader распознает pdf-файлы как обычные графические! Открываем в FineReader закодированную pdf, указываем язык распознавания и сохраняем результат в нужном формате (мне было просто необходимо в html). Вот и весь секрет. Если кто-то знает иной, более простой или правильный способ, не поленитесь, напишите о нем в комментариях.

Подписывайтесь на канал

Яндекс.Дзен и узнавайте первыми о новых материалах, опубликованных на сайте.

Как правильно нанести термопасту на процессор?

Секрет пайки современной электроники в домашних условиях. Зачем нужен сплав «РОЗЕ»

Комментариев: 13

2013-12-23 в 11:11:45 | AlexKan
Не думаю, что это защита pdf файла.

Скорее, это отсутствие нужного шрифта в системе.

Я как-то с таким сталкивался, однако, найти нужный шрифт так и не удалось. Честно говоря не помню, как именно вышел из ситуации. Может, и через распознавание в FR.
2013-12-23 в 19:09:39 | dre@mer]]>]]>
Возможно вы правы. Где-то встречал упоминание программы Infix Pro, позволяющей создавать PDF с неправильной кодировкой. Надо будет опробовать в свободное время, потому как ответа на вопрос в сети не нашел.

Даже если это просто такой побочный эффект неверной кодировки или шрифта, то как защита он крайне эффективен.
2014-08-01 в 23:27:41 | Алексей
На днях распознавал белорусский язык с такого документа, затем как вебстраницу загнал в Хром и перевёл

В итоге основная масса текста на русском, но есть над чем посмеяться после перевода
2015-05-26 в 15:30:11 | Set
http://www.pdfdecrypter.com/ поможет
2015-06-17 в 08:50:59 | Виктор
А не проще ли отправить в печать на виртуальный принтер для сохранения в новый PDF файл, чтобы потом спокойно скопировать данные?
2016-06-08 в 11:04:10 | Иван Мещеряков
Спасибо! сколько искал программу, которая сможет помочь скопировать текст без иероглифов всяких, и наконец то нашел, ваш совет помог! ABBYY FineReader распознала без проблем))
2017-08-26 в 17:04:49 | Серега
Способ рабочий, хорошо, что нашел эту статью, помогла, очень благодарен автору
2017-12-10 в 04:09:51 | Павел
Текст можно копировать открыв pdf-документ в программе STDU Viewer
2018-06-21 в 00:51:40 | Павел
Спасибо, целый вечер промучался, а при помощи Вашего варианта все получилось!
2019-02-19 в 10:34:55 | Бонд, Джеймс Бонд
pdf decrypter вскрывает запароленный pdf, обычный он игнорирует (проверено на версии 4.2.0). STDU лично мне тж не помог. Так что да, пока только распознавание (((
2019-11-04 в 12:54:35 | Аноним
Спасибо!
2021-08-09 в 17:17:54 | mAsh
Adobe Acrobat XI Standard

Файл/сохранить как/ html

и ву-а-ля
2023-11-05 в 21:00:02 | Аноним
https://www.onlineocr.net/ru/