CRM-система для УК и ТСЖ

pdf/a формат

Будете спамить рекламой - будем нещадно банить)))
Сообщение
Автор
Sergey_P
Ветеран
Сообщений: 4459
Возраст: 34
Зарегистрирован: 11 ноя 2015, 16:53
Откуда: Костромская губерния
Благодарил (а): 359 раза
Поблагодарили: 2410 раза

pdf/a формат

#31 Сообщение Sergey_P » 09 дек 2016, 17:35

Lexus755 писал(а):Источник цитаты Использовать программы по распознаванию рукописного текста. Правда пока программы распознают лишь "рукопечатный" текст... т.е. символы должны быть раздельные.

а такие есть, можно название. вдруг пригодиться

Аватар пользователя
Lexus755
Активист
Сообщений: 277
Возраст: 48
Зарегистрирован: 23 окт 2016, 20:52
Откуда: г.Жуковский
Благодарил (а): 59 раза
Поблагодарили: 216 раза

pdf/a формат

#32 Сообщение Lexus755 » 09 дек 2016, 18:12

Sergey_P писал(а):Источник цитаты а такие есть, можно название. вдруг пригодиться

finereader - http://kb.abbyy.ru/article/1099

Sergey_P
Ветеран
Сообщений: 4459
Возраст: 34
Зарегистрирован: 11 ноя 2015, 16:53
Откуда: Костромская губерния
Благодарил (а): 359 раза
Поблагодарили: 2410 раза

pdf/a формат

#33 Сообщение Sergey_P » 09 дек 2016, 18:13

надо будет попробовать. как раз купил его.

virus_mvs
Бывалый
Сообщений: 325
Зарегистрирован: 21 май 2015, 12:42
Откуда: Пермский край
Благодарил (а): 101 раза
Поблагодарили: 110 раза

pdf/a формат

#34 Сообщение virus_mvs » 19 апр 2017, 21:29

Решил заняться я переоснасткой всех договоров и прочей бумажной ереси из ПДФ в ПДФ/А. Вылезла проблемка в виде увеличения объёма файла в 2! раза. Что я делаю не так?
итак исходные данные: был распечатанный документ, я его изначально отсканировал как картинку. Сейчас я эту картинку загружаю в FineReader, он его распознаёт. Далее сохраняю документ как PDF/A, указываю следущие параметры:
режим сохранения - текст под изображением
разрешение - чтение с экрана (150 дпи)
качество - потеря качества разрешена.

Говоря конкретнее. ФАйл ПДФ на 20 страниц в виде картинок занимал 6 Мбайт. После моих манипуляций - 12 Мбайт.
Может какие то действия делаю лишние?

two_oceans
Бывалый
Сообщений: 432
Зарегистрирован: 30 сен 2016, 17:17
Благодарил (а): 383 раза
Поблагодарили: 351 раза

pdf/a формат

#35 Сообщение two_oceans » 20 апр 2017, 05:51

Странно, pdf достаточно "плотный" формат и потеря качества по JPEG наоборот уменьшает размер файла с каждым пересохранением. Проверил у себя: был файл 3,87 Мб (на 3 страницы, примерно 1,29 Мб на страницу), при открытии файн ридер 11 ругнулся, что разрешение слишком мало и будет растянут. Потом поставил пользовательское качество: 150 дпи, потеря качества разрешена, 45%. Итого, размер 2,73 Мб, то есть стал меньше на 30% несмотря на добавление текстового слоя. Это при преобразовании pdf -> pdf/a. Второй пример: было 316 Кб (1 стр) стало 236 Кб, на 25% меньше. Если исходный был не pdf, а картинка, то сравнивать сложно. Настройки на скринах.
Вложения
FR3.png
(10.81 KiB) Еще не загружено
FR2.png
FR1.png

virus_mvs
Бывалый
Сообщений: 325
Зарегистрирован: 21 май 2015, 12:42
Откуда: Пермский край
Благодарил (а): 101 раза
Поблагодарили: 110 раза

pdf/a формат

#36 Сообщение virus_mvs » 20 апр 2017, 06:13

two_oceans писал(а):Странно, pdf достаточно "плотный" формат и потеря качества по JPEG наоборот уменьшает размер файла с каждым пересохранением. Проверил у себя: был файл 3,87 Мб (на 3 страницы, примерно 1,29 Мб на страницу), при открытии файн ридер 11 ругнулся, что разрешение слишком мало и будет растянут. Потом поставил пользовательское качество: 150 дпи, потеря качества разрешена, 45%. Итого, размер 2,73 Мб, то есть стал меньше на 30% несмотря на добавление текстового слоя. Это при преобразовании pdf -> pdf/a. Второй пример: было 316 Кб (1 стр) стало 236 Кб, на 25% меньше. Если исходный был не pdf, а картинка, то сравнивать сложно. Настройки на скринах.

может неправильно выразился. стандартными средствами виндовс я бумажный документ сканировал и сохранял в jpeg. по 19 страниц примерно. там и текст и ручные подписи и фамилии и штампы и т.д. Из этих 19 картинок собирал в ПДФ. А сейчас этот ПДФ файл загружаю, оно распознаётся и при сохранении в ПДФ/А расширяется в 2 раза..

Аватар пользователя
Шла_мимо
Ветеран
Сообщений: 1417
Зарегистрирован: 29 апр 2016, 11:21
Откуда: Южный Урал
Благодарил (а): 994 раза
Поблагодарили: 905 раза

pdf/a формат

#37 Сообщение Шла_мимо » 20 апр 2017, 06:18

Формат pdf/a изначально и оговарилвался, как более емкий, хотя и является подмножеством формата pdf. Но первый отличается тем, что в электронную структуру фала внедрена информация, необходимая для его отображнеия. В частности все шрифты, используемые для его создания. Поэтому файл и "толстеет" при сохранении его в А.

virus_mvs
Бывалый
Сообщений: 325
Зарегистрирован: 21 май 2015, 12:42
Откуда: Пермский край
Благодарил (а): 101 раза
Поблагодарили: 110 раза

pdf/a формат

#38 Сообщение virus_mvs » 20 апр 2017, 06:46

В пользовательских настройках сохранения поменял 150 DPI на 96 DPI. размер исходного файла увеличился всего на 40 Кбайт. Визуально остался таким же как их при увеличении объема в 2 раза
Вложения
на форум мое.jpg

two_oceans
Бывалый
Сообщений: 432
Зарегистрирован: 30 сен 2016, 17:17
Благодарил (а): 383 раза
Поблагодарили: 351 раза

pdf/a формат

#39 Сообщение two_oceans » 20 апр 2017, 07:06

virus_mvs писал(а):Источник цитаты А сейчас этот ПДФ файл загружаю, оно распознаётся и при сохранении в ПДФ/А расширяется в 2 раза.
Так понятнее. А то я уж перепугался, что JPEG внезапно стал многостраничным.
Шла_мимо писал(а):Источник цитаты Формат pdf/a изначально и оговарилвался, как более емкий, хотя и является подмножеством формата pdf. Но первый отличается тем, что в электронную структуру фала внедрена информация, необходимая для его отображнеия. В частности все шрифты, используемые для его создания. Поэтому файл и "толстеет" при сохранении его в А.
Такой вариант конечно возможен, но уж слишком большое превышение. Сильно сомневаюсь, что в договорах используется нестандартный шрифт. У меня, наоборот, размер снижается. Для гарантии, возможно, стоит ограничить набор распознаваемых символов до русско-английский (английский для римских цифр и подобного), чтобы не прицепился какой-нибудь Wingdings.

Раньше я сталкивался с передачей газеты в типографию в файлах pdf. Так вот, сам формат pdf (и ps (PostScript), который создается перед pdf) не требует обязательного внедрения шрифтов - если уверены, что у получателя есть все шрифты, их можно выкинуть. Но если по факту шрифта не найдется (в принтере, например), он будет отбражен по таблице замен шрифтов, что почти всегда коряво. Поэтому типографии специально указывают включить все шрифты, установить определенное разрешение, поделить страницу на цветовые составляющие. Размер pdf выходит в 150-600 Мб.

Все эти требования можно выполнить, только если использовать промежуточный формат PostScript и специально настроить преобразование в PDF под конкретную модель печатной машины. У нас же случай попроще - FineReader, как и прочие надстройки для офисных пакетов, виртуальные принтеры печатающие в pdf файл - не реализует 100% поддержки всех возможностей формата PDF. Сильно сомневаюсь (хотя нужно проверить, но придется разбираться в кодировке формата pdf/a), что шрифты вообще внедряются при обработке FineReader ом.
Я больше склонен думать, что в исходном pdf разрешение было 96 dpi и повышение до 150 дало увеличение размера в 2 раза. Чтобы прояснить это, нужно знать как именно собирали из картинок pdf (с каким разрешением?). Хотя по логике FineReader должен это понимать (на моем скрине настроек (FR3) видно предупреждение, что разрешение можно только уменьшить).

Отправлено спустя 3 минуты 29 секунды:
virus_mvs писал(а):Источник цитаты В пользовательских настройках сохранения поменял 150 DPI на 96 DPI. размер исходного файла увеличился всего на 40 Кбайт. Визуально остался таким же как их при увеличении объема в 2 раза
Значит моя догадка на правильном пути. С первого взгляда он и не будет отличаться - это те же данные, но растянутые. Но если сильно приглядеться новый файл с 96 dpi будет отличаться как от исходного, так и от нового с 150 dpi, весь смысл JPEG именно в том чтобы эти отличия были как можно меньше заметны.
Для размещения придется смотреть в требования и ставить нужное разрешение, даже если размер вырастет. Ну а для себя и 96 dpi подойдет.
Последний раз редактировалось two_oceans 20 апр 2017, 07:20, всего редактировалось 1 раз.

virus_mvs
Бывалый
Сообщений: 325
Зарегистрирован: 21 май 2015, 12:42
Откуда: Пермский край
Благодарил (а): 101 раза
Поблагодарили: 110 раза

pdf/a формат

#40 Сообщение virus_mvs » 20 апр 2017, 07:19

two_oceans писал(а):Значит моя догадка на правильном пути. Тут уже придется смотреть в требования для размещения и ставить нужное разрешение, даже если размер вырастет. Ну а для себя и 96 dpi подойдет.

Похоже на то.
сканировал текстовый документ изначально с такими параметрами.

Нашел таблицу на сайте адобэ. что при 150ДПИ изображения разрешение принтера получалось больше. Выходит что я при пересохранении увеличивал размер повышая исходное :shock: разрешения изображения.(ну или что-то типо того).
Поиск и копирование работает. визуально в глаза различия не бросаются. буду оставлять 96dpi.
Вложения
фот2.jpg
фот1.jpg


Вернуться в «ГИС ЖКХ. Форум разработчиков программного обеспечения и всего, что с ним связано»

Кто сейчас на форуме

Количество пользователей, которые сейчас просматривают этот форум: нет зарегистрированных пользователей и 1 гость