Файл: Увеличением числа пользователей фондом архивных учреждений.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.12.2023
Просмотров: 230
Скачиваний: 4
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
, используемая в ГАНТСДСО.
При работе со сканером, операция присвоения имени файлу производится непосредственно в процессе сканирования специальной программой или вручную оператором после сканирования.
Таким образом, при оцифровании бумажных документов при помощи сканера, необходимо выполнить следующие операции:
Не допускается сканирование с лотка автоматической подачи документов:
Обработка оцифрованных документов необходима в силу следующих причин, мешающих зрительному восприятию изображения документа:
Использование графических редакторов позволяет устранить указанные недостатки, а также, в случае необходимости, провести коррекцию отсканированных изображений документов.
Получаемые оцифрованные документы представляют собой файлы больших размеров. В целях уменьшения объемов файлов изображений допустимо производить их сжатие при помощи компрессии. Это позволяет экономить площади, выделяемые для хранения носителей с электронными копиями документов.
Компрессия (сжатие) информации является частью технологии оцифрования документов, а также подготовки ЭК к хранению. Компрессия осуществляется посредством математического кодирования. Алгоритм компрессии заключается в преобразовании цифровой растровой структуры изображения в особый более компактный код, обеспечивающий уменьшение размера файла.
Метод компрессии может предусматривать сжатие без ухудшения или с ухудшением качества изображения.
Точность воспроизведения изображения оригинала имеет большое значение, особенно для архивных документов. В связи с этим рекомендуется использование технологии максимальной компрессии изображения без заметной потери качества.
Одним из широко распространенных графических стандартов, удовлетворяющих данным условиям, является стандарт JPEG (Joint Photographic Experts Group Standart - стандарт объединенной группы фотоэкспертов).
JPEG (JPG) - современный формат файлов изображений, создававшийся для хранения фотографий. Его метод компрессии предоставляет возможность устанавливать любую необходимую степень сжатия, позволяя достигать оптимального баланса между минимальным размером файла и приемлемым качеством изображения. Степень сжатия может достигать 10-ти и более раз.
Формат JPEG является эффективным средством хранения изображений с многочисленными едва уловимыми оттенками цвета.
Несмотря на то, что в JPEG используется алгоритм сжатия с частичной потерей цифровой растровой структуры и распакованное JPEG-изображение не абсолютно точно соответствует оригиналу, очень часто эти различия столь незначительны, что их едва можно обнаружить. Следует отметить, что речь идет не о потере смысловой информации документа, а всего лишь о небольшом, незаметном для человеческого глаза изменении его визуальных характеристик.
Одним из недостатков JPEG-компрессии является наличие кумулятивного эффекта. В процессе JPEG-сжатия происходит удаление некоторых кодовых данных. Когда же файл открывается в графическом редакторе и сохраняется вновь как JPEG-файл, то ещё раз теряется немного целостности изображения.
Поэтому важно не заменять исходный JPEG-файл новой версией после редактирования, а сохранять обработанный файл под другим именем или в другом каталоге. Если же JPEG-файл записан на компакт-диск, то он не будет меняться или ухудшаться, сколько бы раз его не открывали.
Из выше сказанного следует, что JPEG является форматом, полностью соответствующим технологическим требованиям по созданию и хранению электронных копий документов.
Другой широко известный, предложенный компанией Aldus, формат TIFF (Tag Image File Format) - наиболее распространенный формат хранения фотографий в издательском деле. Это достаточно гибкий формат, позволяющий сохранять фотографии в режимах цветности 256 color, RGB, CMYK, Grayscale, B&W. Имеется возможность сжатия файлов методом компрессии без потери качества изображения.
Формат растровых графических файлов TIFF создан для хранения графических изображений высокого разрешения, полученных с помощью сканера. Основное преимущество формата TIFF заключается в том, что он поддерживает большие изображения, файлы, содержащие несколько слоев изображений, и разнообразные методы сжатия. Но в отличие от JPEG-формата TIFF-файлы более объемны.
Формат TIFF тоже может быть использован в процессе создания ЭК документов.
Технология обработки оцифрованных документов не исключает появления различного рода ошибок. В связи с этим, необходимо сохранять отредактированные файлы в отдельном каталоге, а не заменять ими исходные файлы. Это позволит исправить выявленные ошибки, вновь проведя обработку соответствующих исходных файлов.
В зависимости от применяемого сканера, способа сканирования, на полученных изображениях могут присутствовать по отдельности лицевые и оборотные страницы листов или же развороты, где одновременно находятся оборотная сторона предыдущего листа и лицевая сторона последующего листа.
Выбор необходимого варианта комплектования электронных изображений определяется требованиями заказчика.
В Приложении 2.3. приведена система обозначений рабочих каталогов, используемая в ГАНТСДСО при создании ЭК архивных документов.
Таким образом, при обработке оцифрованных документов применяются следующие технологические операции:
Если все или большинство файлов при сканировании были сохранены с одинаково перевернутым или повернутым текстом, то возможно произвести автоматический поворот изображений данных файлов на необходимую величину (при наличии данной функции в графическом редакторе).
Примечание: В некоторых документах на одной и той же странице отдельные части текстов могут быть расположены разнонаправлено. В такой ситуации следует ориентироваться на основную часть текста, либо создать несколько файлов с одинаковыми, но по-разному повёрнутыми изображениями одной и той же страницы.
Примечание: На обрезанном изображении должны быть видны все кромки листа документа и переплёт дела (если документ подшит). Как правило, оставляемые поля должны быть минимальными. Однако, если текст или хоть какие-нибудь символы, сделанные печатным или рукописным способом, а также оттиски печатей, штампов и т. п. расположены очень близко к кромке листа, то для лучшей читаемости документа следует увеличить оставляемое поле с нужной стороны.
При работе со сканером, операция присвоения имени файлу производится непосредственно в процессе сканирования специальной программой или вручную оператором после сканирования.
Таким образом, при оцифровании бумажных документов при помощи сканера, необходимо выполнить следующие операции:
-
Создать отдельный каталог в компьютере на жестком диске, в который будут заноситься отсканированные изображения. -
Запустить программу сканирования изображений. -
Включить функцию потоковых операций (если требуется). -
Указать созданный ранее каталог, как место сохранения отсканированных изображений. -
Установить префикс выбранного названия или обозначения, которое будет присваиваться графическим файлам сканируемых изображений. -
Установить необходимые параметры яркости, контрастности, гаммы, режим цветности, разрешение и область сканирования. -
Установить формат получаемых при сканировании электронных копий документов. -
Выбрать источник сканирования (с лотка автоматической подачи листов или с планшета). -
При использовании поточного сканирования с лотка автоматической подачи пакета документов необходимо предварительно:
-
расшить документы; -
отделить листы друг от друга; -
убрать остатки ниток, скрепок, застывшего клея и др.; -
уложить листы на лоток и выровнять их по переднему краю в направлении подачи.
Не допускается сканирование с лотка автоматической подачи документов:
-
на тонких или ветхих носителях; -
имеющих рваные края, сильно мятую поверхность, высокую степень мягкости или твердости; -
документов, ранее подвергавшихся бумажной реставрации.
-
При использовании планшетного или книжного сканера – ровно положить сканируемый документ на планшет или платформу сканера. -
Начать процесс сканирования и сохранения отсканированных документов на жестком диске. -
В процессе полистного сканирования следует постоянно контролировать:
-
соответствие номера сканируемой страницы номеру получаемого файла; -
полностью ли раскрыт переплет; -
расправлены ли складки и кромки листа; -
равномерный прижим листа к стеклу сканера; -
своевременное изменение, по необходимости, параметров сканирования;
-
соответствие полученных изображений установленным критериям качества;
-
если лист документа просвечивает, то под него должна быть подложена белая матовая непросвечивающая подкладка; -
при наличии литерных листов необходимо вручную переименовывать их файлы.
-
Обработка оцифрованных документов для последующего хранения
Обработка оцифрованных документов необходима в силу следующих причин, мешающих зрительному восприятию изображения документа:
-
В процессе сканирования на получаемом изображении оказывается не только сам документ, но и области за пределами границ документа. Это также приводит к избыточному увеличению объёма файла ЭК. -
Документ при сканировании, как правило, расположен под некоторым углом, а не строго вертикально или горизонтально, что тоже увеличивает объём файла ЭК. -
Оригиналы документов могут содержать затухающие тексты, которые трудно читаемы на отсканированных изображениях. -
Неровности поверхности носителя оригинала могут исказить фон электронного изображения, создавая области затемнения. -
Тексты и графические объекты на некоторых оцифрованных документах получаются перевернутыми на 90 – 180 градусов. Это связано с особым расположением этих текстов и объектов на документе или невозможностью поместить сам документ в зоне сканирования с нужной ориентацией из-за технических особенностей устройств оцифровки.
Использование графических редакторов позволяет устранить указанные недостатки, а также, в случае необходимости, провести коррекцию отсканированных изображений документов.
Получаемые оцифрованные документы представляют собой файлы больших размеров. В целях уменьшения объемов файлов изображений допустимо производить их сжатие при помощи компрессии. Это позволяет экономить площади, выделяемые для хранения носителей с электронными копиями документов.
Компрессия (сжатие) информации является частью технологии оцифрования документов, а также подготовки ЭК к хранению. Компрессия осуществляется посредством математического кодирования. Алгоритм компрессии заключается в преобразовании цифровой растровой структуры изображения в особый более компактный код, обеспечивающий уменьшение размера файла.
Метод компрессии может предусматривать сжатие без ухудшения или с ухудшением качества изображения.
Точность воспроизведения изображения оригинала имеет большое значение, особенно для архивных документов. В связи с этим рекомендуется использование технологии максимальной компрессии изображения без заметной потери качества.
Одним из широко распространенных графических стандартов, удовлетворяющих данным условиям, является стандарт JPEG (Joint Photographic Experts Group Standart - стандарт объединенной группы фотоэкспертов).
JPEG (JPG) - современный формат файлов изображений, создававшийся для хранения фотографий. Его метод компрессии предоставляет возможность устанавливать любую необходимую степень сжатия, позволяя достигать оптимального баланса между минимальным размером файла и приемлемым качеством изображения. Степень сжатия может достигать 10-ти и более раз.
Формат JPEG является эффективным средством хранения изображений с многочисленными едва уловимыми оттенками цвета.
Несмотря на то, что в JPEG используется алгоритм сжатия с частичной потерей цифровой растровой структуры и распакованное JPEG-изображение не абсолютно точно соответствует оригиналу, очень часто эти различия столь незначительны, что их едва можно обнаружить. Следует отметить, что речь идет не о потере смысловой информации документа, а всего лишь о небольшом, незаметном для человеческого глаза изменении его визуальных характеристик.
Одним из недостатков JPEG-компрессии является наличие кумулятивного эффекта. В процессе JPEG-сжатия происходит удаление некоторых кодовых данных. Когда же файл открывается в графическом редакторе и сохраняется вновь как JPEG-файл, то ещё раз теряется немного целостности изображения.
Поэтому важно не заменять исходный JPEG-файл новой версией после редактирования, а сохранять обработанный файл под другим именем или в другом каталоге. Если же JPEG-файл записан на компакт-диск, то он не будет меняться или ухудшаться, сколько бы раз его не открывали.
Из выше сказанного следует, что JPEG является форматом, полностью соответствующим технологическим требованиям по созданию и хранению электронных копий документов.
Другой широко известный, предложенный компанией Aldus, формат TIFF (Tag Image File Format) - наиболее распространенный формат хранения фотографий в издательском деле. Это достаточно гибкий формат, позволяющий сохранять фотографии в режимах цветности 256 color, RGB, CMYK, Grayscale, B&W. Имеется возможность сжатия файлов методом компрессии без потери качества изображения.
Формат растровых графических файлов TIFF создан для хранения графических изображений высокого разрешения, полученных с помощью сканера. Основное преимущество формата TIFF заключается в том, что он поддерживает большие изображения, файлы, содержащие несколько слоев изображений, и разнообразные методы сжатия. Но в отличие от JPEG-формата TIFF-файлы более объемны.
Формат TIFF тоже может быть использован в процессе создания ЭК документов.
Технология обработки оцифрованных документов не исключает появления различного рода ошибок. В связи с этим, необходимо сохранять отредактированные файлы в отдельном каталоге, а не заменять ими исходные файлы. Это позволит исправить выявленные ошибки, вновь проведя обработку соответствующих исходных файлов.
В зависимости от применяемого сканера, способа сканирования, на полученных изображениях могут присутствовать по отдельности лицевые и оборотные страницы листов или же развороты, где одновременно находятся оборотная сторона предыдущего листа и лицевая сторона последующего листа.
Выбор необходимого варианта комплектования электронных изображений определяется требованиями заказчика.
В Приложении 2.3. приведена система обозначений рабочих каталогов, используемая в ГАНТСДСО при создании ЭК архивных документов.
Таким образом, при обработке оцифрованных документов применяются следующие технологические операции:
-
Создать каталог для сохранения обработанных цифровых документов. Скопировать в него файлы отсканированных изображений. Произвести необходимые переименования этих файлов, если нужно. -
Если требуется разделение лицевых и оборотных страниц, создать второй каталог для сохранения обработанных оборотов листов. Скопировать в него файлы отсканированных изображений, содержащие оборотные страницы. Произвести необходимые переименования этих файлов с тем, чтобы они соответствовали обозначениям оборотов листов. -
Запустить программу обработки изображений. -
Открыть цифровой документ, подлежащий обработке. -
В случае если текст и изображение в данном документе находятся в перевернутом виде, либо повернуты на 90 и более градусов, следует осуществить поворот документа на необходимую величину, таким образом, чтобы текст был читаем и расположен в горизонтальном направлении.
Если все или большинство файлов при сканировании были сохранены с одинаково перевернутым или повернутым текстом, то возможно произвести автоматический поворот изображений данных файлов на необходимую величину (при наличии данной функции в графическом редакторе).
-
Осуществить точное выравнивание текста и изображения.-
Средствами программы и визуально определить степень неровности текста и изображения по вертикальным и горизонтальным кромкам листа документа. Задать необходимый уровень точного поворота изображения. -
Произвести точный поворот. -
Проконтролировать ориентацию текста и изображения документа после поворота. -
В случае, если текст и изображение на документе расположены недостаточно ровно, повторить п.п. 3.2.6.1 - 3.2.6.3.
-
Примечание: В некоторых документах на одной и той же странице отдельные части текстов могут быть расположены разнонаправлено. В такой ситуации следует ориентироваться на основную часть текста, либо создать несколько файлов с одинаковыми, но по-разному повёрнутыми изображениями одной и той же страницы.
-
Осуществить обрезку лишних краев электронных образов документа.-
Визуально определить части документа, подлежащие обрезке. -
Средствами программы наметить границы обрезки документа. -
Средствами программы обрезать лишние части документа.
-
Примечание: На обрезанном изображении должны быть видны все кромки листа документа и переплёт дела (если документ подшит). Как правило, оставляемые поля должны быть минимальными. Однако, если текст или хоть какие-нибудь символы, сделанные печатным или рукописным способом, а также оттиски печатей, штампов и т. п. расположены очень близко к кромке листа, то для лучшей читаемости документа следует увеличить оставляемое поле с нужной стороны.
-
Осуществить регулировку яркости и контрастности обрабатываемого документа.-
Визуально определить степень яркости и контрастности, параметры цветовой гаммы документа. -
При необходимости средствами программы осуществить изменения яркости и контрастности, регулировку цветовых оттенков до необходимого уровня.
-
-
Сохранить файл с тем же именем в исходный каталог, созданный по п. 3.2.1. или п. 3.2.2. При этом формат, режим цветности, параметры разрешения и сжатия должны остаться такими же, как в исходном файле. -
Перейти к обработке следующего графического файла. -
Посредством циклического повторения п.п. 3.2.4 - 3.2.10, обработать указанным образом все файлы, содержащиеся в каталогах, созданных по п.п. 3.2.1, 3.2.2. -
Если было создано два каталога, отдельно для лицевых и оборотных страниц, то необходимо создать третий – результирующий каталог и скопировать в него все обработанные файлы из первых двух. Выполнить сортировку файлов по именам. -
Произвести проверку полученных файлов изображений. Проверке подвергаются файлы, размещённые в результирующем каталоге.-
Выполнить первую проверку. Первая проверка проводится оператором, который сам исправляет допущенные ошибки. -
Выполнить вторую проверку. Вторая проверка проводится другим уполномоченным лицом. Ошибки устраняет оператор. -
Выполнить контрольную проверку. Контрольная проверка результирующего каталога производится ответственным лицом и выполняется до тех пор, пока все ошибки не будут устранены.
-