Файл: В юридической деятельности.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.01.2024

Просмотров: 1160

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

СОДЕРЖАНИЕ

1. Понятие информационных технологий. Терминология и объект информатики.

2. Количественная мера информации.

3. Понятие энтропии.

4. Современные информационные технологии в деятельности МВД России.

ОСНОВНЫЕ ВОПРОСЫ:

1. Информационные процессы и их особенности.

2. Кодирование информации.

Преимущества цифровой передачи видеоданныхКроме очевидных преимуществ формата, сам способ формирования цифрового изображения также несет в себе существенные преимущества. Цифровой сигнал не ослабляется при передаче на расстояние, как аналоговый сигнал. Поэтому если он принимается вообще, то принимается без искажений. Цифровой сигнал не подвержен помехам, характерным для работы нецифрового оборудования, таким как тени, «туман» или «снег». Передается же цифровой сигнал в компрессированном виде, что намного сужает требуемую полосу пропускания канала. В цифровом телевидении применяется схема компрессии MPEG-2 – та же, что и на DVD.Любая компрессия – это компромисс. Самое высокое качество у некомпрессированного цифрового видео, но для этого необходимо передавать невероятное количество данных. Такую пропускную способность можно обеспечить только в локальной сети. Чтобы передавать цифровой сигнал по существующим каналам, изображение с разрешением примерно вчетверо выше по сравнению с обычным нецифровым компрессируется в соотношении 77:1. «Чудо компрессии» позволяет не только передавать в эфир превосходное изображение. Благодаря запасу полосы пропускания, появляется возможность передавать цифровое аудио 7.1, то есть настоящий окутывающий звук (surround sound).Важнейшим компонентом HDTV служит совсем крошечная деталь – скромный пиксель. В аналоговом телевидении элементы изображения, из которых состоит красная, зеленая и синяя компоненты, представляют собой вертикальные прямоугольники. В HDTV они квадратные, как на компьютерных мониторах, и более, чем в четверо меньше пикселов аналогового ТВ, так что мелкие детали получаются намного четче, что позволяет разглядеть каждую пору на коже кинозвезды. 2. Информационные кросс - технологииК данному классу отнесены технологии пользователя, ориентированные на следующие (или аналогичные) виды преобразования информации:• распознавания символов;• звук-текст;• текст-звук;• автоматический перевод. Оптическое распознавание символов (OCR)Когда страница текста отсканирована в ПК, она представлена в виде состоящего из пикселей растрового изображения. Такой формат не воспринимается компьютером как текст, а как изображение текста и текстовые редакторы не способны к обработке подобных изображений. Чтобы превра­тить группы пикселей в доступные для редактирования символы и слова, изображение должно пройти сложный процесс, известный как оптическое распознавание символов (optical character recognition – OCR).В то время как переход от символьной информации к графической (растровой) достаточно элементарен и без труда осуществляется, например при выводе текста на экран или печать, обратный переход (от печатного текста к текстовому файлу в машинном коде) весьма затруднителен. Именно в связи с этим для ввода информации в ЭВМ исстари использовались перфоленты, перфокарты и др. промежуточные носители, а не исходные «бумажные» документы, что было бы гораздо удобнее. «В защиту» перфокарт скажем здесь, что наиболее «продвинутые» устройства перфорации делали надпечатку на карте для проверки ее содержания.Первые шаги в области оптического распознавания символов были предприняты в конце 50-х гг. XX в. Принципы распознавания, заложенные в то время, используются в большинстве систем OCR: сравнить изображение с имеющимися эталонами и выбрать наиболее подходящий.В середине 70-х гг. была предложена технология для ввода информации в ЭВМ, заключающаяся в следующем: исходный документ печатается на бланке с помощью пишущей машинки, оборудованной стилизованнымшрифтом (каждый символ комбинируется из ограниченного числа вертикальных, горизонтальных, наклонных черточек, подобно тому, как это делаем мы и сейчас, нанося на почтовый конверт цифры индекса); полученный «машинный документ» считывается оптоэлектрическим устройством (собственно OCR), которое кодирует каждый символ и определяет его позицию на листе; информация переносится в память ЭВМ, образуя электронный образ документа или документ во внутреннем представлении. Очевидно, что по сравнению с перфолентами (перфокартами) OCR-документ лучше хотя бы тем, что он без особого труда может быть прочитан и проверен человеком и, вообще, представляет собой «твердую копию» соответствующего введенного документа. Было разработано несколько модификаций подобных шрифтов, разной степени «удобочитаемости» (OCR A (рис 1), OCR В (рис 2) и пр.). Рис. 1. OCR – A Рис. 2. OCR – BОчевидно также, что считывающее устройство представляет собой сканер, хотя и специализированный(считывание стилизованных символов), но интеллектуальный(распознавание их).OCR – технология в данном виде просуществовала недолго и в настоящее время приобрела следующий вид: считывание исходного документа осуществляется универсальным сканером, осуществляющим создание растрового образа и запись его в оперативную память и/или в файл; функции распознавания полностью возлагаются на программные продукты, которые, естественно, получили название OCR-software. Исследования в этом направлении начались в конце 1950–х гг., и с тех пор технологии непрерывно совершенствовались. В 1970-х гг. и в начале 1980-х гг. программное обеспечение оптического распознавания символов все еще обладало очень ограниченными возможностями и могло работать только с некоторыми типами и размерами шрифтов. В настоящее время программное обеспечение оптического распознавания символов намного более интеллектуально и может распознать фактически все шрифты, даже при невысоком качестве изображения документа.Основные методы оптического распознаванияОдин из самых ранних методов оптического распознавания символов базировался на сопоставлении матриц или сравнении с образцом букв. Большинство шрифтов имеют формат Times, Courier или Helvetica и размер от 10 до 14 пунктов (точек). Программы оптического распознавания символов, которые используют метод сопоставления с образцом, имеют точечные рисунки для каждого символа каждого размера и шрифта.Сравнивая базу данных точечных рисунков с рисунками отсканированных символов, программа пытается их распознавать. Эта ранняя система успешно работала только с непропорциональными шрифтами (подобно Courier), где символы в тексте хорошо отделены друг от друга. Сложные документы с различными шрифтами оказываются уже вне возможностей таких программ. Рис. 3. Разные подходы к распознаваниюВыделение признаков было следующим шагом в развитии оптического распознавания символов. При этом распознавание символов основывается на идентификации их универсальных особенностей, чтобы сделать распознавание символов независимым от шрифтов. Если бы все символы могли быть идентифицированы, используя правила, по которым элементы букв (например, окружности и линии) присоединяются друг к другу, то индивидуальные символы могли быть описаны незави­симо от их шрифта. Например: символ «а» может быть представлен как состоящий из окружности в центре снизу, прямой линии справа и дуги окружности сверху в центре (рис. 3).Если отсканированный символ имеет эти особенности, он может быть правильно идентифицирован как символ «а» программой оптического распознавания.Выделение признаков было шагом вперед сравнительно с соответствием матриц, но практические результаты оказались весьма чувствительными к качеству печати. Дополнительные пометки на странице или пятна на бумаге существенно снижали точность обработки. Устранение такого «шума» само по себе стало целой областью исследований, пытающейся определить, какие биты печати не являются частью индивидуальных символов. Если шум идентифицирован, достоверные символьные фрагменты могут тогда быть объединены в наиболее вероятные формы символа.Некоторые программы сначала используют сопоставление с образцом и/или метод выделения признаков для того, чтобы распознать столько символов, сколько возможно, а затем уточняют результат, используя грамматическую проверку правильности написания для восстановления нераспознанных символов. Например, если программа оптического распознавания символов неспособна распознать символ «е» в слове «th



Специальным языком, посредством которого формируется ПОЗ, принято называть информационно-поисковым языком (ИПЯ) и определять его как некую формализованную семантическую систему, предназначенную для выражения содержания документа и поискового запроса.

Основными элементами ИПЯ являются алфавит, лексика (словарный состав) и грамматика.

Алфавит ИПЯ – система знаков, используемых для записи слов и выражений ИПЯ.

Словарный состав (лексика) ИПЯ – совокупность слов, словосочетаний и выражений, используемых для построения текстов ИПЯ.

Грамматика ИПЯ – совокупность средств и способов построения, изменения и сочетания лексических единиц. Грамматика включает морфологию и синтаксис.

Так как ИПЯ может быть определен различными способами, выделим ряд требований, которым он должен удовлетворять:

  • располагать лексико-грамматическими средствами для точного отображения темы документа и запроса;

  • не содержать полисемии (когда одно и то же слово выражает пучок родственных понятий);

  • не содержать синонимии (совпадение слов по значению и несовпадение по написанию);

  • не содержать омонимии (совпадение слов по написанию или звучанию и несовпадение по смыслу);

  • отображать только объективные характеристики предметов и отношений между ними;

  • быть удобным для алгоритмического сопоставления ПОД и ПОЗ.

Естественный язык обладает высокой многозначностью. В ИПЯ недопустима многозначность. Поэтому необходимо учитывать отношения синонимии и омонимии слов естественного языка, используемых в ИПЯ.

Построение выражений ИПЯ требует решения ряда проблем.

Первая проблема связана с выбором лексических единиц ИПЯ, необходимых для построения выражений. Выбор слов определяется их смыслом, обусловленным парадигматическими отношениями между предметами и явлениями, которые они определяют.

Парадигматические отношения – это отношения, обусловленные наличием логических связей между предметами и явлениями, обозначенными данными словами.

Рассмотрим самые очевидные парадигматические отношения:

  • «вид – род», например, «огурец – овощ». В данном случае понятие «огурец» является видовым по отношению к понятию «овощ». Родовое понятие всегда включает в себя видовое;

  • «часть – целое», например «нога – человек»;

  • «причина – следствие», например, «лампа – свет»;

  • «функциональное сходство», например, «лопата – экскаватор».


Вторая проблема построения фраз ИПЯ связана с определением последовательности выбранных слов.

Синтагматические отношения – отношения слов при соединении их в словосочетания и фразы. Для уточнения смысла документа или запроса, помимо ключевых слов, часто необходимо указывать, в каких синтагматических отношениях эти слова находятся.

Многообразие используемых в ИПЯ парадигматических и синтагматических отношений определяет семантическую силу ИПЯ.

По способу организации понятий различают следующие ИПЯ: предкоординируемые (классификационные) ИПЯ; посткоординируемые (дескрипторные) ИПЯ.

Предкоординация предполагает предварительное (до использования при индексировании) построение сложных классов путем логического умножения (координации) простых классов. Словарный состав задается в виде фиксированного списка слов, словосочетаний и фраз. Введение в язык новых лексических единиц строго ограничено и возможно лишь до индексирования документов, т. е. при создании языка.

Посткоординируемые (дескрипторные) языки основаны на методе координатного индексирования. В посткоординируемых ИПЯ лексические единицы объединяются в поисковом образе лишь во время индексирования документа. Словарь дескрипторного ИПЯ состоит отдельных слов или словосочетаний естественного языка, отобранных специальным образом, так называемых – ключевых слов и дескрипторов.

Координатное индексирование — индексирование, при котором основное смысловое содержание текста (документа) или информационного запроса представляется в виде сочетания ключевых слов или дескрипторов.

Ключевые слова — это наиболее существенные для отображения содержания документа слова и словосочетания, обладающие назывной функцией.

Одним из важнейших показателей эффективности функционирования ИС, характерным для документальных информационных систем является полнота и точность информационного поиска. Рассмотрим подробней указанные понятия.

Полнота информационного поиска

Обозначим полноту информационного поиска , тогда определяется отношением числа найденных релевантных документов к общему числу релевантных документов, имеющихся в системе, т.е. , где

– число найденных релевантных документов, – общее число релевантных документов в системе.

Точность информационного поиска

Обозначим точность информационного поиска , тогда определяется отношением числа найденных релевантных документов к общему числу документов, выданных на запрос пользователя, т.е. , где – общее число документов, выданных на запрос пользователя.

Информационный шум

Наличие среди отобранных на запрос пользователя нерелевантных документов называется информационным шумом системы. Коэффициент информационного шума определяется отношением нерелевантных документов, выданных в ответе пользователю, к общему числу документов, выданных на запрос пользователя:

3. Использование документальных информационных систем (ДИС) в профессиональной деятельности сотрудника ОВД

Рассмотрим возможности применения ДИС в профессиональной деятельности сотрудников ОВД.

Для этого подробно остановимся на правовых информационных системах, которые являются типичным примером документальных информационных систем Поисковые интернет системы также являются представителями документальных систем.

Разобьем их условно на АИС, используемые в правотворчестве, правоприменительной практике, правоохранительной деятельности, правовом образовании и воспитании. Естественно, следует понимать, что подобного рода классификация достаточно условна, так как одни и те же АИС могут использоваться в различных видах правовой деятельности.

Можно также рассмотреть правовые информационные системы с точки зрения правового образования, в рамках которого они сложились, и задачи которого решают в процессе своего функционирования, — автоматизированные системы органов прокуратуры, юстиции, судов и др.


Один из основных подходов к классификации АИС в правовой сфере связан с видами обрабатываемой социально-правовой информации.

Так можно выделить АИС, основанные на системе нормативных правовых актов. Например, информационно-поисковые по законодательству и справочные правовые системы. Для этих систем проблемы систематизации информации связаны с вопросами классификации и систематизации нормативных правовых актов.

С другой стороны, можно выделить системы, аккумулирующие и обрабатывающие разнообразную социально-правовую информацию ненормативного характера: криминологическую, криминалистическую, судебно-экспертную, оперативно-розыскную, научную правовую и др.

В ДИС собираются и систематизируются тексты документов или их библиографическое описание. Поскольку документированная информация — это зафиксированная на материальном носителе путем документирования информация с реквизитами, позволяющими определить такую информацию, или в установленных законодательством Российской Федерации случаях ее материальный носитель, то указанные реквизиты являются основанием для классификации обрабатываемой информации.

Всю документированную правовую информацию можно разбить на официальную и неофициальную. К официальной правовой информации относятся сведения и данные о праве или о законодательстве в широком смысле слова, т.е. обо всех действующих и уже прекративших действие нормативных актах. В автоматизированных системах, основанных на официальной правовой информации, большую роль играет ее классификация по источникам права: законы Российской Федерации, нормативные акты правительства страны и правительств республик, министерств и ведомств страны и республик и местных органов государственной власти и государственного управления, общественных организаций и др.

В качестве неофициальной правовой информации, лежащей в основе функционирования АИС, рассматриваются все сведения и данные о праве и связанных с ним явлениях, которые отражены в юридической научной литературе, не являющейся официальной (юридических монографиях, учебниках, статьях, обзорах, докладах, справочниках и других материалах), и сведения, содержащиеся в материалах, полученных от предприятий, учреждений, общественных организаций, граждан и других источников.

Большое значение, с точки зрения создания и функционирования АИС, имеет классификация информации по степени доступа на общедоступную и ограниченного доступа. Использование подобного рода информации в автоматизированных системах требует организации технической и программной защиты ее от несанкционированного доступа.


Наиболее известными системами, относящимися к данному виду, являются: информационная система «Эталонный банк правовых актов», созданная в НТЦ «Система» при Государственном правовом управлении Президента РФ; база данных по законодательству «Эталон», разработанная Научным центром правовой информации; справочная правовая система «Гарант», разработанная научно-производственным объединением «Гарант-Сервис» (МГУ); информационная правовая система «Кодекс», созданная в «Центре компьютерных разработок» (Санкт-Петербург); справочно-правовые системы семейства «КонсультантПлюс», созданные ЗАО «КонсультантПлюс».

ДИС используются для накопления и постоянного корректирования больших массивов информации о лицах, фактах и предметах, представляющих интерес. Эти системы работают преимущественно по принципу «запрос — ответ», поэтому обработка информации в них связана в основном не с преобразованием первичных данных, а с их поиском.

Принципиальную особенность ДИС составляет понятие «информационный поиск». Информационный поиск — это процесс отыскания в каком-то множестве тех сведений, которые посвящены указанной в информационном запросе теме (предмету), информация о которой необходима пользователю.

Большое количество автоматизированных информационно-справочных систем создано и функционирует в правоохранительной и судебной сферах: «Убийство», «Следователь», «Рэкет», «Разбой», «Хищение оружия из хранилищ», «Расследование» — по организации расследования отдельных видов преступлений; «Сейф» — по информационному обеспечению расследования хищений из сейфов; «Девиз-М» — по расследованию поддельных денежных знаков; «Рецепт» — по расследованию поддельных рецептов на получение наркотических средств; «Досье» — по автоматизированному учету особо опасных преступников (рецидивистов, гастролеров, организаторов преступных групп, авторитетов уголовной среды и т.п.); «Папилон» — по проверке отпечатков пальцев и дактилокарт; «Криминал-И» — по учету правонарушений и преступлений, совершенных иностранными гражданами и гражданами России за рубежом; «Автопоиск» — по учету и организации поиска угнанного и бесхозного автотранспорта; «Антиквариат» — по учету похищенных культурных ценностей; «Наказание» — об отбывающих наказание;