ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.01.2021
Просмотров: 77
Скачиваний: 1
Автоматизация обработки правовой информации.
Основной вопрос – методы и способы обработки правовой информации в машинной обработке.
Весь массив правовой информации необходимо представить в машиночитаемом виде.
Машинное слово – это байт (8 бит).
Методы подготовки информации к машинной обработке:
Формализация, метризация и кодирование.
Формализация – это выявление и уточнение содержания правового явления через рассмотрение и фиксацию его формы и оперирование с нею.
Устойчивыми конструкциями, которыми мы можем записывать информацию – это буквы, знаки, символы и тому подобное.
Второй метод – это метризация. Это описание объекта совокупностью числовых характеристик.
Два способа метризации – подсчёт и измерение.
При подсчёте используют натуральные числа, а при измерении – принятые единицей меры (градусы, радианы, граммы, килограммы…).
Третий способ – это кодирование.
Кодирование – это замена каких-либо данных сокращёнными условными обозначениями.
Способы кодирования: ручное, механизированное и автоматизированное.
Ручной способ очень широко сейчас используется – это в виде карточек и других форм типовых документов. Сейчас осуществляется на основании совместного приказа Генеральной Прокуратуры, МВД, МЧС, Министерства юстиции, ФСБ, Минэкономразвития и ФСКН (госнаркоконтроль) от 29 декабря 2005 года. В качестве приложения в этом приказе очень много форм. Форма №1 – статистическая карточка на выявленное преступление…
Механизированное используется не так часто. Используются координатные сетки и точечное и контурное кодирование.
Автоматизированные способы – это при помощи сканера. В последнее время стали использовать голографические способы снятия объёмной информации.
Мы подготавливаем правовую информацию для того, чтобы обработать, а обработка нам нужна для того, чтобы избавиться от рутинной работы.
Информационно-поисковая система – это совокупность средств для хранения, поиска и выдачи информации по запросу.
Поиск (в самом общем виде) – это процесс извлечения элемента из массива.
Массивы бывают неорганизованные и организованные (организованные ещё делятся на разные классификации, связанные с матрицей и т.д.).
В неорганизованном поиске поиск является случайным. А в организованном массиве поиск детерминированный, то есть предопределённый.
Примером организованного массива является наша библиотека – у нас есть каталоги и алфавитные, и тематические, и по авторам…
По способу поиска информационно-поисковые системы бывают ручные, механизированные и автоматизированные.
Ручные – это человек с его руками (когда мы заходим в библиотеку, берём каталог и начинаем карточки перебирать).
Механизированный – раньше был, когда есть часть и от руки написанное, а есть и элементы механики.
Автоматизированная информационно-поисковая система – это система, реализующая хранение поиска и выдачу информации на базе использования ЭВМ как совокупности языково-алгоритмических и технических средств.
Виды поиска:
1. Путём образа документа. А ещё точнее – создание поискового образа документа. Он представляет собой текст, который на информационно-поисковом языке отражает содержание документа.
Четыре уровня поискового образа документа:
-
Библиографическое описание (первый и самый низший уровень). В него входит: наименование документа; орган, который его принял (или автор, который его издал); место принятия или издания; дата принятия или издания; объём документа.
-
Аннотация. Второй уровень. Аннотация – это краткое описание документа (больше, чем библиографическое описание), объёмом не более пятисот знаков (примерно полстраницы машинописного текста).
-
Реферат (это третий уровень). Это не только описание документа, но и выводы о нём и место в системе других документов. Примерно полторы тысячи знаков, не более.
-
Четвёртый и самый полный уровень – это текст самого документа.
2. Второй способ поиска. При помощи классификаторов. В нашей стране утверждены порядка двух десятков классификаторов, в правоведении используются три.
Для законодательства и нормативных актов используют классификатор правовых актов, одобренный Указом Президента от 15 марта 2000 года. В него включается двадцать одна отрасль российского законодательства (именно отрасли законодательства, а не права). У него трёхуровневая структура. 010.000.000 – конституционный строй. 030.000.000 – гражданское право… 120.000.000 – информация и информатизация (информационное законодательство).
Каждая отрасль законодательства имеет свою структуру, состоит из нескольких разделов, которые разделяются на институты, субинституты, конечная единица – нормы.
Семь разделов отрасли информации и информатизации:
120.010.000 – общие положения. 120.020.000 – управление в сфере информации и информатизации.
120.030.000 – информационные ресурсы (пользование информационными ресурсами), разделяется на восемь институтов: 120.030.010 – общие положения; 120.030.020 – документирование информации и делопроизводство; 120.030.030 – обязательный экземпляр документов; 120.030.040 – архивный фонд и архивы; 120.030.050 – информационные ресурсы по категориям доступа; 120.030.060 – информация о гражданах (персональные данные); 120.030.070 – правовая информация; 120.030.080 – предоставление информации и информационные услуги.
120.040.000 – информация и информационные системы. Разделяется на два института. 120.040.010 – информатизация и 120.040.020 – информационная система, технологии и средства из обеспечения.
120.050.000 – средства массовой информации (СМИ).
120.060.000 – реклама.
120.070.000 – это информационная безопасность, защита информации и прав субъектов в области информационных процессов и информатизации.
Ряд институтов является межотраслевыми. Это относится к управлению в сфере информации и информатизации, сфера СМИ (образование и культура) и информационная безопасность (безопасность и охрана правопорядка).
Для научной литературы используются два классификатора: УДК (универсальный десятичный классификатор) и ББК (библиотечно-библиографический классификатор).
УДК – во всём мире, а ББК – у нас.
В УДК код наш: 34 – право и юридические науки. Число кодов больше всего – 4414. Все право и юридические науки состоят из 18 отраслей науки: 348 – церковное право, 349 – специальные отрасли права…
ББК право и юридические науки – состоит из 13 отраслей права. Но у лектора он уже устарел.
1672 закона (месяца два назад так было), которые действуют в нашей стране сейчас. А всего – почти семь тысяч (но это с учётом тех законов, которые вносят изменения в другие законы).
3. По объектам поиска.
Два вида – фактографические и документальные информационно-поисковые системы.
В фактографических информационно-поисковых системах происходит хранение, поиск и выдача различных сведений (или фактов): о личности (в том числе может быть и изображение личности в графических файлах), о преступлении, о следах, о доказательствах и тому подобное.
Все фактографические АИПС подразделяются на три группы: информационно-справочные, информационно-логические и экспертные системы. Разница между ними заключается в характере решаемых задач.
Информационно-справочная система – простейшая из этих систем. Если есть запрашиваемый элемент – вытаскивает и выдаёт, нет элемента – не выдаёт.
Информационно-логическая система – в ней происходит алгоритмическое решение задач по синтезу новых сведений и выдаёт те сведения, которые в явной форме там нет.
Экспертная система вообще может делать выводы, не связанные с информационной базой. Она получает новые знания – она может судить (то есть совершать логические суждения, делать логические выводы, может самообучаться, разговаривать с пользователем…).
Документальные информационно-поисковые системы – они предназначены для описания документа и выдачи поиска с необходимой информацией.
Фактографические АИПС больше используются для экспертиз, опознаний, расследований преступлений, то документальные АИПС прежде всего – для законодательства (Консультант, Гарант, Референт).
Два вида документальных информационно-поисковых систем:
1) Избирательное распределение информации (избирательный вид). Это значит, что каждый сеанс поиска производится по одному и тому же запросу, который отражает постоянные интересы пользователя.
2) Справочные, которые выполняют функции справочного или рестропективного поиска. Здесь каждый сеанс поиска осуществляется по разовым запросам (так чаще всего и происходит).
Есть искусственный язык общения – информационно-поисковый язык, он предназначен для записи и поиска семантической или смысловой информации. Его цель – описание тем, предметов или формальных характеристик поисковых образов документов, а также выражение содержания информационных запросов.
Базируется на естественном языке (в нашем случае – на русском языке) и как и любой язык, состоит из слов, которые бывают двух видов: ключевое слово и дескриптор.
Ключевое слово – это слово, которое отражает содержание документа (от восьми до пятнадцати ключевых слов достаточно, чтобы полностью описать документ). Раньше ключевые слова выделяли интуитивно, а теперь – есть закон «чем реже встречается символ, тем большую информацию он в себе несёт, а чем чаще встречается – тем меньшую информацию в себе несёт». Учёные составили частотный словарь русского языка, где все буквы и слова по степени убывания частотности (наиболее часто встречаемая буква – «о»).
Ключевое слово – это лексическая единица, которая описывает языковую конструкцию, выбираемую из текста.
Дескриптор – это словарная единица, выраженная словом или словосочетанием и связанная с другими словами логическими (семантическими) связями.
Все эти слова (ключевые и десприторы0 включаются в словарь, который называется тезаурус.
Семь видов связей между словами: синонимы, функциональная связь (предприятие – производство), родовидовая связь (машина – автомобиль, компьютер, теплоход…), часть и целое (факультет и университет или институт), ассоциативная связь (подданство – гражданство; найм – раньше только жилищный; устойчивые типичные словосочетания, к примеру «явка с повинной»).