Лекция. Автоматизация обработки правовой информации

Основной вопрос – методы и способы обработки правовой информации в машинной обработке.

Весь массив правовой информации необходимо представить в машиночитаемом виде.

Машинное слово – это байт (8 бит).

Методы подготовки информации к машинной обработке:

Формализация, метризация и кодирование.

Формализация – это выявление и уточнение содержания правового явления через рассмотрение и фиксацию его формы и оперирование с нею.

Устойчивыми конструкциями, которыми мы можем записывать информацию – это буквы, знаки, символы и тому подобное.

Второй метод – это метризация. Это описание объекта совокупностью числовых характеристик.

Два способа метризации – подсчёт и измерение.

При подсчёте используют натуральные числа, а при измерении – принятые единицей меры (градусы, радианы, граммы, килограммы…).

Третий способ – это кодирование.

Кодирование – это замена каких-либо данных сокращёнными условными обозначениями.

Способы кодирования: ручное, механизированное и автоматизированное.

Ручной способ очень широко сейчас используется – это в виде карточек и других форм типовых документов. Сейчас осуществляется на основании совместного приказа Генеральной Прокуратуры, МВД, МЧС, Министерства юстиции, ФСБ, Минэкономразвития и ФСКН (госнаркоконтроль) от 29 декабря 2005 года. В качестве приложения в этом приказе очень много форм. Форма №1 – статистическая карточка на выявленное преступление…

Механизированное используется не так часто. Используются координатные сетки и точечное и контурное кодирование.

Автоматизированные способы – это при помощи сканера. В последнее время стали использовать голографические способы снятия объёмной информации.

Мы подготавливаем правовую информацию для того, чтобы обработать, а обработка нам нужна для того, чтобы избавиться от рутинной работы.

Информационно-поисковая система – это совокупность средств для хранения, поиска и выдачи информации по запросу.

Поиск (в самом общем виде) – это процесс извлечения элемента из массива.

Массивы бывают неорганизованные и организованные (организованные ещё делятся на разные классификации, связанные с матрицей и т.д.).

В неорганизованном поиске поиск является случайным. А в организованном массиве поиск детерминированный, то есть предопределённый.

Примером организованного массива является наша библиотека – у нас есть каталоги и алфавитные, и тематические, и по авторам…

По способу поиска информационно-поисковые системы бывают ручные, механизированные и автоматизированные.

Ручные – это человек с его руками (когда мы заходим в библиотеку, берём каталог и начинаем карточки перебирать).

Механизированный – раньше был, когда есть часть и от руки написанное, а есть и элементы механики.

Автоматизированная информационно-поисковая система – это система, реализующая хранение поиска и выдачу информации на базе использования ЭВМ как совокупности языково-алгоритмических и технических средств.

Виды поиска:

1. Путём образа документа. А ещё точнее – создание поискового образа документа. Он представляет собой текст, который на информационно-поисковом языке отражает содержание документа.

Четыре уровня поискового образа документа:

1)      Библиографическое описание (первый и самый низший уровень). В него входит: наименование документа; орган, который его принял (или автор, который его издал); место принятия или издания; дата принятия или издания; объём документа.

2)      Аннотация. Второй уровень. Аннотация – это краткое описание документа (больше, чем библиографическое описание), объёмом не более пятисот знаков (примерно полстраницы машинописного текста).

3)      Реферат (это третий уровень). Это не только описание документа, но и выводы о нём и место в системе других документов. Примерно полторы тысячи знаков, не более.

4)      Четвёртый и самый полный уровень – это текст самого документа.

2. Второй способ поиска. При помощи классификаторов. В нашей стране утверждены порядка двух десятков классификаторов, в правоведении используются три.

Для законодательства и нормативных актов используют классификатор правовых актов, одобренный Указом Президента от 15 марта 2000 года. В него включается двадцать одна отрасль российского законодательства (именно отрасли законодательства, а не права). У него трёхуровневая структура. 010.000.000 – конституционный строй. 030.000.000 – гражданское право… 120.000.000 – информация и информатизация (информационное законодательство).

Каждая отрасль законодательства имеет свою структуру, состоит из нескольких разделов, которые разделяются на институты, субинституты, конечная единица – нормы.

Семь разделов отрасли информации и информатизации:

120.010.000 – общие положения. 120.020.000 – управление в сфере информации и информатизации.

120.030.000 – информационные ресурсы (пользование информационными ресурсами), разделяется на восемь институтов: 120.030.010 – общие положения; 120.030.020 – документирование информации и делопроизводство; 120.030.030 – обязательный экземпляр документов; 120.030.040 – архивный фонд и архивы; 120.030.050 – информационные ресурсы по категориям доступа; 120.030.060 – информация о гражданах (персональные данные); 120.030.070 – правовая информация; 120.030.080 – предоставление информации и информационные услуги.

120.040.000 – информация и информационные системы. Разделяется на два института. 120.040.010 – информатизация и 120.040.020 – информационная система, технологии и средства из обеспечения.

120.050.000 – средства массовой информации (СМИ).

120.060.000 – реклама.

120.070.000 – это информационная безопасность, защита информации и прав субъектов в области информационных процессов и информатизации.

Ряд институтов является межотраслевыми. Это относится к управлению в сфере информации и информатизации, сфера СМИ (образование и культура) и информационная безопасность (безопасность и охрана правопорядка).

Для научной литературы используются два классификатора: УДК (универсальный десятичный классификатор) и ББК (библиотечно-библиографический классификатор).

УДК – во всём мире, а ББК – у нас.

В УДК код наш: 34 – право и юридические науки. Число кодов больше всего – 4414. Все право и юридические науки состоят из 18 отраслей науки: 348 – церковное право, 349 – специальные отрасли права…

ББК право и юридические науки – состоит из 13 отраслей права. Но у лектора он уже устарел.

1672 закона (месяца два назад так было), которые действуют в нашей стране сейчас. А всего – почти семь тысяч (но это с учётом тех законов, которые вносят изменения в другие законы).

3. По объектам поиска.

Два вида – фактографические и документальные информационно-поисковые системы.

В фактографических информационно-поисковых системах происходит хранение, поиск и выдача различных сведений (или фактов): о личности (в том числе может быть и изображение личности в графических файлах), о преступлении, о следах, о доказательствах и тому подобное.

Все фактографические АИПС подразделяются на три группы: информационно-справочные, информационно-логические и экспертные системы. Разница между ними заключается в характере решаемых задач.

Информационно-справочная система – простейшая из этих систем. Если есть запрашиваемый элемент – вытаскивает и выдаёт, нет элемента – не выдаёт.

Информационно-логическая система – в ней происходит алгоритмическое решение задач по синтезу новых сведений и выдаёт те сведения, которые в явной форме там нет.

Экспертная система вообще может делать выводы, не связанные с информационной базой. Она получает новые знания – она может судить (то есть совершать логические суждения, делать логические выводы, может самообучаться, разговаривать с пользователем…).

Документальные информационно-поисковые системы – они предназначены для описания документа и выдачи поиска с необходимой информацией.

Фактографические АИПС больше используются для экспертиз, опознаний, расследований преступлений, то документальные АИПС прежде всего – для законодательства (Консультант, Гарант, Референт).

Два вида документальных информационно-поисковых систем:

1) Избирательное распределение информации (избирательный вид). Это значит, что каждый сеанс поиска производится по одному и тому же запросу, который отражает постоянные интересы пользователя.

2) Справочные, которые выполняют функции справочного или рестропективного поиска. Здесь каждый сеанс поиска осуществляется по разовым запросам (так чаще всего и происходит).

Есть искусственный язык общения – информационно-поисковый язык, он предназначен для записи и поиска семантической или смысловой информации. Его цель – описание тем, предметов или формальных характеристик поисковых образов документов, а также выражение содержания информационных запросов.

Базируется на естественном языке (в нашем случае – на русском языке) и как и любой язык, состоит из слов, которые бывают двух видов: ключевое слово и дескриптор.

Ключевое слово – это слово, которое отражает содержание документа (от восьми до пятнадцати ключевых слов достаточно, чтобы полностью описать документ). Раньше ключевые слова выделяли интуитивно, а теперь – есть закон «чем реже встречается символ, тем большую информацию он в себе несёт, а чем чаще встречается – тем меньшую информацию в себе несёт». Учёные составили частотный словарь русского языка, где все буквы и слова по степени убывания частотности (наиболее часто встречаемая буква – «о»).

Ключевое слово – это лексическая единица, которая описывает языковую конструкцию, выбираемую из текста.

Дескриптор – это словарная единица, выраженная словом или словосочетанием и связанная с другими словами логическими (семантическими) связями.

Все эти слова (ключевые и десприторы0 включаются в словарь, который называется тезаурус.

Семь видов связей между словами: синонимы, функциональная связь (предприятие – производство), родовидовая связь (машина – автомобиль, компьютер, теплоход…), часть и целое (факультет и университет или институт), ассоциативная связь (подданство – гражданство; найм – раньше только жилищный; устойчивые типичные словосочетания, к примеру «явка с повинной»).

Этапы развития АИПС по законодательству.

1 этап – 1961 год. Создание прообраза АИПС (Ленинградский государственный университет).

Второй этап – первые рабочие АИПС. 1972 и 1975 годы. 1972 год – это Право I, а 1975 год – Хронология.

Право I было создано во всесоюзном научном институте… В общем, чисто ведомственный характер носило.

Хронология была в Эстонии изобретена и носила более универсальный характер.

Третий этап – это 80-е годы. Распространение АИПС в министерствах и ведомствах. Их было создано порядка пятидесяти. Самой большой из них была АИПС «Законодательство» (была создана в НИИ советского законодательства и Минюста СССР и включало около 32 000 нормативных актов общесоюзного значения, там были только акты общесоюзного значения).

Следующий этап – это 90-е годы. Здесь три особенности АИПС по законодательству.

1) Появление АИПС на ПК. Первая такая АИПС была создана в 1989 году в Верховном Совете СССР. Называлась она «Союз».

2) Произошло разделение АИПС на государственные и коммерческие (что связано с появлением новых форм собственности). Самые первые государственные системы – это «Эталон» Минюста, та же «Союз» Верховного Совета РСФСР и позже – преемника – Верховного Совета РФ; НДЦ (научно-технический центр правовой информации) «Система».

Коммерческие системы. Самые первые из них – «Юсис» (Юридическая справочная информационная система, была создана в МГУ; была создана на факультете вычислительной математики и кибернетике; но система была так себе – капризная, искала долго…). Вторая система – «Гарант», затем появилась и заняла почти 70% рынка «Консультант +», затем в Ленинграде появилось «Кодекс», потом «Ваше право», «Референт» (три года назад получило первое место среди АИПС) и другие.

3) Появились АИПС на базе компакт-диска. Очень удобно, можно его нахаляву взять в университете (подойти к Просвирнину на практических занятиях и взять).

 

Пятый этап – это появление сетевых АИПС. Об этом давно стали задумываться, так как это достаточно удобно (чтобы по разным министерствам не было разных систем).

Первая попытка на основании Постановления Правительства – в 1985 году стали создавать ОГАСПИ (Общегосударственная автоматизированная система правовой информации). В неё вложили большие деньги, но попытка эта провалилась.

Первая преграда – разные операционные системы (шесть разных и равноправных, а не только детище Билла Гейтса). Вторая – проблема с телекоммуникациями, связь была ужасная.

Вторая попытка была предпринята в 1993 году на основании Указа Президента «О концепции правовой информатизации России». И с этого года начало создаваться и сейчас функционирует РАСИПО (Российская автоматизированная система информационно-правового обеспечения правотворческой, праворелиазиционной деятельности, правового воспитания и обучения). В настоящее время РАСИПО в основном сделано и существует. В ней пять уровней:

1 уровень. Высшие органы государственной власти (Президент, Федеральное Собрание, Правительство).

2 уровень. Центральные органы федеральной исполнительной власти. Министерства и ведомства.

3 уровень. Государственные органы власти субъектов РФ.

4 уровень. Региональные органы власти и органы местного самоуправления.

5 уровень. Отдельные предприятия и организации.

Первые три органа – работа постоянно ведётся, они функционируют, на основе этого в общедоступной сети интернет уже выставлены данные.

Четвёртый уровень – не все из них пока имеют выход в Интернет (есть такие глухие места в нашей стране) и не все активно обновляют.

А пятый уровень заглох. Ибо слишком много их, этих отдельных предприятий и организаций.

Автор: Просвирнин Юрий Георгиевич. Профессор кафедры уголовного процесса