Файл: Методические указания по выполнению лабораторных работ по дисциплине (модулю) Лингвистическое и программное обеспечение автоматизированных систем.doc

МИНОБРНАУКИ РОССИИ
Федеральное государственное бюджетное

образовательное учреждение высшего образования

«Тульский государственный университет»
Институт прикладной математики и компьютерных наук

Кафедра «Вычислительная техника»

Утверждено на заседании кафедры

«Вычислительная техника»

«28» января 2021г., протокол №8

Заведующий кафедрой

_________________________А.Н. Ивутин

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

по выполнению лабораторных работ

по дисциплине (модулю)

«Лингвистическое и программное обеспечение автоматизированных
систем»
основной профессиональной образовательной программы

высшего образования – программы бакалавриата

по направлению подготовки

09.03.01 «Информатика и вычислительная техника»
с направленностью (профилем)

«Электронно-вычислительные машины, комплексы, системы и сети»

Формы обучения: очная
Идентификационный номер образовательной программы: 090301-02-21

Тула 2021 год

Разработчик(и) методических указаний
____Волошко А.Г., доцент, к.т.н._______________ _______________

(ФИО, должность, ученая степень, ученое звание) (подпись)
Лабораторная работа № 1

Виды представления грамматик

1.Цель и задачи работы

Целью работы является сформировать у студентов навыки описания грамматик в различных формах: форме Бэкуса-Наура, расширенной форме с метасимволами и графическом виде.

Задачами работы являются:

Изучить метод описания грамматики в форме Бэкуса-Наура.
Изучить метод описания грамматики в расширенной форме Бэкуса-Наура с метасимволами.
Изучить графический метод описания грамматик.
Описать грамматику в соответствии с индивидуальным заданием.

2.Общие положения (теоретические сведения)

Грамматика — это описание способа построения предложений некоторого языка. Иными словами, грамматика — это математическая система, определяющая язык.

Фактически, определив грамматику языка, мы указываем правила порождения цепочек символов, принадлежащих этому языку. Таким образом, грамматика – это генератор цепочек языка. Она относится ко второму способу определения языков — порождению цепочек символов.

Грамматику языка можно описать различными способами. Например, грамматика русского языка описывается довольно сложным набором правил, которые изучают в начальной школе. Для некоторых языков (в том числе для синтаксических конструкций языков программирования) можно использовать формальное описание грамматики, построенное на основе системы правил (или продукций).

Правило (или продукция) — это упорядоченная пара цепочек символов (α,β). В правилах важен порядок цепочек, поэтому их чаще записывают в виде αβ или (α ::= β). Такая запись читается как "α порождает β" или "β по определению есть α".

Грамматика языка программирования содержит правила двух типов: первые (определяющие синтаксические конструкции языка) довольно легко поддаются формальному описанию; вторые (определяющие семантические ограничения языка) обычно излагаются в неформальной форме. Поэтому любое описание (или стандарт) языка программирования обычно состоит из двух частей: вначале формально излагаются правила построения синтаксических конструкций, а потом на естественном языке дается описание семантических правил.

Язык, заданный грамматикой G, обозначается как L(G).

Две грамматики G и G' называются эквивалентными, если они определяют один и тот же язык: L(G)= L(G'). Две грамматики G и G' называются почти эквивалентными, если заданные ими языки различаются не более чем на пустую цепочку символов:

.

Формально грамматика G определяется как четверка G(VT,VN,P,S), где:

VT — множество терминальных символов или алфавит терминальных символов;

VN — множество нетерминальных символов или алфавит нетерминальных символов;

Р — множество правил (продукций) грамматики, вида α®β, где

;

S — целевой (начальный) символ грамматики

.

Алфавиты терминальных и нетерминальных символов грамматики не пересекаются:

. Это значит, что каждый символ в грамматике может быть либо терминальным, либо нетерминальным, но не может быть терминальным и нетерминальным одновременно. Целевой символ грамматики — это всегда нетерминальный символ. Множество

называют полным алфавитом грамматики G.

Далее будут даны строгие формальные описания того, как связаны различные элементы грамматики и порождаемый ею язык. А пока предварительно опишем смысл множеств VN и VT. Множество терминальных символов VT содержит символы, которые входят в алфавит языка, порождаемого грамматикой. Как правило, символы из множества VT встречаются только в цепочках правых частей правил. Множество нетерминальных символов VN содержит символы, которые определяют слова, понятия, конструкции языка. Каждый символ этого множества может встречаться в цепочках как левой, так и правой частей правил грамматики, но он обязан хотя бы один раз быть в левой части хотя бы одного правила. Правила грамматики обычно строятся так, чтобы в левой части каждого правила был хотя бы один нетерминальный символ.

Во множестве правил грамматики может быть несколько правил, имеющих одинаковые левые части, вида:

. Тогда эти правила объединяют вместе и записывают в виде:

. Одной строке в такой записи соответствует сразу n правил.

Такую форму записи правил грамматики называют формой Бэкуса-Наура (Bacus-Naur Form, BNF, русское общепринятое сокращение БНФ). Эта форма была предложена Джоном Бэкусом и модифицирована Питером Науром, который использовал её для описания синтаксиса языка Алгол. Со временем в БНФ были добавлены новые правила описания синтаксиса, и эта форма получила название РБНФ - расширенная БНФ. Форма Бэкуса-Наура предусматривает, как правило, также, что нетерминальные символы берутся в угловые скобки: < >. Иногда знак  в правилах грамматики заменяют на знак ::= (что характерно для старых монографий), но это всего лишь незначительные модификации формы записи, не влияющие на ее суть.

Ниже приведен пример грамматики, которая определяет язык целых десятичных чисел со знаком:
G ({0,1,2,3,4,5,6,7,8,9,-,+},{<число>,<чс>,<цифра>},Р,<число>)

P:

<число>  <чс> | +<чс> | -<чс>

<чс>  <цифра> | <чс><цифра>

<цифра>  0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
Рассмотрим составляющие элементы грамматики G:

множество терминальных символов VT содержит двенадцать элементов: десять десятичных цифр и два знака;
множество нетерминальных символов VN содержит три элемента: символы <число>, <чс> и <цифра>;
множество правил содержит 15 правил, которые записаны в три строки (то есть имеется только три различных правых части правил);
целевым символом грамматики является символ <число>.

Следует отметить, что символ <чс> — это бессмысленное сочетание букв русского языка, но это обычный нетерминальный символ грамматики, такой же, как и два других. Названия нетерминальных символов не обязаны быть осмысленными, это сделано просто для удобства понимания правил грамматики человеком. В принципе, в любой грамматике можно полностью изменить имена нетерминальных символов, не меняя при этом языка, заданного грамматикой, — точно так же, например, в программе на языке Pascal можно изменить имена идентификаторов, и при этом не изменится смысл программы.

Для терминальных символов это неверно. Набор терминальных символов всегда строго соответствует алфавиту языка, определяемого грамматикой.

Вот, например, та же самая грамматика для языка целых десятичных чисел со знаком, в которой нетерминальные символы обозначены большими латинскими буквами (далее это будет часто применяться в примерах):
G' ({0,1,2,3,4,5,6,7,8,9,-,+},{S,T,F},P,S)

Р:

S  T | +T | -T

T  F | TF

F  0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
Здесь изменилось только множество нетерминальных символов. Теперь VN = {S,T,F}. Язык, заданный грамматикой, не изменился — можно сказать, что грамматики G и G' эквивалентны.

2.1. Принцип рекурсии в правилах грамматики

Особенность рассмотренных выше формальных грамматик в том, что они позволяют определить бесконечное множество цепочек языка с помощью конечного набора правил (конечно, множество цепочек языка тоже может быть конечным, но даже для простых реальных языков это условие обычно не выполняется). Приведенная выше в примере грамматика для целых десятичных чисел со знаком определяет бесконечное множество целых чисел с помощью 15 правил.

В такой форме записи грамматики возможность пользоваться конечным набором правил достигается за счет рекурсивных правил. Рекурсия в правилах грамматики выражается в том, что один из нетерминальных символов определяется сам через себя. Рекурсия может быть непосредственной (явной) — тогда символ определяется сам через себя в одном правиле, либо косвенной (неявной) — то же самое происходит через цепочку правил.

В рассмотренной выше грамматике G непосредственная рекурсия присутствует в правиле: <чс>  <чс><цифра>, а в эквивалентной ей грамматике G' — в правиле TTF.

Чтобы рекурсия не была бесконечной, для участвующего в ней нетерминального символа грамматики должны существовать также и другие правила, которые определяют его, минуя его самого, и позволяют избежать бесконечного рекурсивного определения (в противном случае этот символ в грамматике был бы просто не нужен). Такими правилами являются <чс>  <цифра> — в грамматике G и T  F — в грамматике G'.

В теории формальных языков более ничего сказать о рекурсии нельзя. Но чтобы полнее понять смысл рекурсии, можно прибегнуть к семантике языка — в рассмотренном выше примере это язык целых десятичных чисел со знаком. Рассмотрим его смысл.

Если попытаться дать определение тому, что же является числом, то начать можно с того, что любая цифра сама по себе есть число. Далее можно заметить, что любые две цифры — это тоже число, затем — три цифры и т. д. Если строить определение числа таким методчом, то оно никогда не будет закончено (в математике разрядность числа ничем не ограничена). Однако можно заметить, что каждый раз, порождая новое число

Смотрите также файлы

Презентация План.pptx

Internet это крупнейшая мировая компьютерная сеть. Сейчас Internet имеет примерно 20 миллионов пользователей более чем в 50 странах. Www доступен в основном через Internet.docx

Исследование математических моделей при решении задач на ценообразование и налогообложение.pdf

Доклад на научнопрактическую студенческую конференцию 21. 04. 2010 г по теме "Белый взрыв" социальноэкономические и политические последствия.doc

Вариант Реши уравнения 1 5,2x2 0 2 19x2 14x 5 0 3 8x2 17x 0 4 x2 2x 3 0 5 9x2 15x 4 0 6 35x2 33 0 7 x2 9x 10 0 8 13x2 11x 1 .doc

Файл: Методические указания по выполнению лабораторных работ по дисциплине (модулю) Лингвистическое и программное обеспечение автоматизированных систем.doc

1.Цель и задачи работы

2.Общие положения (теоретические сведения)

2.1. Принцип рекурсии в правилах грамматики

Смотрите также файлы

Информация

Списки файлов

Дополнительно