Сайт Информационных Технологий

3.3 Грамматика ЯПЗ МПИ

Прежде всего, рассмотрим грамматику наименований. Наименования состоят из нескольких слов естественного языка, и является предложением в терминологии грамматики.

Например, наименование:

Резистор ММТ – 1 1Ом ±20% ОЖО.468.086 ТУ (3.1)

можно разбить на следующие слова: резистор ММТ –1; 1; Ом; ±20%; ОЖО.468.086 ТУ.

Такое расчленение определяется самим стандартом на запись наименования, т.к. в наименовании существуют определённые смысловые части.

Для (3.1) это соответственно: название наименования МПИ, его тип, мощность рассеяния, номинальное сопротивление, допуск и номер технического условия.

Поскольку в стандарте перечислены все допустимые наименования МПИ, то язык представления наименования можно считать контекстно-свободным с простейшей грамматикой, заданной перечнем всех допустимых предложений. Приведём фрагмент этого перечня:

Резистор ММТ – 1 1Ом ±10% ОЖО.468.086 ТУ
Резистор ММТ – 1 1.5Ом ±10% ОЖО.468.086 ТУ
Резистор ММТ – 1 1Ом ±20% ОЖО.468.086 ТУ
Резистор ММТ – 1 1.5Ом ±20% ОЖО.468.086 ТУ                          (3.2)
Резистор ММТ – 1 1кОм ±10% ОЖО.468.086 ТУ
Резистор ММТ – 1 1.5кОм ±10% ОЖО.468.086 ТУ
Резистор ММТ – 1 1кОм ±20% ОЖО.468.086 ТУ
Резистор ММТ – 1 1.5кОм ±20% ОЖО.468.086 ТУ

Из (3.2) видно, что грамматику можно представить в древовидном, табличном и др. видах. Если грамматику представить в виде дерева, то порядок слов будет определять уровень иерархии (см.3.3).

1                       2              3   4           5                  6                      - уровни иерархии
Резистор    ММТ – 1    1  Ом     ±10% ОЖО.468.086 ТУ
                                           ±20% ОЖО.468.086 ТУ
                                  кОм ±10% ОЖО.468.086 ТУ
                                           ±20% ОЖО.468.086 ТУ        (3.3)
                             1.5 Ом   ±10% ОЖО.468.086 ТУ
                                           ±20% ОЖО.468.086 ТУ
                                  кОм ±10% ОЖО.468.086 ТУ
                                           ±20% ОЖО.468.086 ТУ

Из (3.3) видно, что древовидное представление грамматики резко уменьшает объём памяти, необходимой для хранения информации на жёстком диске. В терминологии деревьев любой путь из корня дерева к терминальной вершине даст полное наименование МПИ.

Помимо описанных достоинств, древовидная грамматика обладает и рядом серьёзных недостатков. Например, из (3.3) видно, что хранить на нижних уровнях номер стандарта нецелесообразно, т.к. он одинаков для резисторов ММТ. Также нецелесообразно хранить и символы “-”, “±”, “%”, которые повторяются для всех слов одного уровня.

Избыточность представления недопустима, т.к. число наименований МПИ исчисляется сотнями тысяч, а объём памяти ЭВМ пока весьма ограничен. Помимо этого, не следует забывать, что наименования должны быть введены в ЭВМ, а ввод столь большого их количества может занять очень много времени.

Ещё один серьёзный недостаток – поиск наименований путём пословной детализации только в порядке следования слов в наименовании. Для наименования из (3.2) это несущественно, но если взять наименование материала

Полоса 4*45 ГОСТ 4405-75 \ У10А ГОСТ 1435-74 (3.4)

В нём наиболее важным для конструктора является слово “У10А”, определяющее марку материала. Т.к. это слово стоит далеко от начала наименования, пользователю придётся перебрать несколько менее существенных слов наименования, прежде чем он дойдёт до интересующей его марки материала.

Если грамматику представить в табличном виде, то порядок слов будет определять графы таблицы (см. таб.3.1).

МПИ

Тип

Ном. Соп.

Допуск

№ ТУ

Резистор ММТ – 1 1Ом ±10% ОЖО.468.086 ТУ
Резистор ММТ – 1 1.5Ом ±10% ОЖО.468.086 ТУ
Резистор ММТ – 1 1Ом ±20% ОЖО.468.086 ТУ
Резистор ММТ – 1 1.5Ом ±20% ОЖО.468.086 ТУ
Резистор ММТ – 1 1кОм ±10% ОЖО.468.086 ТУ
Резистор ММТ – 1 1.5кОм ±10% ОЖО.468.086 ТУ
Резистор ММТ – 1 1кОм ±20% ОЖО.468.086 ТУ
Резистор ММТ – 1 1.5кОм ±20% ОЖО.468.086 ТУ

Таб.3.1

В таб.3.1 первой строкой располагаются имена атрибутов, и в последующих строках значения этих атрибутов. Множество пар {имя атрибута, значение} называются кортежами (из понятий реляционной модели данных). Предположим, что каждая запись содержит специальное поле, которое называется ключом. И потребуем, чтобы N ключей (множества из N записей) были различны, так что каждый ключ однозначно определяет свою запись. Совокупность всех записей называется таблицей или файлом, причём под таблицей, как правило, подразумевают небольшой файл, а файлом обычно называют большую таблицу. Большой файл, или группа файлов, часто называются базой данных.

Из таб.3.1 видно, что табличное представление грамматики не уменьшает объём памяти, необходимой для хранения информации на жёстком диске по сравнению с иерархической грамматикой. Подобная сводка, содержащая все данные в одной строке (т.е. в одной записи), конечно же, далека от применения в качестве модели данных для конкретной задачи. Отдельные виды информации, такие, как МПИ, многократно повторяются в различных строках. Поэтому данное представление информации весьма избыточно. К тому же это представление обладает преимущественно теми же недостатками, что и древовидная. Но здесь есть одно преимущество – отсутствует поиск наименований путём пословной детализации в порядке следования слов в наименовании, что облегчает поиск таких наименований как показано в (3.4), когда ключевое слово находится не вначале наименования МПИ, а в середине или в конце.

Если грамматику представить в древовидно-табличном виде (см. таб.3.2), то порядок слов будет определять сначала уровень иерархии, а потом графы таблицы.

1                            2                                       3                    - уровни иерархии
МПИ                  Тип          Ном. Соп.      Допуск                        № ТУ
Резистор
ММТ – 1
1Ом
±10%
ОЖО.468.086 ТУ
 
1.5Ом
±10%
ОЖО.468.086 ТУ
1Ом
±20%
ОЖО.468.086 ТУ
1.5Ом
±20%
ОЖО.468.086 ТУ
1кОм
±10%
ОЖО.468.086 ТУ
1.5кОм
±10%
ОЖО.468.086 ТУ
1кОм
±20%
ОЖО.468.086 ТУ
1.5кОм
±20%
ОЖО.468.086 ТУ

Таб.3.2

Из таб.3.2 видно, что древовидно-табличное представление грамматики частично уменьшает объём памяти, необходимой для хранения информации на жёстком диске. Это представление обладает достоинствами и недостатками присущими как древовидной, так и табличной форм представления записей.

Какой же из этих видов представления информации в памяти ЭВМ целесообразней реализовать? Несмотря на указанные недостатки присущие древовидно-табличному представлению данных, всё же оптимальный выбор структуры МПИ падает на эту модель т.к. она содержит все необходимые, оптимальные методы и свойства по работе с данными такого типа.

В разделе 4. Разработка структуры БД (анализ структур и выбор лучшей), описан более подробный разбор существующих моделей данных и обоснование выбора конкретного инструментального средства для реализации выбранной модели.


Site of Information Technologies
Designed by  inftech@webservis.ru.