СЕМАНТИЧЕСКИЕ СЕТИ.
Семантическая сеть - структура для представления знаний в виде узлов,
соединенных дугами. Самые первые семантические сети были разработаны в качестве
языка-посредника для систем машинного перевода, а многие современные версии до
сих пор сходны по своим характеристикам с естественным языком. Однако последние
версии семантических сетей стали более мощными и гибкими и составляют
конкуренцию фреймовым системам, логическому программированию и другим языкам
представления.
Начиная с конца 50-ых годов были создано и применены на практике десятки
вариантов семантических сетей. Несмотря на то, что терминология и их структура
различаются, существуют сходства, присущие практически всем семантическим сетям:
1. узлы семантических сетей представляют собой концепты предметов, событий,
состояний;
2. различные узлы одного концепта относятся к различным значениям, если они не
помечено, что они относятся к одному концепту;
3. дуги семантических сетей создают отношения между узлами-концептами (пометки
над дугами указывают на тип отношения);
4. некоторые отношения между концептами представляют собой лингвистические
падежи, такие как агент, объект, реципиент и инструмент (другие означают
временные, пространственные, логические отношения и отношения между отдельными
предложениями;
5. концепты организованы по уровням в соответствии со степенью обобщенности так
как, например, сущность, живое существо, животное, плотоядное,;
Однако существуют и различия: понятие значения с точки зрения философии; методы
представления кванторов общности и существования и логических операторов;
способы манипулирования сетями и правила вывода, терминология. Все это
варьируется от автора к автору. Несмотря не некоторые различия, сети удобны для
чтения и обработки компьютером, а также достаточно мощны, чтобы представить
семантику естественного языка.
ИСТОРИЧЕСКАЯ СПРАВКА.
Фрег представил логические формулы в виде деревьев, которые однако мало
напоминают современные семантические сети. Еще одним пионером стал Чарльз
Сандерз Прис, который использовал графические записи в органической химии.
Он сформулировал правила выводы с использованием экзистенциональных графов.
В психологии Зельц использовал графы для представления наследственности
некоторых характеристик в иерархии концептов. Научные изыскания Зельца имели
огромное влияние на изучение тактики в шахматах, который в свою очередь повлиял
на таких теоретиков, как Саймон и Ньюэлл.
Что касается лингвистики, то первым ученым, занимавшимся разработкой графических
описаний, стал Теньер. Он использовал графическую запись для своей грамматики
зависимостей. Теньер оказал огромное влияние на развитие лингвистики в Европе.
Впервые семантические сети были использованы в системах машинного перевода в
конце 50-х - начале 60-х годов. Первая такая система, которую создала Мастерман,
включала в себя 100 примитивных концептов таких, как, например, НАРОД, ВЕЩЬ,
ДЕЛАТЬ, БЫТЬ. С помощью этих концептов она описала словарь объемом 15000 единиц,
в котором также имелся механизм переноса характеристик с гипертипа на подтип.
Некоторые системы машинного перевода базировались на корреляционных сетях
Цеккато, которые представляли собой набор 56 различных отношений, некоторые из
которых - падежные отношения, отношения подтипа, члена, части и целого. Он
использовал сети, состоящие из концептов и отношений для руководства действиями
парсера и разрешения неоднозначностей.
В системах искусственного интеллекта семантические сети используются для ответа
на различные вопросы, изучение процессов обучения, запоминания и рассуждений. В
конце 70-х сети получили широкое распространение. В 80-х годах границы между
сетями, фреймовыми структурами и линейными формами записи постепенно стирались.
Выразительная сила больше не является решающим аргументом в пользу выбора сетей
или линейных форм записи, поскольку идеи записанные с помощью одной формы записи
могут быть легко переведены в другую. И наоборот, особо важное значение получили
второстепенные факторы, как читаемость, эффективность, неискусственность и
теоретическая элегантность, также учитываются легкость введения в компьютер,
редактирование и распечатка.
РЕЛЯЦИОННЫЕ ГРАФЫ.
Самые простые сети, которые используются в системах искусственного интеллекта, -
реляционные графы. Они состоят из узлов, соединенных дугами. Каждый узел
представляет собой понятие, а каждая дуга - отношения между различными
понятиями. На рисунке 1 представлено предложение “Собака жадно гложет кость”.
Четыре прямоугольника представляют понятия собаки, процесса гложения, кости и
такой характеристики, как жадность. Надписи над дугами означают, что собака
является агентов гложения, кость является объектом гложения, а жадность - это
манера гложения.
Терминология, использующаяся в этой области различна. Чтобы добиться некоторой
однородности, узлы, соединенные дугами, принято называть графами, а структуру,
где имеется целое гнездо из узлов или где существуют отношения различного
порядка между графами, называется сетью. Помимо терминологии, использующейся для
пояснения, также различаются способы изображения. Некоторые используют кружки
вместо прямоугольников; некоторые пишут типы отношений прямо над дугами, не
заключая их в овалы; некоторые используют аббревиатуры, например О или А для
обозначения агента или объекта; некоторые используют различные типы стрелок. На
рисунке 2 изображен граф концептуальных зависимостей Шенка. означает агента.
INGEST (поглощать) - один из примитивов Шенка: ЕСТЬ - ПОГЛОЩАТЬ твердый объект;
ПИТЬ - ПОГЛОЩАТЬ жидкий объект; ДЫШАТЬ - ПОГЛОЩАТЬ газообразный объект.
Дополнительная стекла слева показывает, что кость переход из неуказанного места
к собаке.
Поскольку довольно сложно ввести в компьютер некоторые диаграммы и при этом они
занимают много места при печати, многие ученые записывают свои графы в более
компактном варианте. Например, то же предложение Сова предложил записать в
линейном виде с использованием некоторых элементов из рисунка 1:
[ЕСТЬ]-
(AGNT) -> [СОБАКА]
(OBJ) -> [КОСТЬ]
(MANR) -> [ЖАДНОСТЬ]
В этом варианте записи квадратные скобки обозначают понятия, а круглые скобки
содержат в себе названия отношений. Все линейные формы записи очень похожи на
фреймовые структуры.
ГРАФЫ С ЦЕНТРОМ В ГЛАГОЛЕ.
Глаголы соединяются с группой существительного с использованием падежных
отношений. Например, с предложении “Mary gave a book to Fred”, Mary агент
давания, book объект этого процесса, а Fred реципиент глагола “давать”. Помимо
падежных отношений в предложении в естественном языке также имеются средства для
связи отдельных предложений. Такие отношения необходимы для следующего:
Союзы. Самый простой способ соединить предложения - это поставить между ними
союз. Некоторые союзы, как например “и”, “или”, “если” обозначают логическую
связь; некоторые, такие как “после того, как”, “когда”, “пока”, “с тех пор, как”
и “потому что”, выражают временные отношения и причину.
Глаголы, требующие подчиненное предложение. Падежные фреймы многих глаголов
требуют подчиненного предложения, являющегося обычно прямым дополнением. К
такому типу относятся глаголы “говорить”, “считать”, “думать”, “знать”, “быть
убежденным”, “угрожать”, “пытаться” и др.
Определители, относящиеся к целому предложению. Многие наречия и пропозиционные
фразы относятся только к глаголу, но некоторые определяют целое предложение.
Такие наречия, как “обычно”, “вероятно”, в большинстве случаев ставятся в начале
предложения. А например, слово “однажды” определяет весь рассказ, следующий
после него.
Модальные глаголы и времена. Такие глаголы, как “may”, “can”, “must”, “should”,
“would” и “could” имеют модальное значение и относятся ко всему предложению, где
они встречаются. Временное отношение может быть выражено как формой прошедшего
времени глаголов, так и обстоятельствами“сейчас”, “завтра” или “однажды” и
другими.
Связанный дискурс. Помимо отношений, выраженных в одном предложении, существуют
также отношения более высокого порядка между отдельными предложениями рассказа
или какого-либо другого повествования. Многие из них не выражены эксплицитно:
временные отношения и следование аргументов может быть, например, имплицитно
выражено порядком следования предложения друг за другом в тексте.
Именно потому, что глагол отводится такая важная роль в предложении, многие
теория делают его своим центральным связующим звеном. Этот подход берет свое
начало из Индо-Европейской языковой семьи, где модальность и временные отношения
выражаются изменением глагольной формы. Рассмотрим следующий пример: “While a
dog was eating a bone, a cat passed by unnoticed”. В этом предложении сообщено,
что, когда предложение “While a dog was eating a bone” являлось истинным, второе
предложение “A cat passed unnoticed” также является истинным. На рисунке 3
изображен граф с центром в глаголе. Союз “while” (WHL) соединяет узел PASS-BY с
узлом EAT. На рисунке 3 показано, что собака является агентом незамечания (not
noticing).
Графы с центром в глаголе - это реляционные графы, где глагол считается
центральным звеном любого предложения. Маркеры времени и отношения пишутся прямо
рядом с концептами, которые представляют глаголы. Графы концептуальных
зависимостей Роджера Шенка также используют этот подход.
Несмотря на то, что графы с центром в глаголе довольно гибкие по своей
структуре, они обладают рядом ограничений. Одно из них заключается в том, что
они не проводят разграничение между определителями, которые относятся только к
глаголу, и определителями, относящимися к предложению целиком. Рассмотрим
следующие примеры:
The dog greedily ate the bone.
Greedily, the dog ate the bone.
Эти графы также плохо справляются с предложениями, находящимися внутри других
предложений.
При работе с реляционными графами возникают проблемы с передачей всего
многообразия временных отношений и отношений модальности. Несмотря на то, что
многие учение используют эти графы для решения сложных проблем, они так до сих
пор и не разработали общего метода для их разрешения. В выше приведенном примере
пометка PAST должна относится ко всему предложению, которое говорит о том, что
собака ест кость, а не только к глаголу EAT, поскольку очевидно, что кость позже
была съедена собакой целиком. Также должно быть указано, что процесс прохождения
кошки и процесс не замечания ее собакой происходили в одно и то же время.
ПРОПОЗИЦИОННЫЕ СЕТИ.
В пропозиционных сетях узлы представляют целые предложения. Эти узлы являются
точками соприкосновения для отношений между отдельными предложениями связанного
текста. С другой стороны они определяют время и модальность для всего контекста.
Представленные ниже примеры иллюстрируют отношения, для записи которых
необходимы пропозиционные узлы:
Sue thinks that Bob believes that a dog is eating a bone.
If a dog is eating a bone, it is unwise to try to take it away from him.
В первом предложении для глаголов “think” и “believe” целое предложение является
дополнением: Боб считает, что “А dog is eating a bone”, то, что думает Сью
представляет собой более сложное предложение-“Bob believes that a dog is eating
a bone”. Такое гнездование предложений внутри других предложений может
повторятся сколь угодно большое количество раз. Чтобы изобразить такое
предложение, необходимо использовать пропозиционные узлы, которые содержат
гнездящиеся графы. На рисунке 4 изображена пропозиционная сеть для этого
предложения. Отметим, что (EXP) - experiencer, то есть тот кто испытывает,
соединяет THINK с Сью, а BELIEVE с Бобом, однако EAT и DOG соединены между собой
агентивным отношением (AGNT). Причиной разного типа отношений является тот факт,
что думать и считать-это состояния, испытываемые людьми, а поедание-это действие
осуществляемое агентом.
Во втором примере представлены два предложения, находящиеся в отношении условия.
Антецедентом является предложение “А dog is eating a bone”, а консеквентом
предложение “It is unwise to try to take it away from him”. Инфинитивы “to try”
и “to take” указывают на другие, гнездящиеся предложения. На гнездящиеся
предложения также указывает оборот “it is unwise”. Для этого предложения также
необходимо указать соответствие между “it”, “him” и “bone” и “dog”. Связи
соответствия обозначены пунктиром. Для формальной записи этого предложения также
используются кванторы общности и существования и некоторые элементы логики.
Все реляционные графы и графы с центром в глаголе имеют много общего. Однако
среди них существуют также и отличия:
1. Включение контекста или всего лишь его условное обозначение с отсылкой на
схеме.
2. Строгое гнездование: один и тот же концепт может или не может встречаться в
двух разных контекстах, ни один из которых не гнездиться в другом.
3. Указание связей соответствия. При перекрещивающемся контексте, то есть когда
они один и тот же концепт встречается в двух разных контекстах, эти связи не
указываются.
Однако это всего лишь стилистические расхождения, которые не влияют существенно
на логику построения.
ИЕРАРХИЯ ТИПОВ.
Иерархия типов и подтипов является стандартной характеристикой семантических
сетей. Иерархия может включать сущности: ТАКСА