Некоторые аспекты анализа развития нечетких онтологий
| Е. И. Кучеренко |
| Д. А. Павлов |
Содержание |
Аннотация
В работе вводится понятие нечеткой онтологии. Рассматривается ряд вопросов, связанных с представлением в онтологии нечетких знаний и отношений, а также делается ряд важных обобщений. Предлагается развитие методов критериальной оценки адекватности изменений онтологий при развитии для нечеткого пространства состояний. Теоретические результаты подтверждены рекомендациями к практическому использованию.
Введение
Представление нечеткой информации в онтологии является предметом ряда важных исследований [1-3]. Это актуально в связи с тем, что онтология, будучи формальным отображением реальности, требует четкого представления информации, а реальность не всегда может быть четко выражена. Такое несоответствие порождает сложности концептуального характера. Среди таких сложностей — реализация процедур адекватного нечеткого логического вывод, реализация адекватных блоков интеграции онтологической информации и прочее. Но, не смотря на указанные проблемы, существует ряд задач, для которых объективно существует нечеткое представление знаний. Среди них: работа с естественным языком, описание сложных процессов, создание словарей и тезаурусов и многое другое в условиях субъективного отображения реальности. Из вышесказанного следует, что использование нечетких онтологий, возможно в рамках некоторых ограничений, будет иметь место, и, соответственно, их исследование представляет, как научный, так и практический интерес.
Создание нечеткой онтологии, также как и онтологии функционирующей в четком пространстве состояний, сопряжено с итеративным процессом накопления и представления знаний, в результате которого мы имеем ряд версий нечетких онтологий
, упорядоченный в пространстве времени
.
Сопоставление версий с целью выявления их адекватности предметной области и отличий между собой является полезным средством, позволяющим повысить эффективность работы разработчика онтологий, что наглядно демонстрируют современные системы контроля версий [4].
Целью данной работы является повышение эффективности представления и использования знаний на основе создания формальных подходов к сопоставлению нечетких онтологий и выявления их адекватности в процессе развития.
Постановка задачи
Эта работа является очередным этапом в ряде исследований посвященных анализу развития онтологий и созданию системы контроля версий развивающихся онтологий. В ней принимаются все утверждения и определения, данные в [5].
Пусть существуют версии развивающихся нечетких онтологий
, отображающие помимо четких, нечеткие знания, включая представленные в нечетком пространстве состояний.
Требуется:
- провести анализ тенденций с целью обобщения подходов построения нечетких онтологий;
- предложить эффективные средства выявления показателей сформированных в [5] для случая нечетких онтологических пространств, а именно:
- предложить и обосновать формальные критерии выявления неполноты (
) нечеткой онтологической информации:
, (1)
где
версия нечеткой онтологии
в момент времени
,
пространство времени, в котором существует альтернативная версия онтологии;
- предложить и обосновать формальные критерии выявления избыточности (
) нечеткой онтологической информации:
, (2)
- разработать подходы к выявлению и локализации свойств (1) и (2) в условиях нечетко представленных знаний в онтологиях;
- предложить и обосновать формальные критерии выявления неполноты (
- сформулировать рекомендации по практическому использованию теоретических положений работы.
Формальная онтология
Определим формальную модель онтологии для которой разрабатывается механизм сравнения версий.
Утверждение 1. Всякая рассматриваемая онтология
может быть представлена в виде
(3),
где
— иерархия терминологии,
— набор отношений,
— набор утверждений, основанный на
и
.
Утверждение 1 ориентированно на работы, в которых структура онтологии проецируется на существующие подходы дескриптивной логики (ДЛ) [6]. На практике этот подход подтвердил свою эффективность.
Различная степень выразительности онтологий накладывает ряд ограничений на элементы
в (3), а также на их взаимодействие.
В данной работе вводится ограничение на существование в (3) терминологических циклов, в которых некий термин описывается с помощью самого себя, что не всегда приводит к адекватности отображения.
Замечание 1. Набор утверждений
может использовать также элементы-предикаты
в качестве значений свойств, которые тождественны некоторым функциям принадлежности
.
Важно отметить, что расширение онтологии элементами-предикатами является одним из развивающихся направлений развития онтологического представления знаний [7], и используется в работе как средство снижения уровня абстракции примеров.
Анализ подходов к представлению нечеткости в онтологии
Существующие подходы к анализу и сопоставлению версий онтологий [8] имеют ряд функциональных ограничений и принципиальных недостатков, к которым следует отнести: отсутствие возможности работы с нечеткими данными, высокая сложность процедур анализа. Существующие подходы к использованию нечеткости в онтологии [1,2,7,9-10] носят разобщенный характер и не содержат общепризнанных методов.
Отражение нечеткости в онтологии тесно связано с задачей формирования мета-описаний об онтологической информации.
Тогда как экземпляром знаний (утверждением) для всех компонентов из (3) является тройка
где
— «субъект»,
— «предикат»,
— «объект». Мета-описанным утверждением является пара
, (4)
где
— мета-информация об
.
В настоящее время наиболее распространенными методами введения мета-описаний (4) являются следующие подходы [9-10]: реификация, введение мета-отношения и введение мета-класса.
Рассмотрим каждый из подходов:
Реификация заключается в превращении простого утверждения в развернутую структуру
, (5)
где
— некоторый абстрактный объект,
,
и
зарезервированные отношения, обозначающие субъект, предикат и объект соответственно.
Это дает возможность введения дополнительных утверждений об объекте
, который семантически является идентификатором данной тройки.
Введение мета-отношения является реификацией особого рода.
Оно заключается в замещении одиночного предиката
групповым предикатом
, который формально является представителем определенного рода класса.
Например, для простого предиката «работать_в», связывающего некоторый хозяйственный объект и некоторого человека, может потребоваться указание даты, с которой актуальна данная запись.
Тогда создавая некоторый абстрактный класс «Работать_в» можно у него определить набор свойств, среди которых будет «сотрудник» и «предприятие», а также все мета-информационные атрибуты.
Для мета-отношений обязательными свойствами являются свойства «ОТ» и «В» (в примере «сотрудник» и «предприятие»).
При таком подходе простое утверждение преобразуется в
, (6)
где «В» и «ОТ» — зарезервированные отношения, семантически обозначающие начало и конец замещаемого одиночного предиката.
С одной стороны данный подход является более выразительным, нежели подход реификации, так как в описании отношения (6) используются расширенные возможности описания классов. С другой стороны такой подход в значительной степени затрудняет логический вывод, так как теряются стандартные возможности описания отношений, что является существенным ограничением в реализации.
Введение мета-класса предлагает двухэтапное описание утверждения. Первый этап описания связывает субъект с представителем мета-класса. В свою очередь этот представитель содержит непосредственно объект и дополнительную информацию об этом конкретном отношении. То есть
, (7)
где
— представитель мета-класса, а
— семантически эквивалентно
с учетом специфики значения свойства,
— зарезервированный предикат, обозначающий эквивалентность объектов.
Примером мета-класса может служить следующее, для простого предиката «работать_в», взятого из вышеописанного примера, может потребоваться указание даты, с которой актуальна данная запись.
Тогда создавая некоторый мета-класс «Сотрудник_на_предприятии», одним из атрибутов которого может быть непосредственно предприятие, а другим — дата зачисления на службу на это предприятие, получаем возможность разделить конкретную связь «работать_в».
Все три описанных подхода широко применяются и имеют как положительные так и отрицательные стороны [9], но важным аспектом их существования является то, что формально каждое из приведенных описаний может быть преобразовано в одно из двух других. Докажем это.
Теорема 1.
Для всех мета-отношений вида (6) найдется хотя бы одно эквивалентное ему реифицированное утверждение вида
, где
отношение, обозначающее то, что объект является мета-информацией о субъекте.
Докажем теорему 1.
Пусть существует некоторое мета-отношение
, с помощью которого вводится утверждение (6).
Очевидно, что
есть совокупность отношения между объектом и субъектом и мета-описанием этого отношения.
Рассмотрим некоторый объект из (3), равный мета-описанию
.
Введем такое отношение
, что
, то есть семантика отношения
является мета-отношением без учета мета-информации.
Введем ряд простых утверждений
,
,
,
.
Совокупность данных утверждений ни что иное, как реифицированное утверждение (4).
В силу проведенных эквивалентных преобразований оно эквивалентно изначальному набору утверждений.
Считаем теорему доказанной.
Теорема 2.
Для всех мета-отношений вида (7) найдется хотя бы одно эквивалентное ему реифицированное утверждение вида
, где
.
Докажем теорему 2.
Пусть существует утверждение вида (7).
Определим свойство
, которое семантически эквивалентно
, но соединяющее непосредственно субъект и объект.
Введем некоторый объект
, такой, что
, то есть у содержит всю информацию из
, кроме связности с конкретным объектом
.
Аналогично положений доказательства теоремы 1.
Результирующие утверждения эквивалентны изначальному набору утверждений.
Считаем теорему доказанной.
Следствие 1 (из теоремы 1 и 2). Любые реифицированные утверждения можно рассматривать в общем виде (4), не изменяя семантики логических рассуждений.
Опишем нечеткое утверждение
.
Мета-элементом утверждения является функция принадлежности
, введенная для нечетких множеств Заде (L. Zadeh) [11]:
. (8)
в данном случае определяет степень уверенности в существовании утверждения
.
Утверждение 2. Любую онтологию (3), содержащую хотя бы одно утверждение вида (8), будем считать нечеткой.
Замечание 1.
В случае, если значение
в (8), то данное утверждение будет четким, и в таком случае его присутствие не влечет за собой нечеткость онтологии.
Замечание 2.
В случае, если значение
в (8), то это утверждение может быть извлечено из онтологии без влияния на ее семантику.
Результаты Утверждения 2 и Замечаний 1 и 2 имеют важное практическое значение.
Неполнота и избыточность в условиях нечеткости
Алгоритмы анализа адекватности версий онтологий [5] ориентированы на работу с простыми утверждениями. Для эффективной работы с нечеткими онтологиями требуется ряд специфических особенностей, учитывающих в частности (8).
Рассмотрим алгоритм рекурсивного анализа неполноты и избыточности версий онтологии в ракурсе присутствия нечеткости. Значения критериев неполноты и избыточности в четкой онтологии рассчитываются по формуле [5]:
, (9)
где
– свойство объекта
,
– свойство объекта
,
,
,
,
— одна из функций
либо
.
Для решения задачи в условиях нечеткости определим функции.
Утверждение 3. Отличие по неполноте объекта нечеткой онтологии есть нормализованная сумма максимумов между уменьшением в уверенности существования и неполноты данного атрибута данного объекта:
(10)
Действительно, если при изменении версии онтологии уменьшается уверенность в существовании атрибута
у объекта
, это приводит к увеличению неполноты информации обо всем объекте.
В то же время, если увеличивается непосредственно неполнота атрибута
, это также увеличивает общую неполноту.
Увеличение уверенности в существовании связи между объектом
и атрибутом
не влияет на результат вычислений.
Утверждение 4. Отличие по избыточности объекта нечеткой онтологии есть нормализованная сумма максимумов между увеличением в уверенности существования и избыточности данного атрибута данного объекта:
(11)
Действительно, суть Утверждения 4 раскрывается аналогично Утверждению 3.
Учитывая замечание 1, для применения формализмов (10-11) будем преобразовывать утверждения онтологии к нечеткому виду (8) и выполнять решение задачи в общем виде.
Практическая реализация
Пусть существует онтология обслуживающая производственный объект с системой вентиляции, использующий сводки погоды для снижения расхода энергии.
Обозначим ряд свойств объекта Погода, влияющих на учет и прогнозирование: температура, влажность, облачность, ветер.
Для каждого из свойств введем лингвистические переменные: низкое, среднее, высокое.
Значения свойств погоды вводятся как нечеткие утверждения с некоторым значением соответствуют функции принадлежности
.
Для повышения наглядности примера будем рассматривать значения данных свойств как предикаты
, зависящие от фактического значения показателей температуры, влажности, облачности и ветра.
Погода, температура, низкая_температура >
низкое(факт_знач_темп)
Не уходя от общности введем конкретное представление предиката, как
низкое
. (12)
Для термина Погода или
определим ряд подтерминов Душная, Нормальная, Бодрящая или
соответственно.
Все подтермины попарно несовместны, то есть
для
, если
, где
,
.
При чем
,
.
Пусть для каждого из подтерминов существует набор необходимых и достаточных ограничений, оперирующий со свойствами, которые могут быть представлены как:
Душная
Погода
температура.высокое
влажность.высокое
ветер.низкое
Введем понятие Затраты_энергии_на_вентиляцию(зэнв), со свойством при_погоде, для которого существует набор из трех подклассов: низкие_зэнв, средние_зэнв, высокие_зэнв. При чем существуют необходимые и достаточные ограничения такие как:
- высокие_зэнв = Затраты_энергии_на_вентиляцию
при_погоде.Душная,
- средние_зэнв = Затраты_энергии_на_вентиляцию
при_погоде.Нормальная,
- низкие_зэнв = Затраты_энергии_на_вентиляцию
при_погоде.Бодрящая.
Потребность в онтологии подобного вида не подлежит сомнению, в связи с тем, что она позволит решать задачи оптимизации процессов в общем виде. Блок нечеткого логического анализа позволит эффективно извлекать полезную информацию из малого набора утверждений.
Дальнейшее развитие данной онтологии возможно по нескольким ветвям, рассмотрим одну из этих формализмов.
Интерпретация значения температуры подвержена влиянию разных обстоятельств, в частности времени года. Так для периода зима высокой можно считать температуру 15 градусов, тогда как для периода лето такая температура будет нормальной, а возможно даже и низкой. Тогда имеет смысл определить для объекта температура свойство времени замера, которое влияет на смещение нечетких понятий относительно оси измерений. Тогда (12) примет другой вид:
низкое
, (13)
где
некоторая функция зависимости от времени.
Переход от (12) к (13):
- изменит вычисляемое значение коэффициента
, который станет более адекватным данной ситуации. Это приведет к изменению значений функций (10-11) для данного утверждения.
- свяжет утверждения о температуре с утверждениями о времени, что также отразится на численных значениях (10-11).
Выводы
- Выполнен анализ тенденций и общих подходов к построению нечетких онтологий. Сделан ряд важных обобщений.
- Впервые предложены формальные критерии и отображения нечеткой онтологии на основе обобщенных мета-элементов.
- Получили дальнейшее развитие формальные критерии выявления
и
для случаев нечетких отношений.
- Определено, что данное направление является перспективным при реализации в условиях нечетких знаний и нечетких отношений, что определяет практическую значимость результатов работы.
Использованные источники
- Straccia U. Towards a Fuzzy Description Logic for the Semantic Web // 2nd European Semantic Web Conference, 2005. – P. 167-181.
- Quan T. T., Hui S. C., Cao T. H. FOGA: A Fuzzy Ontology Generation Framework for Scholarly Semantic Web // http://olp.dfki.de/pkdd04/quan-final.pdf (05.07.2005)
- Mazzieri M. A Fuzzy RDF Semantics to Represent Trust Metadata // Proceedings of the Workshop Fuzzy Logic and the Semantic Web, Marseille, February 11, 2005
- Fish S. The New Breed of Version Control Systems // http://www.onlamp.com/pub/a/onlamp/2004/01/29/scm_overview.html (04.07.2005)
- Кучеренко Е.И., Павлов Д.А. О проблемах выявления неполноты и избыточности информации в онтологическом пространстве // Прикладная радиоэлектроника. 2005. N 2.
- Ian Horrocks, Peter Patel-Scheider. Reducing OWL Entailment to Description Logic Satisfiability. // J. Web Sem. 1(4). 2004.– P. 345-357
- Straccia U. Description Logics with Fuzzy Concrete Domains // http://dienst.iei.pi.cnr.it/Dienst/UI/2.0/Describe/ercim.cnr.isti/2005-TR-03?tiposearch=cnr&langver= (05.07.2005)
- PROMPT // http://protege.stanford.edu/plugins/prompt/prompt.html (04.07.2005)
- Defining N-ary Relations on the Semantic Web // http://www.w3.org/TR/2004/WD-swbp-n-aryRelations-20040721/ (04.07.2005)
- RDF/XML Syntax Specification // http://www.w3.org/TR/rdf-syntax-grammar/ (04.07.2005)
- Zadeh L.A. Fuzzy Sets // Information and Control, 8(3). 1965. – P. 338-353,