в

Kazan Dev Alliance

Казанское Сообщество Разработчиков Программного Обеспечения

Проповеди по информатике

Computer Science Evangelism. Алгоритмы, технологии, модели.

Синтаксис Семантического веба

Технологии Веб нового поколения должны обеспечивать возможности автоматизированной интерпретации и обработки информации, семантической интероперабельности информационных ресурсов. В этих условиях уже недостаточно располагать синтаксическим описанием XML-документов с помощью DTD или XML Schema. Например, при обмене документами, описанными средствами этих языков, обе обменивающиеся стороны должны одинаковым образом понимать смысл используемых в документах типов элементов и атрибутов элементов, а также содержащихся в них гиперссылок, о чем заранее должны быть приняты соответствующие договоренности, описанные вербальным или иным образом.

Необходимость решения указанных задач вызвала потребность в таких средствах формального описания семантики XML-данных, которые бы позволяли анализировать и обрабатывать их с помощью программного обеспечения.

Первым шагом консорциума W3C в рассматриваемом направлении было создание стандартов RDF (Resource Definition Framework) и RDFS (RDF Schema).

В RDF-спецификации объявляется некоторое множество ресурсов, для каждого из которых определяются пары "свойство-значение". Информационные ресурсы в RDF - это ресурсы Веб, идентифицируемые уникальным образом с помощью их URI. Они могут также представлять собой коллекции других информационных ресурсов или литералов, называемые контейнерами. Допускаются контейнеры типа мультимножества, последовательности и альтернативы. Значения свойств задаются литерально либо могут быть другими ресурсами, которые представляются, в свою очередь, их свойствами. Таким образом, свойства могут определять и связи между ресурсами.

Смысл выражается посредством языка RDF, который кодирует его с помощью множества триплетов [triple], где каждый триплет состоит из субъекта, глагола и объекта элемен­тар­но­го пред­ло­жения. Такие триплеты можно записать с по­мощью тэгов языка XML. В языке RDF документ состоит из утверждений о том, что нечто (человек, веб-страница или что-либо ещё) имеет определённое отношение (как то «быть сестрой», «быть автором») с некоторым определённым значением (другой человек, другая веб-страница). Подобная структура оказывается весьма естественной для описания подавляющего большинства машинно-обрабатываемых данных. Субъект и объект задаются с помощью Единообразного Идентификатора Ресурса (Uniform Resource Identifier, URI), подобно ссылкам на веб-страницах. (URL — Универсальный Локатор Ресурса (Universal Resource Locator) — представляет собой наиболее распространённый тип URI). Глаголы тоже задаются посредством URI, что позволяет определять новое понятие или новый глагол, просто указав его URI-адрес в Сети.

Человеческий язык процветает благодаря тому, что одно и тоже слово может иметь несколько значений; но это совсем не так для языка машинного. Представьте себе, например, что я нанимаю клоунов-курьеров для доставки воздушных шариков моим клиентам на их дни рождения. Совершенно не кстати, эта развлекательная служба перекачает мою базу данных с адресами клиентов себе, не зная, что «адрес» в моей базе данных — это то место, куда доставляются счета, и что большинство из них — абонентские ящики в почтовых отделениях. В итоге мои клоуны повеселят почтовых работников — что само по себе, возможно, не так уж и плохо, но, очевидно, это не то, чего хотелось изначально. Подобная проблема решается использованием различных URI для каждого конкретного понятия. Почтовый адрес тогда можно будет отличить от адреса проживания, и оба эти понятия, в свою очередь, можно будет отличить от понятия «адресовать речь кому-либо» [an address that is a speech].

Из триплетов языка RDF формируются сети информации о взаимосвязанных вещах. Поскольку RDF использует URI-идентификаторы для кодирования данной информации в документе, эти самые URI-идентификаторы гарантируют то, что каждое понятие, используемое в документе — это не просто слово, а нечто, привязанное к единому определению, которое каждый желающий может найти в Сети. Например, представим себе, что у нас есть доступ к нескольким базам данных о людях, содержащим их адреса. Если теперь мы хотим найти тех людей, которые живут в районе с неким заданным почтовым индексом, то нам нужно будет знать, какое именно поле в каждой из баз данных представляет собой имя, а какой — почтовый индекс. Это можно выразить на языке RDF в виде: «(поле 5 в базе данных A)(является полем типа)(почтовый индекс)», используя URI-идентификаторы вместо слов для каждого термина.

Здесь я описал как-бы синтаксис без синтаксиса ) все на основе знаменитой статьи Tim Bernes-Lee

Далее, я напишу, что, на самом деле, не так все и радужно в мире семантики :) есть критика и, кстати говоря, много критики.. Постараюсь осветить все альтернативные взгляды на семантический веб.

И еще несколько ссылок на русскоязычные ресурсы:

http://www.semantictools.ru/ - сайт посвященный полностью семантическому вебу и онтологиям

http://www.semanticweb.narod.ru/ - тоже отличный сайт о SW

Комментарии

Нет комментариев

Оставить комментарий

(required)  
(optional)
(required)  

© 2007 Kazan Developers Community and Post`s Authors