WWW.KNIGI.KONFLIB.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

 
<< HOME
Научная библиотека
CONTACTS

Pages:     || 2 | 3 | 4 | 5 |   ...   | 7 |

«Базы знаний для описания информационных ресурсов в молекулярной спектроскопии. 1. Основные понятия Привезенцев А.И., Фазлиев А.З. Электронные библиотеки, т.14, в.1, 2011 ...»

-- [ Страница 1 ] --

Базы знаний для описания информационных ресурсов в

молекулярной спектроскопии. 1. Основные понятия

Привезенцев А.И., Фазлиев А.З.

Электронные библиотеки, т.14, в.1, 2011

http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2011/part1

Аннотация

В работе представлено описание основных понятий, использованных при построении

информационной системы трехслойной архитектуры. Слой знаний этой системы содержит

базу знаний, используемую приложениями для семантического поиска, интеграции и систематизации (частично автоматической) информационных ресурсов по количественной молекулярной спектроскопии. База знаний представлена в форме прикладных онтологий, с помощью которых решаются перечисленные выше задачи.

Основное внимание сконцетрировано на интерпретации понятия «онтология», введенном в работах Н. Гуарино.

Введение Типичными компонентами работы исследователя, занимающегося анализом предметной области, являются сбор фактов, построение модели предметной области, соотнесение собственной модели с моделями других исследователей, организация доступа другим исследователям к его модели и, на завершающей стадии, публикация модели. При этом возникает ряд вопросов: насколько полный набор фактов имеется у исследователя и не противоречивы ли они; позволяет ли формальный язык спецификаций моделей построить адекватную собранным фактам модель; существуют ли противоречия между собственной моделью и моделями иных исследователей; каким образом организовать быстрый доступ к результатам исследований и т. д.?

Поставленные вопросы возникают при создании информационных систем коллективного пользования. В предлагаемой серии статей, объединенной одним названием, на примере предметной области «Количественная молекулярная спектроскопия», показано, каким образом, и в рамках какого инструментария, могут быть получены ответы на поставленные вопросы.

Выполненная работа состоит из шести частей. В первой части, которой является данная статья, вводятся основные понятия, необходимые для последующего изложения.

Наиболее важным среди них является определение онтологии, используемое затем при создании онтологической базы знаний. Во второй части будут описаны модель данных количественной молекулярной спектроскопии и XML- схемы для молекулы диоксида углерода. В третьей части представлена фактологическая часть (A-box) базы знаний по спектроскопии молекулы диоксида углерода и ее изотопологов. В настоящее время она, наряду с базами знаний информационных ресурсов по молекулам сероводорода, диоксида углерода и аммиака, является наиболее полной по числу достоверных фактов в данной предметной области. В четвертой части рассмотрено программное обеспечение для создания сервисов описания информационных ресурсов в молекулярной спектроскопии. В пятой части дан перечень критериев достоверности в молекулярной спектроскопии, обсуждается проблема достоверности ресурсов и рассмотрены результаты вычислений, связанные с достоверностью ресурсов для трех молекул (вода, диоксид углерода и сероводород). В шестой части обсуждаются вопросы автоматического построения понятийной части (T-box) в прикладной онтологии.

Молекулярная спектроскопия является одним из разделов физики, широко используемых во многих прикладных исследованиях. Предметом изучения молекулярной спектроскопии являются спектральные свойства молекул. Детальное изучение спектральных свойств молекул не закончено до сих пор. Связано это с тем обстоятельством, что в расчетах физических характеристик атмосферы используются сотни тысяч линий, каждая из которых описывается десятком параметров.

Работа с такими массивами данных требует предметной систематизации данных и создания программных средств для их обработки. Такая систематизация проведена теоретиками несколько десятков лет назад, но до сих не представлена в виде, допускающем ее программную реализацию. Поэтапное решение этой задачи осуществляется в проекте Virtual Atomic and Molecular Data Center (VAMDC) [1].

Классификацией данных, сбором, хранением и распространением информационных ресурсов по молекулярной спектроскопии занимается несколько групп, среди которых выделяются две группы, поддерживающие банки данных HITRAN [2] и GEISA[3]. В России работы по созданию информационных ресурсов в области молекулярной спектроскопии ведутся в Институте оптики атмосферы СО РАН с начала 1980-х годов [4].

Стоит отметить, что задача систематизации данных в количественной спектроскопии относится как к задачам спектроскопии, поскольку термины и понятия спектроскопии связаны с содержательной стороной информации о предметной области, так и к информатике в силу того, что её решение во многом определяется организацией сбора, хранения и распространения данных, информации и знаний.

В количественной спектроскопии процесс наполнения данных далек от завершения. За почти сорокалетнюю историю группа, поддерживающая HITRAN, несколько раз модифицировала как набор физических сущностей (интенсионал), так и типы данных, в которых они хранятся. Такие модификации связаны с тем, что современная техника измерения спектров позволяет получать данные с большей точностью и в тех диапазонах длин волн, в которых ранее измерения не проводились. Количество расчетных спектров растет еще более стремительно, например, за последние десять лет данные по молекуле воды выросли более чем в сто раз. Растет также число исследовательских групп. Все это указывает на необходимость сбора, хранения, обработки и распространения информации с использованием современных технологий для коллективной работы с ней, на базе информационных систем.

Оцифровка спектральных данных имеет почти сорокалетнюю историю, но качественный скачок в создании информационных систем (ИС) в этой предметной области произошел с появлением доступа к интернету в начале 1990-х и глобальной информационной системы веб [5]. Веб-технологии позволили сделать значительный шаг в развитии информационновычислительных систем (ИВС) коллективного использования по молекулярной спектроскопии. В 1999 году появилась первая веб-информационная система «Спектроскопия атмосферных газов» (http://spectra.iao.ru) [6], опирающаяся на известные банки спектроскопических данных HITRAN и GEISA.

В последние годы произошло переосмысление принципов создания ИВС, как в целом в информатике [7], так и, в частности, в молекулярной спектроскопии [8]. Это связано с инициативой World Wide Web Consortium (W3C) по преобразованию Web в Semantic Web [9], где декларируется представление информации, используемой компьютерами, для автоматизации, интеграции и повторной используемости приложениями [10]. В рамках этой инициативы ведутся активные работы по созданию инфраструктуры Semantic Web, создаются рекомендации [11-13], программное обеспечение и онтологические базы знаний. Эти рекомендации являются элементами технологий, актуальными при представлении знаний в глобальном информационном прстранстве (вебе).

При современном подходе к построению модели научной информационновычислительной системы (НИВС) используют её трёхслойную модель [7]. В число слоев входят: слой данных и вычислений, слой метаданных (информации) и слой знаний.

Слой данных и вычислений предназначен для непосредственного решения предметных задач, информационный слой ориентирован на компьютерную генерацию информации о данных предыдущего слоя и возможности обмена этой информацией между программами.

Цель разработчиков ИС состоит в представлении подобной информации в формализованном и машинно-обрабатываемом виде. Эта задача в рамках подхода Semantic Web, как известно, решается с помощью языков разметки XML [13] и RDF [15].

Слой знаний необходим для машинной интеграции и структурирования разнородных ресурсов из различных предметных областей с возможностью унифицированного доступа к ним в рамках информационной системы, и последующей их логической машинной обработки. Этот слой создается на основе онтологий, для описания которых рекомендован язык спецификации OWL [16]. Однако использование этого языка не дает однозначного ответа, что же строится с его помощью, или, другими словами, что же есть онтология, построенная в Semantic Web. Определение этого понятия при создании слоя знаний остается за исследователем. В данной работе, создавая онтологическую БЗ, мы следуем определениям Гуарино [32].

В нашей работе слой знаний для информационной системы по количественной спектроскопии является основным предметом исследования. Этот слой основан на базах знаний (БЗ) информационных ресурсов по количественной спектроскопии. В свою очередь БЗ ориентирована на решение задач, в основании которых лежит использование информационных аспектов этих ресурсов. К числу таких задач относятся систематизация ресурсов, их поиск и исследование их достоверности по ряду критериев, характерных для данной предметной области.

Для предметной области молекулярной спектроскопии введение в модель ИС слоя метаданных и слоя знаний даёт возможность исследователям проводить анализ решений задач и проверять согласованность своих неявных знаний с другими научными логическими теориями [75]. Кроме этого исследователи, анализируя получаемое знание о результатах решения предметных задач, могут своевременно реагировать на важные сведения, например, о недостоверных данных.

Создание W3C рекомендаций RDF и OWL заставило переосмыслить роль метаданных в информационных системах. На базе этих рекомендаций построен базис для формирования инструментов и сервисов для разработчиков информационных систем с целью “проектирования и реализации высококачественных, значимых, корректных, минимально избыточных и хорошо аксиоматизированных онтологий” [14]. С их помощью должна быть решена следующая ключевая задача – создание машинно-обрабатываемых аннотаций для информационных ресурсов в вебе.

Онтология задач, разработанная Лабораторией прикладных онтологий [17] и реализованная в KIF и OWL Full, является онтологией верхнего уровня, которую можно использовать при решении задач коллективного машинного использования знаний в рамках парадигмы Semantic Web. Стоит отметить работы [18, 19], представляющие прикладные онтологии решения задач. В настоящее время развитый в них подход лежит вне рамок развития Semantic Web.

Рассматриваемая в третьей части статьи фактологическая часть онтологии информационных ресурсов молекулярной спектроскопии воды представляет собой «domain-lightweight-reference» онтологию, то есть предметную ссылочную онтологию, которая основной акцент делает на составление описательной картины предметной области, не изменяющейся во времени и являющейся основой для других онтологий.

Онтология задач молекулярной спектроскопии воды представляет собой «domainlightweight-application» онтологию, то есть предметную онтологию приложения, которая основной акцент делает на индивиды, динамически формирующиеся во время описания решаемых задач в информационной системе с определенными входными предметными данными. Заметим, что первая упрощенная версия ссылочной онтологии по молекулярной спектроскопии воды была опубликована в [20].

Прикладные онтологии, связанные с приложениями, формализованы таким образом, чтобы с ними можно было работать в реальном масштабе времени (например, машинное отнесение фактов к классам осуществляется за небольшой промежуток времени). Они созданы, в частности, для решения задачи семантического поиска источников данных, характеризующих решения конкретных задач молекулярной спектроскопии воды. По выделенной цели и выразительности такие онтологии, согласно классификации, называют прикладными онтологиями [21].



Pages:     || 2 | 3 | 4 | 5 |   ...   | 7 |
 


Похожие работы:

«Xperia™ V LT25i Содержание Xperia™ V Руководство по эксплуатации Начало работы Информация о руководстве по эксплуатации Android™ — что и почему? Основные элементы телефона Детали устройства Включение и выключение телефона Блокировка и разблокировка экрана Руководство по настройке Учетные записи и услуги Знакомство с основными функциями устройства Использование клавиш Использование сенсорного экрана Аккумулятор Экран блокировки Начальный экран Создание снимка экрана Доступ и работа с...»

«Приятного чтения! Оглавление Алгебра элементарные алгоритмы Функция Эйлера и её вычисление Бинарное возведение в степень за O (log N) Алгоритм Евклида нахождения НОД (наибольшего общего делителя) Решето Эратосфена Расширенный алгоритм Евклида Числа Фибоначчи и их быстрое вычисление Обратный элемент в кольце по модулю Код Грея Длинная арифметика Дискретное логарифмирование по модулю M алгоритмом baby-step-giant-step Шэнкса за O (sqrt(M) log M) Диофантовы уравнения с двумя неизвестными: AX+BY=C...»

«Конференция Организации Объединенных Наций на высоком уровне по сотрудничеству Юг-Юг Найроби, 1–3 декабря 2009 года Предварительная повестка дня и организация работы Записка Секретариата I. Предварительная повестка дня 1. Открытие Конференции. 2. Выборы Председателя Конференции. 3. Утверждение правил процедуры. 4. Утверждение повестки дня и другие организационные вопросы. 5. Выборы должностных лиц помимо Председателя. 6. Полномочия представителей на Конференции: a) назначение членов Комитета по...»

«Утвержден приказом Министерства образования и науки Российской Федерации от 200 г. № Регистрационный номер _ ФЕДЕРАЛЬНЫЙ ГОСУДАРСТВЕННЫЙ ОБРАЗОВАТЕЛЬНЫЙ СТАНДАРТ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ по направлению подготовки 132 Б - ТЕХНОЛОГИЯ И ПРОЕКТИРОВАНИЕ ТЕКСТИЛЬНЫХ ИЗДЕЛИЙ Квалификация (степень) Бакалавр Москва 2009 2 ОБЩИЕ ПОЛОЖЕНИЯ Направление подготовки Технология и проектирование текстильных изделий утверждено приказом Министерства образования и науки Российской Федерации от №_...»

«Глава: 1 Введение 5 5 Что Вам необходимо 5 Активизация iPhone 6 Обновление оригинального iPhone 6 Установка SIM-карты 7 Регистрация iPhone 7 Синхронизация с iTunes 13 Учетные записи для Mail, Контактов и Календаря 15 Установка профилей конфигурации 16 Отключение iPhone от компьютера Глава: 2 Основные сведения 17 17 iPhone: краткое знакомство 21 Экран Домой 24 Кнопки 27 Сенсорный экран 29 Экранная клавиатура 33 Стереонаушники с микрофоном 34 Подключение к Интернету 36 Аккумулятор 38 Уход за...»

«КАК РМИТЬ НАКО ЛОНА? С ИЛИ ПЕРВЫЕ ШАГИ К САМОРЕАЛИЗАЦИИ С EVERNOTE Предупреждение Данная электронная книга не одобрена корпорацией Evernote® и не является официальным гайдом или же руководством корпорации Evernote®. В ней лишь заключено личное мнение автора и то, что вы можете сотворить со своими данными в аккаунте Evernote®, целиком и полностью лежит на вашей ответственности :). Содержание ИНТРО ГЛАВА 1: Удовлетворение организационного зуда ГЛАВА 2: Что делал слон, когда пришел на поле он?...»

«СОХРАНИТЕ ВАШ АКТИВ №1 Советы Богатого Папы как превратить Ваши идеи в актив Самое большое ваше богатство - это ваши идеи и ваше время Богатый папа Воображение намного важнее знания А. Эйнштейн Предисловие У меня нет времени!, У меня еще есть много времени! - и те и другие слова мне часто приходится слышать от людей, с которыми я общаюсь. И то, и другое утверждение верно для того человека, который это произносит. Вопрос только в том, на что мы тратим наш самый ценный актив - время. Мой богатый...»

«Содержание В. Г. Гусакова. Поздравление от аграрного отделения нан Беларуси. 3 З. В. Ловкис. 10 лет в Пищевой Промышленности А. А. Шепшелев. международное сотрудничество: резулЬтаты и ПерсПективы развития К. И. Жакова, Е. С. Колядич. Продукты Питания для людей Пожилого возраста И. А. Громова, И. М. Почицкая. система контроля качества Пищевой Продукции и сырЬя в ресПуБлике БеларусЬ Н. Н. Петюшев. участие руП научно-Практический центр нан Беларуси По ПродоволЬствию в реализации круПных...»






 
© 2013 www.knigi.konflib.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.