WIN - KOI - DOS - ISO - MAC - LAT



ТЕХНОЛОГИЯ ГИПЕРТЕКСТА И СОЗДАНИЕ КОРПОРАТИВНЫХ РЕСУРСОВ (Базы данных для геоботанических исследований)


к.г.н. М. Тентюков, студент СыкГУ М. Подоров

Технология гипертекста и формирование корпоративных ресурсов. Внедрение информационных и компьютерных технологий в научные исследования активно способствует формированию интегрированной информационной среды [11] и созданию корпоративных информационных ресурсов в различных областях научного знания [3, 5, 7]. Последнее во многом обязано активным разработкам телекоммуникационных технологий с использованием систем гипертекстовой разметки документов. Хотя понятие гипертекста было введено Бушем (Bush) [16] еще в 1945 г., интерес к этой технологии быстро стал проявляться лишь тогда, когда возникла реальная необходимость в механизме объединения информационных ресурсов и обеспечения возможности создания и просмотра нелинейного текста [1, 6, 9].

До недавнего времени главной информационно-структурной единицей электронного обмена данными являлся HTML-документ, который представляет собой обычный текстовый файл, содержащий определенный набор тэгов (ключевые слова, аббревиатуры), заключенные в угловые скобки. При составлении HTML-документа используется язык разметки гипертекста (Hypertext markup language), который повсеместно используется для конструирования web-страниц [1]. Главной особенностью разметки HTML является возможность вставки гиперссылок на внеш-ние документы или на внутренние разделы того же самого документа. По сути HTML – это технология создания информационных ресурсов в Интернете, описывающая то, как программа просмотра HTML-документа должна скомпоновать текст и графику на web-странице. Но при этом HTML имеет ограниченные возможности структурирования HTML-документа. Поэтому с увеличением объема электронных документов эти недостатки HTML стали тормозить электронный документооборот в Интернете. В феврале 1998 г. Международный консорциум World Wide Web (w3c) предложил XML (extensible markup language) [9, 10, 17-21].

XML – это метаязык, определяющий другие языки разметки для специфических целей [12]. С его помощью можно описать целый класс объектов данных, передаваемых XML-документами, ориентированными на конкретную предметную область. При этом составитель XML-документа, в отличие от составителя HTML-документа, не ограничен каким-либо фиксированным набором тэгов. Эта возможность является ключевой, позволяющей по-новому организовать обмен данными в Интернете. Другой важной особенностью XML является возможность избирательного представления данных в формате, удобном для пользователя. Для этого в настоящее время уже имеются приложения, позволяющие преобразовать XML-документы в другие форматы, такие, например, как HTML или RTF. Одновременно с этим XML представляет механизм для интерактивной работы с данными прямо из браузера. Кроме того, XML может выступать в качестве промежуточного программного обеспечения, позволяющего программистам создавать XML-документы, управлять их логической структурой и добавлять в нее изменения, модифицировать элементы и атрибуты XML-документа. Все это позволяет рассматривать XML как новую технологию с открытым и эффективным стандартом для сотрудничества в области формирования корпоративных информационных ресурсов [14, 15]. XML-документы исполняют роль универсального стандарта для обмена информацией. XML может быть использован в качестве базового стандарта для нового языка описания корпоративных информационных ресурсов и создания электронных библиотек из баз данных; может быть использован в обычных приложениях для хранения и обработки структурированных данных в едином формате (векторная графика, текстовая информация).

XML-документы, являясь простыми текстами, идеально переносимы между различными операционными системами и компьютерными платформами. И если в какой-либо предметной области принят единый XML-совместимый язык, то базы данных, написанные с использованием этого языка, можно легко переносить между разработчиками и совместно использовать. Поэтому в Институте биологии при формировании баз данных для ботанических исследований в качестве основного формата хранения был выбран XML-формат.

Электронные справочники "Salix" и "Ribes" как прототипы корпоративных информационных ресурсов для ботанических исследований. База данных "Salix" составлена по [2]. В электронный справочник включены сведения, касающиеся номенклатуры всех сосудистых растений Республики Коми, включенных в четырехтомную сводку "Флора северо-востока европейской части СССР" (1974-1977). В нем приведено 1300 видов сосудистых растений региональной флоры из 477 родов и 111 семейств, даны уточненные названия таксонов в соответствии с требованиями "Международного кодекса ботанической номенклатуры". Использование справочника позволит избегать ошибок при систематическом анализе флор и может представлять интерес как электронное пособие по региональной ботанической номенклатуре.

"Ribes" – это электронный справочник по интродуцированным растениям. Справочник работает в интер-активном режиме и представляет собой интерфейс к базе данных, составленной на основе [4]. В электронном справочнике приведена биологическая характеристика 210 видов изучавшихся в коллекционных питомниках кормовых и лекарственных растений Ботанического сада Института биологии Коми НЦ УрО РАН с 1946 по 1998 гг.

Программа, использованная при разработке баз данных "Salix" и "Ribes" разработана с использованием системы программирования Delphi 3.0. Данные хранятся в XML-формате в заархивированном виде внутри исполняемого файла, что обеспечивает компактность готовой разработки. Программа позволяет осуществлять поиск названий растений как по русскому, так и по латинскому написанию. Окно программы находится в режиме "всегда впереди", т. е. поверх остальных окон, независимо от активности. Программа позволяет составлять списки растений с последующим выводом их на печать. При составлении флористических списков обеспечен быстрый и оперативный доступ к информации, размещенной в базе данных.

Информационная система* для инвентаризации региональных флор сосудистых растений

Описание программного решения. При разработке информационной системы для инвентаризации региональных флор с использованием системы программирования Delphi 3.0 была разработана специальная программа, обеспечивающая процесс создания пользователем самостоятельно распространяемых программ и связанных с ними баз данных, представляющих один исполняемый файл. Эти исполняемые файлы одновременно являются файлами данных, которые можно редактировать в основной программе. Программа работает на ПК под управлением настольных ОС Windows (95/98/2000/NT). С ее помощью информация, хранящаяся в базе данных XML-формата, извлекается и компонуется. При этом создаются готовые к запуску программы, содержащие базы данных, объем которых определяется задачами исследователя (инвентаризация региональной флоры, составление флористических списков, систематический анализ флор). Программа позволяет просматривать списки растений, сгруппированные по систематическому принципу. В ней обеспечен быстрый и оперативный доступ к информации, размещенной в базе данных системы, которая подготовлена по [8]. В базе данных системы приведено 21770 видов и 500 подвидов дикорастущих (как аборигенных, так и заносных), а также успешно натурализовавшихся одичавших культурных растений, относящихся к 1945 родам и 216 семействам. Написание в ней названий родов и видовых эпитетов соответствует книге Черепанова С.К. “Сосудистые растения...”. Исправление ошибок в названиях растений осуществляется на основе информации, присланной пользователями через Web-интерфейс. Обновленная версия программы и базы данных передаются пользователю через Интернет. База данных системы включена в Государственный регистр баз данных за № 0220006850 (регистрационное свидетельство № 6462 от 04.09.2000).

Пример технологии обмена локальными базами данных при инвентаризации региональных флор. Для организации электронного обмена локальными базами данных при инвентаризации региональных флор через Интернет предусмотрен набор активных правил управления программой. Этот набор правил предусматривает составление локальной базы данных, объем которой ограничен 6000 записей. Локальная база данных может быть отправлена по сети в виде файл-программы. При этом получатель может изменить присланный список растений в базе данных. Для этого пользователь должен будет запустить программу "PV", содержащую главную базу данных и открыть в ней присланный файл. Внеся соответствующие дополнения в список растений, пользователь может его вновь отправить адресату. При этом отправитель и получатель имеют равные права на редактирование локальной базы данных. Такая информационная совместимость главной базы данных с локальными базами данных осуществляется через общую модель взаимодействия, реализованную на основе XML-технологии. Созданные таким образом информационные ресурсы в виде локальных баз данных со списком региональных флор могут свободно обмениваться по Интернету пользователями, что будет, несомненно, содействовать формированию корпоративных информационных ресурсов, а использованная технология – созданию интегрированной информационной среды, в которой проведение ботанических исследований будет поставлено на новый качественный уровень.

Заключение. Информационные системы "Salix", "Ribes", "PV-1", "Plantae vasculares" положили начало новому направлению работ в Институте биологии, которые связаны с формированием электронных корпоративных информационных ресурсов для ботанических исследований. Системы "Salix", "Ribes", "Plantae vasculares" размещены на web-сайте Института биологии по адресу http://ib.komisc.ru/pv/, а также на ftp-сервере Института биологии – ftp://ib.komisc.ru/pub/IBPrograms/AutoSystems/

Развитие найденных программных решений предусматривает разработку информационно-технологической платформы с возможностью объединения информационных систем, разработанных ранее, включая условия, позволяющие произвольно расширять описания видов растений с учетом конкретных задач, связанных с изучением региональных флор. Это предполагает создание открытой автоматизированной системы с расширяемым форматом хранения данных на основе XML-совместимого языка. Открытость системы также подразумевает предоставление полных исходных текстов системы для возможной настройки под потребности конечного пользователя и возможность для пользователя самостоятельно увеличивать структурные и количественные параметры базы данных с учетом конкретных исследовательских задач (изучение биоразнообразия региональных флор, подготовка географических и флористических списков, выполнение систематического анализа флор).

ЛИТЕРАТУРА

1. Браун М., Ханикатт Д. HTML 3.2 в подлиннике. СПб., 1998. 1040 с.

2. Груздев Б.И., Мартыненко В.А., Тарбаева В.М. Современная номенклатура сосудистых растений европейского Северо-Востока России. Сыктывкар, 1999. 110 с.

3. Кирмайер М. Мультимедиа. СПб. 1994. 192 с.

4. Мишуров В.П., Волкова Г.А., Портнягина Н.В. Интродукция полезных растений в подзоне средней тайги Республики Коми (итоги работы Ботанического сада за 50 лет). СПб.: Наука, 1999. Т. 1. 229 с.

5. Пилюгин В.В., Сумароков Л.П., Фролов К.В. Машинная графика и автоматизация научных исследований // Вестн. АН СССР, 1985. № 10. С. 50-58.

6. Питц-Моулитис Н., Кирк Ч. XML. СПб., 2000. 736 с.

7. Полани М. Неявное знание. М.: Прогресс. 1984. 141 с.

8. Черепанов С.К. Сосудистые растения России и сопредельных государств (в пределах бывшего СССР). СПб., 1995. 992 с.

9. Hay D. XML: What is it, anyway? // Intelligent Enterprise, 1999. Vol. 2, № 11. P. 12-13.

Интернет-публикации

10. Беленький Ю. Extensible markup language. Обзор – http:// www.softerra.ru/ review/technologies/microft/6254/

11. Верников Г. Технологическая эволюция корпоративных информационных систем – www. citforum.ru/vernikov

12. Календарев А. Понятие XML/EDI – http:// www. citforum. ru/internet/ articles/ xmledi.shtml

13. Печерский А. Модная технология сайтостроительства – http:// www.softerra.ru/review/internet/7926

14. Ричардсон Р. XML превосходит самое себя – http:// www. citforum. ru/internet/ articles/ xml_010.shtml

15. Эйнджел Д. XML: время пришло – http:// www. citforum. ru/internet/ articles/ xml_099.shtml

16. Vannevar B. As we may think. The Atlantic Monthly, July 1945 – http:// www.theatlantic.com/unbound/flashbks/computer/bushf.htm

Интернет-ресурсы

17. http://www.citforum.ru/internet/xml (введение в XML, статьи по XML)

18. http://www.Oasis-open.org/cover/ xml.html (руководство по XML)

19. http://www.Xml.com (открытый сервер пользователей XML)

20. http://www.Xmls.com (открытый сервер XML)

21. http://www.w3.org/tr/1989/rec-xml (рекомендации группы W3 по использованию XML)

Логотип - Начало - Общие сведения - Структура - Научная деятельность
Информационные ресурсы - Новости - Поиск по серверу - Карта сервера

поиск по серверу

4225 посещений с 13.09.2001
Последнее изменение 07.09.2001

(c) Institute of Biology, 1999