ПРАКТИЧЕСКИЙ ОПЫТ РАЗРАБОТКИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ УФОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ
|
Николай Субботин (Пермь), Анатолий Быченков (Москва) |
Ноябрь 2002 года |
ВВЕДЕНИЕ
|
Современная уфология, как и любая другая научная дисциплина, требует профессиональных подходов к накоплению и анализу профильной информации. Общедоступными инструментами для этих целей служат персональный компьютер и специализированное программное обеспечение: информационные массивы в виде баз данных и программные инструменты для их обслуживания. |
Базы данных создаются для решения конкретных задач поиска, накопления, хранения, обработки и выдачи информации. Разработки профессионального уровня позволяют, в частности, унифицировать и стандартизовать процесс ввода и обмена информацией с другими пользователями подобного программного обеспечения, а также осуществлять различные статистические исследования, которые представляют значительный самостоятельный интерес. |
Информация, использование которой актуально для уфологических исследований, на сегодняшний день по признаку происхождения можно классифицировать следующим образом: |
* Фактографическая информация - данные, собранные в ходе устных опросов и письменных свидетельств, полученных от очевидцев, а также личные наблюдения исследователей, формализованные в виде анкет. |
* Новостная информация - статьи и материалы, публикуемые в СМИ и размещаемые в Интернете, об актуальных событиях, представляющих интерес для уфологических исследований. |
* Фундаментальная информация - книги, обзоры, аналитические материалы, электронные массивы данных, хранящие совокупность сведений и результаты их анализа на различных этапах исследований. |
Специализированная база данных для уфологических исследований должна учитывать использование перечисленных источников информации. Ее создание реализуется в следующей последовательности: |
1. Анализ информационной области, определение входящих информационных потоков. |
2. Проектирование структуры БД: распределение первично выявленных характеристик по таблицам и полям, создание правил формализации обрабатываемой информации. |
3. Создание программного обеспечения - разработка СУБД. |
4. Создание и подключение к СУБД инструментов решения задач статистики и анализа для обработки информации с целью получения отчетов, на основе которых делаются выводы и планируются дальнейшие исследования. |
5. Создание инструментов для обмена информацией между базами различных исследователей. |
К моменту написания технического задания было установлено, что в России нет программного обеспечения, которое позволило бы решать круг задач применительно к проблемам накопления, хранения и обработки уфологической информации. |
В мире крупнейшим банком сведений по данной тематике является основанный доктором Дэвидом Сандерсом проект "UFOCAT". В этой базе содержатся сведения о более чем 150 тысячах наблюдений НЛО. Информация заносилась Сандерсом и центром КУФОС до 1980 года. К тому времени УФОКАТ насчитывал 106.000 записей. Проект УФОКАТ был "заморожен" в течении десяти лет и недавно возобновлен доктором Дональдом Джонсоном, бывшим коллегой Сандерса и работником КУФОС. Ранее база данных эксплуатировалась на компьютере типа "мэйнфрэйм", но теперь УФОКАТ можно использовать на обычном персональном компьютере. |
Хотя в базе данных недостает многих случаев с 1980 года, все же она является самым крупным в мире хранилищем сообщений об НЛО. Прилагаются все усилия, чтобы добавить в нее как можно больше незаписанных случаев. Документы УФОКАТ имеют структуру, позволяющую формализовать информацию по десяткам параметров, включая дату, место, погоду, данные об очевидцах, последствия для свидетелей, детальные характеристики наблюдаемого НЛО. База данных не содержит повествовательных деталей. УФОКАТ используется многими серьезными исследователями для изучения, например, траекторий движения объектов, времени и типов сообщений. С помощью программного обеспечения можно легко и быстро провести любое статистическое исследование. |
Кроме этого, ряд зарубежных уфологических объединений имеют свои собственные банки данных (крупнейший из них - "MUFON Database" американской организации MUFON). Существуют также банки данных по частным аспектам уфологии - похищениям, посадкам НЛО, воздействиям на автомобили, лучам твердого света и т. п. |
Из наиболее известных уфологических программ для работы с массивами данных можно называть СУБД "UFO Database" американского исследователя Ларри Хатча. Несмотря на устаревший интерфейс, в нее заложены основные идеи и возможности, позволяющие проводить довольно качественные статистические исследования. Программа отражает основные требования, которые были определены в работах Мак-Кэмпбелла "Уфология" и Жака Валле к компьютерным инструментам подобного рода. |
В России наиболее крупный массив данных принадлежит уфологу Валентину Гольцу (около 5000 сообщений, причем из них 3000 обработаны и занесены на перфокарты). |
Подобная нетерпимая ситуация в российской уфологии привела специалистов по информатике и программированию ОНИЦ "Космопоиск" и исследовательской уфологической станции "RUFORS" к формулированию технического задания и началу разработки комплекса программ для использования в уфологических исследованиях. |
ТРЕБОВАНИЯ К ПРОГРАММНЫМ СРЕДСТВАМ
|
Определяя цели создания уфологического ПО для широкого круга пользователей, разработчики стремились реализовать следующие принципы: |
* Создание стандартной и максимально формализованной системы учета сообщений о наблюдениях НЛО и аномальных явлений в разных средах. |
* Обеспечение исследователей качественным инструментом для ввода, хранения и обработки информации, а также возможностями ее обмена с другими пользователями. |
* Создание конкурентоспособной программы, которая была бы принята исследователями не только России, но и других стран, и повышение тем самым авторитета российской уфологии. |
Суммарная трудоемкость проекта, частично уже выполненного, включая доработки и сопровождение, предварительно оценивается в 6.000 человеко-часов. Из материальных затрат следует упомянуть: |
1. Приобретение базы данных "Пресса" по российским печатным периодическим средствам массовой информации за 1993-2002 годы объемом 10 гигабайт на предмет поиска и импорта из нее статей центральной и региональной прессы по интересующей тематике. |
2. Приобретение геоинформационной системы, т.е. САПР геоинформации, состоящую из редактора многослойных векторных географических карт, модуля экспорта-импорта, службы 20 наиболее распространенных систем геопривязки и справочника точных координат на 15 миллионов географических объектов. |
3. Приобретение мощного генератора отчетов для создания выходных форм. |
БИБЛИОТЕЧНАЯ СУБД "ПАНДОРА"
|
По результатам реализации 1-го этапа техзадания была разработана действующая бета-версия программного средства для работы с текстовой уфологической информацией - БИБЛИОТЕЧНАЯ СУБД "ПАНДОРА", уже в настоящее время по ряду параметров превосходящая существующие разработки. |
СУБД построена на принципе технологии клиент-сервер. СУБД дает возможность ее пользователям автономно наполнять базу, обмениваться информацией между собой, а также обращаться к главной библиотечной БД, самостоятельно формируя ее наполнение. |
СУБД реализует следующие функции: |
1. Собственно накопление и первичная обработка массива текстовой информации - ввод, ручной или автоматический, редактирование. |
2. Поиск, сортировка и выдача текстовой информации, сохранение отлаженных запросов для дальнейшего использования. |
3. Широкие возможности по выдаче данных. В частности, выходная информация может быть оформлена в виде библиографического списка, что актуально в качестве приложения к документу, созданному по проведенному по базе исследованию. |
4. Импорт из существующих уфологических баз данных, например, на основании достигнутой договоренности, из базы UFODB Ларри Хатча (США). |
5. Экспорт данных во внешние форматы (Word, Excel, Access, СУБД Paradox, InterBase и др.). Развитый встроенный макроязык позволяет самостоятельно конструировать выходные формы для экспорта сведений в любые другие форматы, например, в индивидуальные настройки WEB-сайтов для их автоматического пополнения. |
6. В процессе проработки концепции находится создание мощного модуля лингвистического анализа, после чего в функции базы данных будут включены морфологическая и статистическая текстовая обработка массива - нормализация ключевых слов и выражений, определение весовых категорий элементов текстов и программное создание словаря ключевых слов и тематических областей, получение реферативной текстовой, табличной и графической информации по явлениям, датам и ряду других параметров. |
Бюджет разработки полнофункциональной версии СУБД "Пандора" оценивается в 80.000 рублей. |
Предусматривается реализация локальной, сетевой и Интернет-версий СУБД "Пандора". |
В настоящее время осуществляется сбор и занесение данных в СУБД "Пандора", в первую очередь, за последние 12 лет. |
В дальнейшем планируется размещение сводного массива данных для публичного доступа в Интернете. Это даст возможность пользователям осуществлять запросы к уникальному по величине и охвату источников массиву данных. |
ИНФОРМАЦИОННО-ПОИСКОВАЯ АНАЛИТИЧЕСКАЯ СИСТЕМА (ИПАС) "АВРОРА"
|
Данный программный продукт будет включать полный набор функций СУБД "ПАНДОРА", а также следующие аналитические модули: |
* систему сравнения даты наблюдения с информацией из подключаемых справочников по запускам КЛА и ИСЗ; |
* систему сравнения фактов с известными небесными и астрономическими явлениями, подключение модуля расчета эфемерид ярких небесных объектов; |
* в дальнейшем - подключение модуля сравнительного анализа, позволяющего в автоматическом режиме отождествлять опознаваемые и неопознанные явления; |
* систему привязки наблюдений к точным географическим координатам, используя подключаемый модуль "Геоинформационная система". |
В результате переписки с Ларри Хатчем была достигнута договоренность о создании модулей импорта-экспорта записей между нашей и его базами данных. Это соглашение дает перспективу распространения разработанного нами программного обеспечения среди зарубежных исследователей, которые уже придерживаются "де факто" стандарта базы данных Л. Хатча. |
Для тестирования бета-версии созданной программы был взят архив наблюдений НЛО над территорией США "Национального центра изучения НЛО" (NUFORC), содержащий около 15.000 записей. С этой целью была разработана отдельная программа, позволяющая автоматически подключаться к серверу NUFORC и импортировать информацию в нашу СУБД. Такое количество записей уже позволяет делать определенные статистические исследования и многосторонне тестировать создаваемую компьютерную систему. |
В результате анализа сообщений удалось выявить очевидные закономерности в хронологии появления и наблюдения НЛО. Это - первый полученный ИПАС "АВРОРА" результат. Он определен как отдельная тема для доклада, который будет сделан на следующих Зигелевских чтениях по дальнейшим результатам работы с окончательной версией программы. |
Привязка всех сообщений к геоинформационной системе позволила выявить "зоны локализации НЛО", что дало дополнительную возможность прогнозировать пики активности наблюдений аномальных объектов относительно географических зон. |
Себестоимость окончательной разработки проекта "Аврора" оценивается в 3000 человеко-часов и сумму порядка 100.000 рублей, поэтому полнофункциональная ИПАС "Аврора" будет платной. |
АВТОМАТ ОБРАБОТКИ НОВОСТЕЙ (АОН) "СТРИНГЕР"
|
Основная задача данного проекта - создание онлайнового поискового инструмента, предназначенного для мониторинга и анализа новостей и наполнение ссылочно-текстовой базы данных ежедневных новостных документов, транслируемых информационными порталами в Интернет. |
Мониторинг осуществляется программными средствами на основе метода шаблонов, описывающих действия программы для каждого опрашиваемого WEB-проекта в отдельности. Внутри порталов программа руководствуется набором созданных для импорта новостей правил. |
Собранная информация хранится в оффлайновой базе данных. Перед размещением найденных новостей в БД АОН "СТРИНГЕР" будет осуществляться анализ их содержания, индексация и рубрикация. Далее накопленная информация может сортироваться для подготовки ежедневных тематических пресс-релизов, коммерческих новостных рассылок, заказных выборок информации и экспорта итоговых данных в новостные каналы и на WEB-сайты. |
К БД будут иметь онлайновый доступ зарегистрированные пользователи (по локальной сети либо через Интернет). |
В АОН "СТРИНГЕР" предусматривается наличие ряда инструментов: |
1. Конструктор поиска - средство быстрого создания произвольных запросов на выборку информации из БД. |
2. Конструктор тематических списков - инструмент создания словарей, на основе которых ПМН будет делать предположения о принадлежности текста к той или иной тематике. |
3. Конструктор отчетов - инструмент создания аналитических документов о состоянии БД, хранящихся данных, траффике входящих и исходящих информационных потоков, статистике мониторинга опрашиваемых порталов и т.п. |
4. Диспетчер доступа - модуль, отвечающий за разграничение доступа пользователей различного уровня к информации. |
5. Диспетчер событий - модуль отслеживания процессов, происходящих а АОН; занесение событий и действий пользователей в защищенный LOG-файл, редактировать и просматривать который может только администратор АОН. |
6. Конструктор новостей - генерация тематических лент сообщений по настраиваемым характеристикам, например - автоматическое создание на основе накапливаемых данных ежедневной ленты новостей по теме "Экономические показатели ведущих компаний России". |
7. Конструктор новостных WEB-проектов - автоматическое администрирование Интернет-порталов, создаваемых на основе информации, экспортируемой из АОН, по заранее созданным шаблонам. Такой подход позволяет создавать автономные новостные порталы любой сложности, поддерживаемые АОН "Стрингер" в автоматическом режиме, администратору системы нужно лишь первоначально подготовить шаблоны дизайна, определить на макроязыке выборки для каждого шаблона и задать время автоматического обновления портала по протоколам FTP или HTTP. |
По предварительной оценке для разработки АОН "Стрингер" потребуется около 1000 чел./час, стоимость проекта определяется суммой в 60000 рублей. |
ЗАКЛЮЧЕНИЕ
|
Подводя итог, хочется подчеркнуть следующее: |
1. В настоящее время отсутствует компьютерный инструментарий, необходимый современному исследователю для поиска, сбора, хранения и обработки информации. Проводимая в этом направлении работа имеет целью создание необходимого специализированного ПО. |
2. Реализация создания и сопровождения локальных и сетевых уфологических информационных ресурсов предполагает наличие у исследователя специализированного ПО и интеграцию в Интернет. Таким образом, выполняются следующие задачи: |
2.1. Получение новой информации путем сканирования сетевых ресурсов. |
2.2. Самостоятельный ввод данных и обмен ими с другими исследователями. |
3. Еще одна сторона сетевой интеграции ПО - создание общероссийского пополняемого WEB-архива данных. Такая попытка в уфологии уже предпринималась и весьма успешно - проект UFOMIND, США. |
4. 3. В настоящее время активно идет разработка ПО для научно-исследовательских работ в уфологии, в начале 2003 года на рынке появятся программные продукты, впервые позволяющие решать широкий спектр задач по сбору и накоплению уфологической информации. |
5. Использование специализированного ПО даст возможность не только быстро реализовывать статистическую и аналитическую обработку, но и в автоматизированном режиме выполнять экспертную оценку поступающей информации, а также размещать ее на тематических и новостных сайтах. |
О РАЗРАБОТЧИКАХ
|
СУББОТИН Николай Валерьевич (Пермь) - директор общественной организации Русская Уфологическая исследовательская станция (RUFORS) - автор и разработчик программного обеспечения, описанного в докладе. |
Контакт - мобильный телефон +79024754805, |
Nikolay.Subbotin@psu.ru |
http://ufo.psu.ru |
http://rufon.r2.ru |
614010, Пермь, а/я 5172. |
БЫЧЕНКОВ Анатолий Николаевич (Москва) - шеф-координатор проекта создания и эксплуатации программного обеспечения для профессиональных уфологических исследований ОНИЦ "Космопоиск", представитель RUFORS по Москве и европейскому региону. Адрес: 115533, Москва, ул.Нагатинская, 19-а. |
Источник:СУББОТИН Николай Валерьевич 25.11.2002 |
|
|