Слишком много знаний…

8 августа в 04:54
 просмотров

В Нижнем Архызе в САО РАН прошла конференция, посвященная обсуждению феномена «Больших данных» – Big Data, а именно: методам и технологиям доступа, хранения и интеллектуального анализа данных большого объема в фундаментальной науке.
Семинар-совещание, проведенное в Специальной астрофизической обсерватории РАН с 22 по 26 июля, было седьмым из серии всероссийских семинаров-совещаний с общим названием «Информационные системы в фундаментальной науке», он был организован САО РАН и Университетом ИТМО (Санкт-Петербург) при финансовой поддержке, как и прежние семинары, Российского фонда фундаментальных исследований и САО РАН. В семинаре приняли участие ведущие специалисты в области информационных технологий из Санкт-Петербургского государственного университета, Университета ИТМО (СПб), Горного университета (СПб), Национального исследовательского ядерного университета МИФИ, Северо-Кавказского федерального университета, Института астрономии РАН (Москва), Израильского космического агентства и САО РАН. В Нижнем Архызе в САО РАН прошла конференция, посвященная обсуждению феномена «Больших данных» – Big Data, а именно: методам и технологиям доступа, хранения и интеллектуального анализа данных большого объема в фундаментальной науке.
Семинар-совещание, проведенное в Специальной астрофизической обсерватории РАН с 22 по 26 июля, было седьмым из серии всероссийских семинаров-совещаний с общим названием «Информационные системы в фундаментальной науке», он был организован САО РАН и Университетом ИТМО (Санкт-Петербург) при финансовой поддержке, как и прежние семинары, Российского фонда фундаментальных исследований и САО РАН. В семинаре приняли участие ведущие специалисты в области информационных технологий из Санкт-Петербургского государственного университета, Университета ИТМО (СПб), Горного университета (СПб), Национального исследовательского ядерного университета МИФИ, Северо-Кавказского федерального университета, Института астрономии РАН (Москва), Израильского космического агентства и САО РАН. В программе конференции было представлено более 30 докладов, а также проведены два «круглых стола», где в дискуссиях обсуждались темы «Что такое Большие данные?» и «Новые технологии в Больших данных».
В чем же суть проблемы? В фундаментальных исследованиях есть нацеленность на получение нового знания. В результате в последнее время мы наблюдаем лавинный рост объема получаемой цифровой информации. Ежегодно он удваивается. Данных становится все больше и больше, и их огромное количество создаёт проблемы доступа к ним, их анализа и интерпретации. То есть способность порождать данные оказалась сильнее способности их воспринимать. Для решения этих проблем, кроме увеличения вычислительных мощностей, требуются новые информационные концепции и технологии.
Уже несколько лет для разбора больших объемов используются дилетанты: существуют программы в Интернете, некие виртуальные обсерватории, где астрономы-любители сверяют тысячи снимков с базовыми данными и классифицируют небесные объекты. Виртуальная обсерватория дает удобный доступ к материалу и позволяет «вести с ним диалог»: по желанию менять ракурс объекта, запрашивать разнообразные параметры, выделять их цветами. Классификации дилетантов не всегда точны, но если триста любителей определяют некую галактику как спиральную, можно с высокой степенью вероятности предположить, что она действительно спиральная. Что до астрономов- профессионалов, то они из отобранного дилетантами материала извлекают и исследуют уже самые значимые объекты.
На конференции шел разговор и о новых информационных системах. Они приобретают особое значение в связи с увеличением объема информации и с необходимостью предоставить доступ к ним максимально возможному числу научных коллективов и индивидуальных исследователей. И потому создание новых информационных систем сейчас является необходимым условием для поддержки фундаментальных исследований, одновременно являясь инструментами для популяризации науки. В качестве примера такой инфраструктуры и приводили виртуальную обсерваторию, координируемую международным астрономическим альянсом IVOA. Необходима разработка адекватных средств – суперкомпьютеров, кластеров, систем хранения данных, средств доступа к хранилищам и источникам информации, с одной стороны, и программных систем и технологий, с другой, подчеркивали участники совещания.
Выходом из проблемы «Больших данных» может стать и появление центров хранения данных (ЦОД) и их связь с суперкомпьютерами. Для обработки и хранения данных нужно создать сервер, программное обеспечение и сервис по анализу, обработке и визуализации данных. Использование сервера позволит анализировать уже имеющиеся данные широкому кругу пользователей, а также оставлять автоматические заявки на выполнение новых задач на суперкомпьютере.
Доклады участников научного форума были посвящены анализу большого объема данных на гибридных суперкомпьютерах, когнитивному анализу принципиально разнородных больших данных, относящихся к одной предметной области, численному моделированию космических экспериментов для отработки технологий сбора, передачи, хранения и обработки наблюдательных данных и новым сервисным функциям общего архива наблюдательных данных САО РАН.

Ольга МИХАЙЛОВА
Поделиться
в соцсетях