Саратовские новости
наука и образование

Распределенные вычисления

5 ноября 2002г.

Несмотря на то, что производительность персональных компьютеров постоянно растет, в науке по-прежнему остается много нерешенных задач, требующих применения суперкомпьютеров. Распределенные вычисления - это способ решения какой-либо сложной научной задачи, при котором множество компьютеров, объединенных через Интернет, работают над отдельными её частями. Причем, расчет идет во время простоя процессора, и поэтому никакого замедления работы на компьютере не происходит. Существует несколько десятков проектов распределенных вычислений, в этой статье мы рассмотрим только наиболее интересные из них.


Каким образом можно принять участие в проекте распределенных вычислений? Для начала, Вам нужен компьютер с возможностью подключения к сети Интернет. Причем, абсолютно неважно, какое это будет соединение - модемное или выделенная линия - в конечном итоге количество пересылаемых данных не так уж и велико.


На втором этапе Вы выбираете ту задачу, над которой будет трудиться Ваш компьютер, и скачиваете с сайта соответствующего проекта программу-клиент (от 300 Кб до 7-8 Мб), которая в свою очередь загрузит с сайта информацию для обработки. Обычно это небольшой блок данных 300-800 Кб - Work Unit (рабочая единица, в простонародье - "юнит"). Клиент в течение нескольких часов (или даже дней - это зависит от мощности Вашего компьютера и многих других параметров) обрабатывает полученные данные. Затем программа отправляет полученный результат на сервер проекта, после чего можно скачивать новые данные для обработки.


На серверах всех проектов ведется подробная статистика участников, и за выполненные расчеты начисляются "очки", которые влияют на Ваше положение в общих рейтингах. Это может быть рейтинг индивидуальных участников или групповая статистика, так как практически во всех проектах предусмотрена возможность объединения пользователей в команды.


В каких же широкомасштабных проектах распределенных вычислений можно принять участие?


United Devices Cancer Research Project
Очень популярный и полезный проект, в работе над которым принимают участие несколько миллионов человек по всему миру. Присоединившись к нему, Вы будете помогать выполнять нужную и многообещающую научную работу, а именно - вести поиск противоядия от рака - обрабатывать много тысяч молекул, имеющих структуру, похожую на это лекарство.


Происходит это следующим образом: в моменты простоя компьютера клиент моделирует взаимодействие заданных молекул с протеинами, участвующими в развитии рака. Цель - определить, не является ли одна из этих молекул возможной основой нового лекарственного средства.


Участники этого проекта, например, уже вычислили, что в хрене есть вещество, убивающее некоторые раковые клетки.


В июне 2002 года начата вторая фаза проекта. Используя программное обеспечение LigandFit, проводящее более сложные расчеты, участники UD будут проверять и уточнять собранные при помощи THINK данных. Вот что об этом пишет один из научных работников проекта: "Во второй стадии проекта мы задействуем усовершенствованные, требующие больше времени для обработки, но более точные алгоритмы. THINK обрабатывал данные с неплохой скоростью и низкими требованиями к объему передаваемых данных, но теперь, благодаря огромному количеству наших пользователей, у нас появилась возможность использовать новую моделирующую программу под названием LigandFit. Мы уверены, что её функция расчета "хитов" более точна, чем методы, используемые до сих пор. Таким образом, наш следующий шаг - проверка уже обнаруженных "хитов" с помощью LigandFit для сокращения списка молекул-кандидатов и упрощения финальной стадии проекта - лабораторного синтеза и тестирования лекарства".


United Devices основаны Центром компьютерного проектирования лекарств Оксфордского университета, который финансируется Американским благотворительным фондом NFCR (Национальный фонд исследования рака), а главными спонсорами проекта являются корпорации Intel и Microsoft.



Search for Extraterrestrial Intelligence at Home (SETI@Home)
Один из самых первых проектов распределённых вычислений SETI@home предлагает пользователям принять участие в поиске сигналов внеземных цивилизаций. На данный момент в проекте зарегистрировано более четырех миллионов участников, хотя реально работает около миллиона человек.


Данные, записанные радиотелескопом в Аресибо (Пуэрто-Рико), рассылаются на компьютеры участников для поиска сигналов, имеющих особую форму и частоту. На сайте проекта описаны теоретические обоснования поиска именно таких сигналов.


После завершения обработки данных компьютер участника отправляет результат на сервер. Если проект всё же обнаружит сигналы инопланетного происхождения, участники, чьи компьютеры занимались обработкой юнитов, содержащих сигнал, будут занесены в список соавторов всех соответствующих научных публикаций.


На данный момент обнаружено несколько сигналов-"кандидатов", но проверка их достоверности требует значительного времени.


Скоро данный проект прекратит свое существование, а ему на смену придут новые, основанные на инфраструктуре Berkeley Open Infrastructure for Network Computing (BOINC). Скорее всего, следующим проектом университета Беркли станет AstroPulse, целью которого будет повторная обработка данных SETI@Home для поиска на других частотах сигналов пульсаров, черных дыр и других космических объектов. В будущем планируется повторение проекта SETI@Home, с той лишь разницей, что будут обрабатываться данные звездного неба не с северного, а с южного полушария.


Более подробно о проекте SETI@Home читайте с статье "Есть ли жизнь на Марсе?"


Folding@Home 2.0
Один из проектов Стэнфордского университета, участники которого при поддержке корпорации Intel занимаются сравнением белковых молекул с генами человека. Цель - выявление причин возникновения различных болезней для последующего определения эффективных методов лечения таких заболеваний, как болезнь Альцгеймера, диабет типа II, коровье бешенство, болезнь Паркинсона, склероз и многое другое. Уже сейчас получены научные результаты, позволяющие с большой точностью предсказать свертываемость для многих "маленьких" протеинов.


Genome@home
Компьютеры участников этого проекта (как и Folding@Home, основанного в Стэнфордском университете) занимаются сравнением известных генетических данных со строением белковых молекул, что должно выявить генетические последовательности, кодирующие молекулы, для последующего искусственного синтеза белков.


Участвовать в G@h можно, указав соответствующую опцию в клиенте Folding@home. Однако развитие клиента, да и проекта Genome@home (в сегодняшнем виде) не планируется. Впрочем, и закрывать Genome@home Classic - именно так его теперь рекомендуется называть - никто не собирается: получаемые результаты по-прежнему имеют высокую ценность для науки.


К серверу можно не подключаться месяцами, а потом получить "очки" сразу за всю выполненную работу. "Юниты" случайно генерируются из полученных от сервера данных - обычно это делается только один раз, но если нет соединения, клиент может "сделать" себе еще юнитов, чтобы не простаивать без работы.


FightAIDS@Home
Очень важный проект, основанный Лабораторией Олсон Исследовательского института Скриппс и поддержанный компанией Entropia. Цель - поиск противоядия от СПИДа.


Одной из проблем, препятствующих созданию лекарства от СПИДа, является высокая изменчивость вируса: мутируя, вирус начинает сопротивляться существующим методам лечения. С помощью вычислительных мощностей FightAIDS@Home ученые пытаются решить эту проблему.


Процедура скачивания клиента идет по специальному защищенному протоколу https, поэтому за достоверность обрабатываемых данных можно не беспокоиться.


Вникая в подробности этого проекта, волей-неволей приходишь к выводу о никчемности многих других начинаний
(например, проекта подсчета числа нажатий клавиш на компьютере). Что может быть важнее поиска лекарства от чумы XX века?! Разве что ответ на извечный вопрос человечества: "Одиноки ли мы во Вселенной?", поиск которого ведется с помощью SETI@Home. Несмотря на это в FightAIDS@Home участвует всего 52 тысячи человек, по сравнению с миллионами в SETI...


Distributed.net
Суть проекта состоит в последовательном переборе всех возможных вариантов ключа для защиты компьютеров.


Как правило, компании, которым нужна защита, устраивают конкурс, суть которого состоит в самом быстром вскрытии нового алгоритма шифрования. Победителей ждут призы.


Один из самых популярных нынче подпроектов Distributed.net - поиск ключа для системы шифрования RC5. Компания RSA Labs объявила призовой фонд в размере $10000 той группе, которая решит эту несколько необычную задачу.


Find-a-drug.com
Этот проект занимается разработкой средств противодействия биотерроризму, поиском лекарств от рака и СПИДа, а также созданием безопасных гербицидов. Существует возможность выбирать, в каких именно исследованиях Вы хотели бы участвовать.


В основе клиента - оптимизированная с помощью корпорации Intel версия программы THINK, отличающаяся большим быстродействием по сравнению с используемой в United Devices. В версии клиента 1.20 значительно улучшилось графическое отображение молекул - теперь для этого используется OpenGL. Можно выбрать желаемый режим из пяти доступных, причем первый из них рисует только линии, как и все предыдущие версии клиента - он предназначен для желающих направить все ресурсы на полезные расчеты.


"За и против" распределенных вычислений


Самый первый вопрос, который задают люди, впервые услышавшие о распределенных вычислениях: "А что я рассчитываю? Может быть, вместо поиска лекарства от рака я рассчитываю баллистические траектории ракет?". Это один из основных аргументов противников распределенных вычислений. Развивая эту мысль, можно усомниться в безопасности включения компьютера и выхода в Интернет - то, что вытворяет на Вашем компьютере "гремучая смесь" Intel+Microsoft (или любая другая), остается только догадываться. Конечно, никто не может дать гарантии, что Вы не помогаете "Пентагону", но и бояться всего на свете тоже нельзя.


Что же касается полезности, думается, ни у кого не возникнет сомнения в необходимости поиска лекарства от СПИДа или рака.


Дополнительная информация о распределенных вычислениях


Главным источником информации о различных проектах распределенных вычислений являются, прежде всего, официальные сайты. У некоторых проектов есть официальные и неофициальные русские "зеркала", но зачастую на них размещена устаревшая информация (например, российское "зеркало" сайта проекта SETI@Home).


Сайт http://distributed.org.ru - один из лучших ресурсов на русском языке, целиком посвященный различным проектам распределенных вычислений. Здесь Вы можете не только прочитать подробное описание программ и ознакомиться с самыми последними новостями проектов на родном языке, но и поучаствовать в форуме.


На сайте http://www.aspenleaf.coin/distributed/ представлено все многообразие проектов распределенных вычислений, но, к сожалению, на английском языке. Однако, если Вы владеете иностранным языком в достаточной степени, найдете здесь немало интересного.


Тема распределенных вычислений не ограничивается созданием высокопроизводительных вычислительных сетей. Многие организации работают над созданием Общесетевой Операционной Системы (Internet-scale operating system - ISOS). Но ее создание - дело будущего, а пока Вы можете начать использовать мощность Вашего ПК на 100% и принять участие в работе одного из проектов распределенных вычислений. Кто знает, может быть, именно Ваш компьютер найдет вакцину от СПИДа или сигнал инопланетного происхождения. А о том, как Вы можете присоединится к Саратовской команде распределенных вычислений читайте в статье "Есть ли жизнь на Марсе?".


Сергей ЗЕМСКОВ
По всем вопросам пишите zemskov@pisem.net.


При подготовке статьи использовались материалы с сайтов http://distributed.org.ru и http://setiathome.ssl.berkelev.edu


Сатья была опубликована в газете «Компьютерные решения» (№7 за 2002 год).

Обсудить

Комментарии:

 

Загружается, подождите...