introduction to lcg-2 Введение в lcg-2 e.tikhonenko ( jinr )

49
EGEE is a project funded by the European Union under contract IST-2003-508833 Introduction to LCG- 2 Введение в LCG-2 E.Tikhonenko (JINR ) www.eu-egee.org NA3 Induction Courses for school on Modern Cosmology and Astrophysics JINR, Dubna, October 7, 2005

Upload: tekla

Post on 06-Jan-2016

44 views

Category:

Documents


2 download

DESCRIPTION

Introduction to LCG-2 Введение в LCG-2 E.Tikhonenko ( JINR ). NA3 Induction Courses for school on Modern Cosmology and Astrophysics JINR, Dubna, October 7, 2005. www.eu-egee.org. EGEE is a project funded by the European Union under contract IST-2003-508833. Talk Outline. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

EGEE is a project funded by the European Union under contract IST-2003-508833

Introduction to LCG-2Введение в LCG-2

E.Tikhonenko (JINR )

www.eu-egee.org

NA3 Induction Courses for school onModern Cosmology and Astrophysics

JINR, Dubna, October 7,  2005

Page 2: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Talk Outline

The preliminaries on the LCG-2 ;

examples of various application areas;

RDIG EGEE participation in NA4;

the sequence of actions how to start a work in the LCG-2 environment

Page 3: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Job SubmissionРекомендуемые ccылки

AstrophysicsAstrophysics in GRID (EGEE) & in GRID (EGEE) & Application WebsitesApplication Websites : :

• PLANCK Status Report at the 4th EGEE conferencehttp://indico.cern.ch/contributionDisplay.py?

contribId=109&sessionId=35&confId=0513

• MAGIC Status Report at the 4th EGEE conferencehttp://indico.cern.ch/materialDisplay.py?

contribId=107&sessionId=35&materialId=slides&confId=0513

• The MAGIC telescopehttp://wwwmagic.mppmu.mpg.de/introduction/

• ESA Science & Technology: Planck http://sci.esa.int/science-e/www/area/index.cfm?fareaid=17

Page 4: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

H. Kornmayer MAGIC-GRID Status report EGAAP meeting, Athens, 21th April 2005 - 3

EnablingGridsfor E-siencE

Introduction: The MAGIC Telescope• Ground based

Air Cerenkov Telescope• Gamma ray: 30 GeV - TeV• LaPalma, Canary Islands

(28° North, 18° West)• 17 m diameter• operation since autumn 2003

(still in commissioning)• Collaborators: IFAE Barcelona, UAB Barcelona,

Humboldt U. Berlin, UC Davis, U. Lodz, UC Madrid, MPI München, INFN / U. Padova, U. Potchefstrom, INFN / U. Siena, Tuorla Observatory, INFN / U. Udine, U. Würzburg, Yerevan Physics Inst., ETH Zürich

Physics Goals: Origin of VHE Gamma raysActive Galactic NucleiSupernova RemnantsUnidentified EGRET sourcesGamma Ray Burst

MAGIC Telescope

Page 5: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

H. Kornmayer MAGIC-GRID Status report EGAAP meeting, Athens, 21th April 2005 - 4

EnablingGridsfor E-siencE

~ 10 kmParticleshower

Ground based γ-rayastronomy

~ 1o

Ch

eren

kov

ligh

t

~ 120 m

Gammaray

GLAST (~ 1 m2)

Cherenkov light I mage of particle shower in telescope camera

reconstruct: arrival direction, energy

reject hadron background

MAGIC Telescope

Page 6: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

H. Kornmayer MAGIC-GRID Status report EGAAP meeting, Athens, 21th April 2005 - 5

EnablingGridsfor E-siencE

MAGIC – Hadronrejection

• Based on extensive Monte Carlo Simulation

• air shower simulation program CORSIKA

• Simulation of hadronic background is very CPU consuming

• to simulate the background of one night, 70 CPUs (P4 2GHz) needs to

run 19200 days

• to simulate the gamma events of one night for a Crab like source takes

288 days.

• At higher energies (> 70 GeV) observations are possible already by

On-Off method (This reduces the On-time by a factor of two)

• Lowering the threshold of the MAGIC telescope requires new

methods based on Monte Carlo Simulations

MAGIC Telescope

Page 7: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

H. Kornmayer MAGIC-GRID Status report EGAAP meeting, Athens, 21th April 2005 - 6

EnablingGridsfor E-siencE

Developments -Requirements

• MAGIC needs a lot of CPU to simulate the hadronic background to

explore the energy range 10 GeV – 100 GeV

• MAGIC needs a coordinated effort for the MonteCarlo production

• MAGIC needs an easy accessible system

(Where are the data from run_1002 and run_1003?)

• MAGIC needs an scalable system (as MAGIC II will come 2007)

• MAGIC needs the possiblity to access data from other experiments

(HESS, Vertias, GLAST, PLANCK(?)) for multiwavelength campaigns

MAGIC Telescope

Page 8: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Planck is an ESA satellite aimed at providing a final mapping of the cosmological anisotropies of temperature and to foray deeply into their polarisation properties. Launch is planned for 2007. Two instruments are onboard, the LFI and HFI.

The HFI (High Frequency Instrument) is built by a French-led international consortium which will provide maps of the sky at 100, 143, 217, 353, 545 and 857 GHz. The first 3 channels will be the most sensitive to cosmological information (the peak of emission of a black body at 2.728K is around 100Ghz, i.e. 3mm), while the higher frequency channels will be very precious to trace the emission of some contaminating foregrounds (like the emissions from dust in galaxies, including our own, or the effect from clusters).

The LFI (Low Frequency Instrument) is built by an Italian-led international consortium. It will provide maps of the sky at 33, 44 and 70 GHz, which will be very precious to trace the emission of some other contaminating foregrounds (like the synchrotron emission of our Galaxie, or that of radio sources).

The HFI is a very powerful instrument by itself. But Planck has been conceived as a whole, such that the combination of the data from the two instruments should allow mining essentially all the cosmological information contained in the CMB

(Cosmic Microwave Background), by minimizing astrophysical limitations. Parenthetically, it shows that spin-off science from Planck (concerning the CMB "contaminants") will be extremely interesting per se. Global information on Planck may be found in the Planck web site at ESA (see also the science team pages).

PLANCK Satellite

Page 9: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

EGEE Third Conference, Athens, 20.04.2005 3

Enabling Grids for E-sciencE

Brief intro on the application

• Planck: ESA satellite mission (2007);

• LevelS: mission simulation s/w– foreach instrument {

foreach frequency {• foreach cosmology {

o ….

• Some Montecarlo jobs;

PLANCK Satellite

Page 10: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

EGEE Third Conference, Athens, 20.04.2005 4

Enabling Grids for E-sciencE

PLANCK Satellite

Page 11: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

EGEE Third Conference, Athens, 20.04.2005 13

Enabling Grids for E-sciencE

Lesson learned

• Massive data production on WN ( > 40 GB):– Big disks;

– Complex site topology (parallel/distributed FS);

– Compressing/RM-CR/removing file program;

– FITSIO with fgal/gsiftp support;

• CPUs not extremely important;

• Data handling:– Complex data structure;

– Complex data structure;

• 1 GB RAM.

10- 15 terabytes ˜20.000 CD- ROM

1 Eiff el Tower unit

•METADATA!

PLANCK Satellite

Page 12: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

EGEE Third Conference, Athens, 20.04.2005 14

Enabling Grids for E-sciencE

Application needs

• Massive storage of ~ 10 TB– Data storing/replica (automatic!)

Tier or not Tier?

• User common data front-end:– web portal or data browser;

– DSE support (metadata) for Grid/non-Grid data: G-DSE;

OGSA-DAI(?);

Vobs compliant;

• More then 200 CPUS;

• Controlled access to data and metadata.

PLANCK Satellite

Page 13: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Проект LCG и среда LCG-2

• Проект LCG – the LHC Computing Grid Project (http://lcg.web.cern.ch/LCG/ ) – был организован для создания компьютерной инфраструктуры, необходимой для моделирования, обработки и анализа данных cтроящихся на LHC экспериментов.

• Cреда LCG-2 – инфраструктура, промежуточное математическое обеспечение (middleware) которой может рассматриваться как логическое продолжение и развитие достижений таких grid – проектов, как Сondor, Globus, DataGrid, DataTag, GriPhyn, iVDGL и EGEE (Enabling Grids for E-sciencE).

Под middleware понимается совокупность Grid-сервисов, независимых от ресурсов и приложений и обеспечивающих аутентификацию, авторизацию, размещение и распределение ресурсов, получение результатов выполнения задач, статистику и служебную информацию, удаленный доступ к данным, стратегию и способы обнаружения неисправностей.

Page 14: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

CMSATLAS

LHCbLHCbALICE

При ожидаемой скорости записи сырых данных потребуются ресурсы для хранения данных порядка десятков и сотен ПБ.

Для обработки данных потребуются сотни тысяч персональных компьютеров (максимальной на текущий момент производительности)

Эксперименты на LHC

Page 15: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Обработка данных и вычисления в физике высоких энергий

интерактивный физический анализ

Пакетнаяобработка

данных

Пакетнаяобработка

данных

детектор

суммарные данные по событиям

«сырые»данные

Реконструкция событий

Реконструкция событий

моделированиефизических

событий

моделированиефизических

событий

объекты для физического анализа(выделенные по физическим каналам)

Отбор событийи первичная

реконструкция

Отбор событийи первичная

реконструкция

обработанныеданные

Триггер 1-го уровня

Page 16: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Иерархия данных

“RAW, ESD, AOD, TAG”

RAW~2 MB/event

ESD(/DST)

Первичная стадия реконструкции на уровне создания базовых кластеров и трек-сегментов

Геометрическая реконструкция событий: траектории частиц, импульсы и энергии

~100 kB/event

AOD~10 kB/event

TAG~1 kB/event

События, удовлетворяющие условиям триггера; записываются системами сбора данных (DAQ)

Реконструированная информация

Информация для анализа

Указатель события (классификационная информация для быстрого выбора нужного события)

Event Summary Data

Analysis Object Data

Съем цифровых отсчетов с детекторов

На 2 порядка уменьшается объем

данных по сравнению с исходным потоком

Физическая реконструкция: установление соответствия частиц и треков, уточнение характеристик струй, поиск

распадных вершин

L1

L2+L3

Page 17: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Специфика приложений ФВЭ

Требования по даннымКолоссальные объемы данных (десятки и сотни Петабайт)

Данные типа WORM (писать единожды, читать многократно)

Структуризация данных с последующим извлечением информации из данных (data mining)

Продолжительное время хранения данных, а также необходимость создания копий данных в разных странах мира

Требования к обработке данныхОбработка данных подразделяется на 2 типа – регулярное производство данных и «нерегулярный» анализ данных

Производство (моделирование ) данных происходит систематически; при этом производятся наборы данных порядка ~ 10**9 физических событий.

Анализ физических данных (на наборах данных порядка 10**7 событий) проводится произвольным образом и в индивидуальном порядке многими сотнями отдельных пользователей

Высокий уровень параллелизма обработки на уровне событий, который может быть описан ориентированным графом с указанием последовательности обработки

Поскольку интерактивная работа очень важна при анализе данных, необходимо предусмотреть возможность спасения сессий с сохранением информации об источнике данных («проверяемость», provenance)

Необходимость глобального доступа к базам данных экспериментов для получения значений констант, условий работы и т.д.

Page 18: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

специфика биомедицинских приложений

Сложные требования по даннымГетерогенные форматы данных Частая обновляемость данных Сложные наборы данных (медицинские записи)Ограничения на безопасность и конфиденциальностьНеобходимость длительного хранения данных

Cложные требования по обработке данныхБиоинформатика (геномика, протеомика, …): распределенные базы данныхМедицинские(просмотр снимков, эпидемиология...): распределенные базы графических данных Использование параллельных алгоритмов для обработки медицинских графических данных и для моделированияИнтерактивные приложения Ограничения на безопасность и конфиденциальность

Page 19: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Группа NA4: Идентификация и поддержка приложений в среде проекта EGEE

• Результатом работы группы NA4 будут являться программные приложения – прикладные пакеты, развернутые в инфраструктуре EGEE и доступные для работы в grid-среде соответствующим сообществам пользователей

      • Для развертывания этих приложений может понадобиться специальное ПО

для обеспечения интерфейса к grid. Необходимо собрать существующую документацию из проекта EDG и других проектов (LCG, ARDA, GridLab, Healthgrid, …) для выработки общего решения

• Процесс развертывания приложений в инфрастуктуру EGEE будет происходить в рамках виртуальных организаций, объединяющих соответствующих пользователей

• Инфраструктура EGEE будет расширяться; с появлением новых пользователей им будет оказываться поддержка и будет организовываться обучение; также будут создаваться новые виртуальные организации

Основные составляющие работы:

Page 20: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Участие RDIG-EGEE в NA4

• Приложения ФВЭ: Институт теоретической и экспериментальной физики (Москва) (отв.по

LHCb) Институт физики высоких энергий (Протвино) (отв.по ATLAS) Курчатовский институт (Москва) Научно-исследовательский институт ядерной физики (Москва) (отв. по

CMS) С.-Петербургский институт ядерной физики (Гатчина) Объединенный институт ядерных исследований (Дубна) (отв. по ALICE

и CMS)

• Биологические приложения Институт математических проблем биологии (Пущино)

• Приложения Fusion&Plasma Science Курчатовский институт (Москва)

Page 21: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

RDIG EGEE membership in VOs

January, 200543 members from 11 institutes - 5.7 % from a total number ( 749 ) of EGEE VOs

members

March, 200556 members from 12 institutes - 5.8 % from a total number ( 967 ) of EGEE VOs

members

June, 200570 members from 13 institutes - 6.4 % from a total number ( 1097 ) of EGEE VOs

members

September, 200581 members from 13 institutes - 6.1 % from a total number ( 1324 ) of EGEE VOs

members

The target fixed in the EGEE Technical Annex for the EGEE project by the End

Year 2: > 3000 VOs users !

Page 22: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

RDIG EGEE membership in VOs (September, 2005)

ALICE VO – 6 (of 43 alice VO members)

ATLAS VO – 13 (of 391 atlas VO members)

8 – IHEP, 1 – SINP MSU, 1 – MEPHI, 1 – ITEP, PNPI –1, INP -1

CMS VO – 21 (of 343 cms VO members)

8 - SINP MSU, 6 – JINR , 3 – Kharkov, 2 – ITEP, 2 – INR

LHCb VO – 5 (of 58 lhcb VO members)

3 – ITEP, 2 - PNPI

dteam VO – 29 (of 421 dteam VO members)

11–JINR, 4 – SINP , 4 – ITEP, 3 – IHEP, 2 – RRC KI, 1 – INR, 1 – IPM,

1 –IMPB, 1 – PNPI, 1- NOVSU

Biomed VO – 7 (of 68 biomed VO members)

all IMPB

in total: 81 - 6.1 % from a total number ( 1324 ) of EGEE VOs members

13 institutes:JINR – 18,

ITEP – 14, IHEP-9, SINP MSU – 9,

IMPB – 5, Kharkov – 3, INR – 3, PNPI – 2,

IPM – 1, INP –1, MEPHI –1, RRC KI – 1,

NOVSU - 1+1 institute - CGDS (eEarth)

The target fixed in the EGEE Technical Annex for the EGEE project by the End

Year 2: > 3000 VOs users !

RGStest VO - 11 PHOTON VO – 12 (PHOTON & SELEX experiments)

RDTEAM VO - 3 eEarth VO - 11 all CGDS

AMS VO - 3

in total: 29 RDIG VOs

Page 23: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

New VOs inside the RDIG-EGEE infrastructure:

aims & current status

aims:1) to serve the national scientific projects

2) to test new application areas before including them into the global EGEE infrastructure

current status:creation of the formal procedures and the proper administrative structures in RDIG-EGEE for

VOs creation & registration:

http://rdig-registrar.sinp.msu.ru/newVO.html – documents and rules;

the Council on RDIG-EGEE extension has been formed

5 internal VOs now;near plan:

Fusion science;chemical physics institutes

Page 24: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

PHOTON VO: PHOTON & SELEX Projects (12 members; leading organization - ITEP)

http://egee.itep.ru/PHOTON/index29d5en.html

eEarth VO: geophysics sciences - 11 members; leading organization: Geophysics Center RAS http://www.e-earth.ru/

RGStest & RDTEAM VOs - Russian Data Intensive Grid(13 members)

Photon, eEarth, RGStest RDIG Virtual Organizations

Page 25: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

eEarth VO http://www.e-earth.ru/ (in Russian) – for geophysics and cosmic research tasks; participating institutes: Scmidt Institute of Physics of the Earth of Russian Academy of Sciences (IPE

RAS) ( http://uipe.ru/) and Centre of Geophysical Data Studies and Telematics Applications (CGDS) (http://www.ednes.org/CGDS/)

CGDS operates a powerful local area network (LAN) (8 servers and 32 workstations operating under Windows NT 4.0, Windows XP/2000/98, Linux Red Hat 5.2 and Solaris 2.5-7) with high speed (1 GBps) fiber optic Internet connection to Moscow Internet backbone through campus network of Moscow Lomonosov State University

eEarth VO will provide: an access to world-wide distributed data; computing resources for remote distributed computations; monitoring of common computing resources loading to optimize the resources usage.

Grid-technologies will be useful for a number of geophysical tasks, especially for interactive cartography and data vizualisation.

Data Resources:• SPIDR Mirror site in Moscow • Integrated Distributed Environmental Archive System (IDEAS)• Satellite Archive Browse and Retrieval

http://sabr.ngdc.noaa.gov/• Rapid Earthquake Determination Service

Geophysical Survey RAS, Obninsk

eEarth VO in the RDIG-EGEE

11 members

Page 26: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Процесс регистрации для работы в среде LCG

http://lcg-registrar.cern.ch/

Page 27: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Последовательность действий для осуществления возможности работать в среде LCG-2

- Ознакомиться с Правилами использования ресурсов LCG

- Получить персональный цифровой сертификат

- Загрузить персональный сертификат в браузер

- Зарегистрироваться в соответствующей виртуальной организации

Вся нижеследующая последовательность действий описана на странице

http://lcg-registrar.cern.ch/

Page 28: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Последовательность действий для осуществления возможности работать в среде LCG-2 (2)

Для получения персонального цифрового сертификата необходимо в среде операционной системы с работающим ПО Globus запустить команду grid-cert-request или специальный скрипт, предоставлямый национальным Сертификацинным Центром, а затем в возникшем при исполнении этой команды (или скрипта) режиме диалога ввести требуемую информацию - в том числе, задать свой пароль, который в дальнейшем будет необходим для работы в grid-среде. После выполнения этой команды в домашнем каталоге создается новый каталог .globus c тремя файлами: usercert.pem – цифровой сертификат пользователя (первоначальный размер этого файла равен 0); usercert_request.pem – запрос на цифровой сертификат; userkey.pem - цифровой ключ пользователя.

Запрос на получение сертификата следует направить по адресу требования Сертификационного центра (как правило - ответственному по сертификации в Вашей организации). Далее произойдет регистрация Вашего сертификата в Сертификационном центре (на данный момент в России – это Курчатовский институт (http://ca.grid.kiae.ru/RDIG/ ). По завершению процесса регистрации Вы получите по электронной почте свой цифровой сертификат, который следует сохранить в файле usercert.pem

Page 29: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Последовательность действий для осуществления возможности работать в среде LCG-2 (3)

Загрузить персональный сертификат в браузер https://lcg-registrar.cern.ch/load_certificates.html

Поскольку в браузерах используется другой формат представления сертификата, прежде всего необходимо конвертировать цифровой сертификат из формата pem в

формат PKCS12. Для этого в среде с работающим пакетом openssl следует выполнить команду вида:

openssl pkcs12 -export -inkey userkey.pem -in usercert.pem -out my_cert.p12 –name "My \ certificate" где

userkey.pem – путь к файлу, содержащему цифровой ключ (этот файл должен иметь разрешение на чтение только для владельца файла, т.е. только для Вас!); usercert.pem - путь к файлу, содержащему сертификат; my_cert.p12- путь к создаваемому файлу в формате PKCS12 ; «My certificate» - необязательное имя (оно может в дальнейшем быть использовно при выборе сертификата в браузере, если в браузер загружено несколько сертификатов)

Подробные инструкции по загрузке сертификата, конвертированного в формат PKCS12 в различные типы браузеров (Mozilla, Netscape, Internet Explorer, Opera и Konqueror) содержатся на странице https://lcg-registrar.cern.ch/load_certificates.html

Page 30: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Последовательность действий для осуществления возможности работать в среде LCG-2 (4)

Зарегистрироваться в соответствующей виртуальной организации https://lcg-registrar.cern.ch/cgi-bin/register/

account.pl

virtual organization (VO) – виртуальная организация - объединение пользователей, организаций и ресурсов (компьютеров, ПО и данных) в

новый административный домен в рамках grid-инфраструктуры

Пользователь для вступления в соответствующую направлению его деятельности виртуальную организацию должен заполнить и отправить регистрационную форму, после чего получает письмо по электронной почте, подтверждающее факт получения регистрационной формы пользователя; затем, следуя указаниям в этом письме, подтверждает факт его получения; и, наконец, администратор виртуальной организации информирует собственно о факте регистрации в виртуальной организации.

Теперь, став членом виртуальной организации, Вы можете войти в сеанс на любую доступную Вам User Interface - машину - и начать работу в среде своей виртуальной организации!!!

http://rdig-registrar.sinp.msu.ru/newVO.html – documents and rules on RDIG-EGEE internal VOs

О внутренних виртуальных организацияхRDIG-EGEE

см.

Page 31: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

• UI (User Interface) – cервис, обеспечивающий доступ к ресурсам Grid; c UI-компьютера пользователь может запускать или прерывать свои задачи, получать информацию о статусе выполняемых задач, находить ресурсы, необходимые для исполнения конкретной задачи, получать учетную информацию о своей задаче: а также копировать, реплицировать или уничтожать файлы в инфрастуктуре Grid.

• CE (Computing Element) – очередь в системе пакетной обработки инфраструктуры Grid

• WN (Working Node) – вычислительный узел фермы в инфраструктуре Grid

• SE (Storage Element) –cервис, обеспечивающий унифицированный доступ к ресурсам памяти инфраструктуры Grid (ресурсами памяти при этом могут быть как простые дисковые серверы, так и дисковые массивы или системы массовой памяти (MSS)).

Job SubmissionЧто такое UI, CE, WN, SE?

Page 32: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

• Запуск задачи пользователя осуществляется через систему управления загрузкой (WMS, Workload Management System)

• Задачей WMS является планирование и управление ресурсами в распределенной среде Grid.

• При этом пользователю предоставляются следующие возможности :- запускать и исполнять свои задачи- получать информацию о статусе состояния своей задачи- получать результат выполнения задачи

• Назначение WMS - как оптимизировать использование ресурсов, так и способствовать скорейшему выполнению задачи пользователя

Система управления загрузкой (WMS) в LCG-2

Page 33: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Составляющие части WMS

• В настоящее время WMS состоит из следующих частей:

1. User Interface (UI) : сервис, обеспечивающий для пользователя доступ к WMS

2. Resource Broker (RB) : сервис поиска “наилучших” ресурсов в среде GRID для запуска конкретной задачи

3. Job Submission Service (JSS) : сервис, обеспечивающий надежность запуска задачи

4. Information Index (BDII) : сервер , который собирает информацию о ресурсах Grid; эта информация используется Resource Broker’ом для классификации и выбора ресурсов

5. Сервисы Logging и Bookkeeping (LB) : хранят информацию о задаче пользователя

Page 34: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Подготовка задачи

• Пользователь должен продумать Достаточно полное описание задачи, т.е.

• Собственно программу• Необходимые для расчетов данные• Требования к ОС и специализированному м/о

Осознавать, что• программа “уйдет” в некоторое “неведомое” пространство• и при этом программа должна быть портабельной • и не иметь в себе ссылок на локальное окружение • и не обязательно программа должна располагаться в

$HOME! Описать входные данные (если имеются) Дать указания касательно выходных данных

Page 35: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

• JDL – расширяемый язык, предназначенный для описания задач пользователя с помощью задания значений для “атрибутов” и появившияся еще при создании системы распределенных вычислений CONDOR

• Пользователь для запуска свой задачи в инфраструктуре grid должен сформировать файл (job_definition.jdl)

• Некоторые из атрибутов описываются пользователем, а некотрые атрибуты автоматически формируются UI до запуска задания в инфрастуктуру grid

Job Submission

Job Description Language (JDL)Язык описания задачи

Page 36: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Job SubmissionАтрибуты описания задачи

• Executable (обязательный) имя исполняемой команды (программы)

• Arguments (необязательный) аргументы, которые необходимы для исполнения команды, указанной в

Executable

• StdInput, StdOutput, StdErr (необязательный) стандартные ввод/вывод/ошибки задачи

• Environment (необязательный) список установок среды

• InputSandbox (необязательный) список файлов на локальном диске на UI, необходимых для выполнения

задачи перечисленные файлы помещаются на удаленный CE

• OutputSandbox (необязательный) Список файлов, которые будут сформированы в результате выполнения

задания и которые необходимо получить пользователю после выполнения задачи

Page 37: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Job Submission

Атрибуты ресурсовResource Attributes

• Requirements Требования задачи на вычислительные

ресурсы Если не определяются пользователем, то

используется значение, заданное в конфигурации UI

Page 38: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Job Submission

Атрибуты описания данных“Data” Attributes

• InputData (необязательный) относится к данным, используемым как входные к задаче: эти данные

публикуются в Replica Catalog и запоминаются в SEs) PFNs и/или LFNs

• DataAccessProtocol (обязательный, если определен атрибут InputData) Протокол или список протоколов, требумых для доступа к InputData

на данном SE

• OutputSE (необязательный) имя SE-хоста RB использует его для выбора CE, совместимого в требованиями

задачи и наидолее близко расположенного к SE

• OutputData (необязательный) Выходные данные, которые должны быть сформированы в конце

выполнения задачи

Page 39: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

• Пример простейшего описания задачи (myjob1.jdl)

• Мы определили программу для запуска и ее аргументы файлы, куда будет записан стандартный вывод как поступить с выходными файлами

Как написать описание задачи (Job Description)

Executable = "/bin/echo";

OutputSandbox = {"stdout", "stderror"};

stdoutput = "stdout";

stderror = "stderror";

Arguments = "Hi!";

VirtualOrganisation = "cms";

Page 40: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Пример запуска задачи

• Выполняем команду grid-proxy-init вводим в процессе выполнения данной команды свой пароль на

гридовски й сертификат получаем в результате Globus proxy – временный сертификат, дающий

право доступа к сервисам и ресурсам Grid

• Выполняем команду: edg-job-submit myjob1.jdl и получаем в результате уникальный идентификатор задачи (Job

Identifier), JobId

• По выполнению команды: edg-job-status JobId получаем статусную информацию о ходе выполнения задачи

• После завершения выполнения задачи можно выполнить команду

edg-job-get-output JobId в результате чего получаем имя временнго каталога на машине UI, где

находятся результаты выполнения задачи.

Page 41: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

1) Получение proxy-сертификата: grid-proxy-initYour identity: /C=RU/O=DataGrid/OU=jinr.ru/CN=Tikhonenko Elena

Enter GRID pass phrase for this identity:

Creating proxy ................................................... Done

Your proxy is valid until: Fri Sep 2 04:40:02 2005

2) Запуск задачи: edg-job-submit myjob1.jdlSelected Virtual Organisation name (from JDL): cms

Connecting to host gdrb03.cern.ch, port 7772

Logging to host gdrb03.cern.ch, port 9002

*********************************************************************************************

JOB SUBMIT OUTCOME

The job has been successfully submitted to the Network Server.

Use edg-job-status command to check job current status. Your job identifier (edg_jobId) is: - https://gdrb03.cern.ch:9000/OADAXp3Vxet02vlqO29Xpg

*********************************************************************************************

Запуск задачи (1)

JobId

Page 42: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

3) Если не указываем имя своей виртуальной в файле запуска (myjob1.jdl), то получаем диагностику вида:

**** Error: UI_NO_VOMS ****

Unable to determine a valid user's VO

Имя своей виртуальной организации можно указывать не в jdl-файле,а непосредственно в команде edg-job-submit: edg-job-submit --vo CMS myjob1.jdl

4) Запуск задачи с опцией --nomsg :

edg-job-submit --nomsg myjob1.jdl

https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItg

Job SubmissionЗапуск задачи (2)

Получаем только сообщение о JobId

Page 43: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Результатом выполнения команды

edg-job-status https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItgбудет:*************************************************************BOOKKEEPING INFORMATION:Status info for the Job : https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItgCurrent Status: ScheduledStatus Reason: Job successfully submitted to GlobusDestination: ce.ulakbim.gov.tr:2119/jobmanager-lcgpbs-cmsreached on: Thu Sep 1 15:07:00 2005

************************************************************* Когда задача находится в процессе выполнения, в ответ на

edg-job-status https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItgполучаем:*************************************************************BOOKKEEPING INFORMATION:Status info for the Job : https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItgCurrent Status: RunningStatus Reason: Job successfully submitted to GlobusDestination: ce.ulakbim.gov.tr:2119/jobmanager-lcgpbs-cmsreached on: Thu Sep 1 15:10:19 2005*************************************************************

Job Submission

Получение информации о статусе задачи (1)

Page 44: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

После успешного завершения задания в ответ на

edg-job-status https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItg

получим:

*************************************************************

BOOKKEEPING INFORMATION:

Status info for the Job : https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItg

Current Status: Done (Success)

Exit code: 0

Status Reason: Job terminated successfully

Destination: ce.ulakbim.gov.tr:2119/jobmanager-lcgpbs-cms

reached on: Thu Sep 1 15:11:36 2005

*************************************************************

Теперь мы можем ознакомиться с результатами

Job Submission

Получение информации о статусе задачи (2)

Page 45: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

на выполнение команды

edg-job-get-output https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItg

получаем на экране следующую информацию:

Retrieving files from host: gdrb03.cern.ch ( for https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItg )

********************************************************************************* JOB GET OUTPUT OUTCOME

Output sandbox files for the job:

https://gdrb03.cern.ch:9000/26kIm7cU1F9eY0VVhfkItg

have been successfully retrieved and stored in the directory: /tmp/etikhone_26kIm7cU1F9eY0VVhfkItg

*********************************************************************************

Получение результатов (1)

Page 46: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Отправляемся в указанный каталог ( /tmp/etikhone_26kIm7cU1F9eY0VVhfkItg )

сd tmp/etikhone_26kIm7cU1F9eY0VVhfkItg

ls –lagtotal 484drwxr-xr-x 2 zh 4096 Sep 1 17:13 ./drwxrwxrwt 6262 root 483328 Sep 1 17:15 ../-rw-r--r-- 1 zh 0 Sep 1 17:13 stderror-rw-r--r-- 1 zh 4 Sep 1 17:13 stdout

Обнаруживаем там 2 файла: stderror (пустой, т.е. ошибок при выполнении задачи не было) и sdtout, содержащий собственно результат выполнения нашей задачи (в данном случае текст “ Hi! ”)

Получение результатов (2)

Page 47: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Job SubmissionНекоторые полезные команды UI

• edg-job-list-matchПолучение списка ресурсов, соответствующих описанию задачи

(запуск задачи при этом не требуется)

• edg-job-cancelпрекращение выполнения задачи

• edg-job-get-logging-infoполучение информации о прохождении задачи

полезно при отладке программы

• grid-proxy-destroyзакрытие временного сертификата (как выход из сеанса работы в

инфрастурктуре grid)

Page 48: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

• В ОИЯИ UI - cервис доступен с lxpub03.jinr.ru

• В CERN при вхождении на lxplus.cern.ch следует выполнить скрипт grid_env.csh

командой

или

в результате чего установятся переменные окружения, необходимые для доступа к

сервису UI.

Примечание: при получении proxy-сертификата командой grid-proxy-init без параметров, proxy-сертификат обычно выдается на 12 часов. Можно указывать временной интервал, на который необходимо получение proxy-сертификата. Для этого следует использовать опцию –valid HH:MM, например:

grid-proxy-init -valid 150:00Your identity: /C=RU/O=DataGrid/OU=jinr.ru/CN=Tikhonenko ElenaEnter GRID pass phrase for this identity:Creating proxy .............................................. DoneYour proxy is valid until: Fri Sep 9 17:14:03 2005dateSat Sep 3 11:14:08 CEST 2005

Job SubmissionUI в ОИЯИ и в CERN

source /afs/cern.ch/project/gd/LCG-share/sl3/etc/profile.d/grid_env.csh

source /afs/cern.ch/cms/LCG/LCG-2/UI/cms_ui_env.csh

Page 49: Introduction to LCG-2 Введение в LCG-2  E.Tikhonenko ( JINR )

Job SubmissionРекомендуемые документы

• The LCG-2 User Guidehttps://edms.cern.ch/file/454439/1/LCG-2-UserGuide.pdf https://edms.cern.ch/file/454439/1/LCG-2-UserGuide.html

• LCG-2 User Scenario

https://edms.cern.ch/document/498081/1.0

• ClassAd language https://www.cs.wisc.edu/condor/classad

• LCG-2 Frequently Asked Questionshttps://edms.cern.ch/document/495216/