+ All Categories
Home > Documents > Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve VS FZÚ )

Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve VS FZÚ )

Date post: 23-Feb-2016
Category:
Upload: ziv
View: 41 times
Download: 0 times
Share this document with a friend
Description:
Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve VS FZÚ ). Ji ří Chudoba Institute of Physics and CESNET, Prague. Přehled. Hardware Jeho využití ATLAS Data management VO auger Další skupiny – fyzika pevných látek Tým – mo žnost aktivní účasti!. EGI v CZ. - PowerPoint PPT Presentation
21
www.egi.eu EGI-InSPIRE RI-261323 EGI- InSPIRE www.egi.eu EGI-InSPIRE RI-261323 Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve VS FZÚ) Jiří Chudoba Institute of Physics and CESNET, Prague
Transcript
Page 1: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

EGI-InSPIRE

www.egi.euEGI-InSPIRE RI-261323

Gridové výpočty pro velké projekty i jednotlivé uživatele(aktivity ve VS FZÚ)

Jiří ChudobaInstitute of Physics and CESNET, Prague

Page 2: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

Přehled

• Hardware• Jeho využití• ATLAS Data management• VO auger• Další skupiny – fyzika pevných látek• Tým – možnost aktivní účasti!

4.3.2013 [email protected] 2

Page 3: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

EGI v CZ

4.3.2013 [email protected] 3

http://grid-monitoring.cern.ch/myegi/gridmap/

Page 4: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

Hardware – středisko FZÚ

• praguelcg2• publikujeme 3860 jader• 1.5 PB DPM, 540 TB xrootd, 40 TB dcache v

Plzni• HW různého typu

4.3.2013 [email protected] 4

Page 5: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

Hardware – středisko FZÚ

4.3.2013 [email protected] 5

• Hlavní serverovna• 62 m2, ~20 racks 350 kVA motor generator, 200 + 2 x 100 kVA

UPS, 108 kW air cooling, 176 kW water cooling

Page 6: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

HW ve FZÚ

Farma Goliáš z několika subklastrů• společný torque server, subklastry z

různého hw

4.3.2013 [email protected] 6

Například subklastr rubus:23 uzlů SGI Rackable C1001-G132x (Opteron 6274 16 jader) 64 GB RAM, 2x SAS 300 GB374 W (full load)232 HS06 na uzel, 5343 HS06 celkem

Celkem v klastru Goliáš: 30700 HS06

Page 7: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

HW ve FZÚ

4.3.2013 [email protected] 7

47%

26%

22%

4% 1%

37%

30%

28%

1% 4%

d0

alice

atlas

auger

solid

2011 HS06 shareAlice+Star 7551 30Atlas 7087 28D0 9165 37Solid 914 4Calice 30 0Auger 205 1

24951 100

2012 HS06 shareAlice+Star 7564 25Atlas 11861 39D0 9969 32Solid 629 2Calice 13 0Auger 668 2

30704 100

3%4% 15%

22%

15%8%

5%

12%

17%

Golias-pGolias-cIberisIbisIbSalixSaltixDorjeRubus

Plán a skutečnost (walltime)Kapacita podle subklastrů

Page 8: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

Tier2 centrum pro LHC

Příspěvky pro 2012 ATLAS závazek: 10000 HS06, 1030 TiB; dostupné: 11861 HS06, 1300 TB ALICE závazek: 5000 HS06, 420 TiB; dostupné: 7546 HS06, 540 TB

4.3.2013 [email protected] 8

Plnění: vyžaduje se 70% z plánované kapacity, ale CPU timeProblematické pro ALICE, kde je efektivita kolem 50%

Page 9: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

Monitorování - externí

4.3.2013 [email protected] 9

Page 10: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

ATLAS DDM

• Komplikovaný systém pro potřeby projektu ATLAS• Současná verze DQ2, nová Rucio• Eviduje 120 PB dat, 350 mil. souborů• DQ2:

• práce s Datasety (množiny souborů)• db pro DS a jejich obsah• fyzické umístění souborů pomocí LFC• 11 LFC (jeden LFC pro oblast) postupně přenášeno do CERN• FTS zůstávají v Tier1• podpůrné služby: DaTRI, data popularity, obsazenost prostoru

4.3.2013 [email protected] 10

Page 11: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

ATLAS DDM

4.3.2013 [email protected] 11

Přenosy dat do FZÚ, graf za 1 týden

Page 12: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

ATLAS – přenosy dat

4.3.2013 [email protected] 12

Přenesený objem dat

Page 13: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

ATLAS – přenosy dat

4.3.2013 [email protected] 13

počty přenesených souborů za den

Page 14: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

Lokální přenosy

4.3.2013 [email protected] 14

Přenosy z lokálních SE (nejvíce na lokální WN) dosahují rychlosti přes 30 Gbps

Page 15: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

Výsledky

4.3.2013 [email protected] 15

https://twiki.cern.ch/twiki/bin/view/AtlasPublic

Number of public papers: 245 Number of public papers with collision data: 237 Number of published papers: 216 Last updated: 2013-02-25, 17:02

Page 16: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

PAO

• Pierre Auger Observatory

• 19 zemí, 500 členů, 94 institucí

• plocha 3000 km2

4.3.2013 [email protected] 16

Page 17: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

VO auger

• Založili jsme roku 2006 v rámci EGEE II• Poskytujeme centrální služby

• VOMS, LFC• Největší VO mimo LHC ve využití CPU

4.3.2013 [email protected] 17

Page 18: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

VO auger: Zapojení mnoha oblastí

4.3.2013 [email protected] 18

Poměr příspěvků pro VO auger různých oblastí do celkového použitého výpočetního času; data pro celý rok 2011

Page 19: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

Superpočítač Dorje

• Vyhrazený klastr pro skupiny fyziky pevných látek

• Altix ICE8200, 512 jader, 64 uzlů spojených Infiniband

• Využití 50 až 80% kvůli omezujícím pravidlům (maximální počet úloh od 1 uživatele), požadavek na okamžitou odezvu

• Rozšíření ještě v tomto roce, investice 900 kKč

4.3.2013 [email protected] 19

Page 20: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

Lidské zdroje

• Neprovozujeme standardní software• Správa vyžaduje proaktivní přístup, častou komunikaci, otevřenou

hlavu!• Prostor pro nové nápady, detailní ladění a zkoumání určitých částí• Správa OS, monitorování, programování v shell, python, perl, C,

C++, Fortran, správa MySQL, práce s páskami, ...

• Schopní pracovníci stále vítáni.

4.3.2013 [email protected] 20

Kontakt: [email protected]

http://www.farm.particle.cz/twiki/bin/view/VS/WebHome

Page 21: Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve  VS  FZÚ )

www.egi.euEGI-InSPIRE RI-261323

pád dpm daemona 28.9.2012

• email od nagios ve 4:18 (plus SMS)• TK restartoval v 10:20, zápis do FarmEvents

• recovery: email a SMS v 10:21• 13:42 GGUS TEAM lístek 86515 (RT 35874)

In the last 6 hours more than 300 failures in praguelcg2 production.• TK odpověděl a zavřel ve 13:45

4.3.2013 [email protected] 21

V pátek 28.9. začínal dlouhý víkend. Oficiálně nemáme žádné směny mimo pracovní dobu.


Recommended