PilsFree - zcu.cz

Post on 16-Oct-2021

6 views 0 download

transcript

Dohledový systém pro síť PilsFree

Bc. Filip Jeníček

Technický radní PilsFree

duben 2009

2Obsah

ÚvodPilsFree

Technologie

Cíle práce

Návrh řešení monitorování sítě PilsFree

Monitorovací systém RosInfoNávrh

Implementace a její ukázka

Problémy

Závěr

Občanské sdružení PilsFreeHistorie 1/3 – počet uživatelů

3

Občanské sdružení PilsFree Historie 2/3

Rok 2003 – 2005

Technologie

Metalický ethernet v panelových domech

Bezdrátové spoje IEEE 802.11b

Zcomax XI-626

Linuxové routery

4

Občanské sdružení PilsFree Historie 3/3

Události v roce 2005

ČTÚ VO-R12/08.2005-34

WiFi spoje IEEE 802.11a

MikroTik™ (MikroTikls, Latvia)

MikroTik™ RouterBOARD

MikroTik™ RouterOS

5

Občanské sdružení PilsFree Používané technologie 1/2

22 336 síťových zařízení226 serverů

většina patří uživatelům

338 managovatelných switchůSMC, 3COM, AirLive

450 MikroTik routerůx86 PC, RB333, RB433, RB493, RB411, RB600, RB1000

15 Linux routerů

6

Občanské sdružení PilsFree Používané technologie 2/2

Páteřní, distribuční vrstvaRadiové spoje

287x 5 GHz (MikroTik)17x 10 GHz (SVM 20Mbit, Alcoma 88Mbit)2x 11 GHz (Ceragon 150Mbit, Alcoma 200Mbit)1x 18 GHz (KNW 100Mbit)1x 24 GHz (Alcoma 155Mbit)3x 73/83 GHz (GigaBeam 1Gbit)

Laserové optické spoje25x MRV TS800,TS700, TS700G (100Mbit/1Gbit)

Přístupová vrstva1 886x 5 GHz klientů (všehochuť)565x 2,4 GHz klientů

7

Cíle práce

Navrhnout řešení pro

usnadnění dohledu nad sítí a

zjišťování informací o stavu síťových zařízení.

Měla by

pomoci v oblasti diagnostiky problémů v síti a

přispět k rychlejšímu odstraňování poruch.

8

Návrh řešení monitorování sítě PilsFree 1/2

Monitorování klientských zařízeníMajetkem uživatelůVelké množství (2 500)Různí výrobci Budeme monitorovat přístupové body

RosInfoSměrovače

MikroTik™ RouterOSGNU/Linux, Unix, BSD

Přepínače

9

Návrh řešení monitorování sítě PilsFree 2/2

Cacti

Radiové spoje 10 GHz a vyšší

Laserové spoje

Speciální směrovače

+ další zařízení

Nagios

Monitorování síťových služeb a výpadků

10

RosInfoFunkční požadavky

Grafické znázorněníkvalita signálů (MikroTik™ RouterOS)zatížení přenosových cestlatence, dostupnost, ztrátovost paketůzatížení směrovačů a další systémové informace

Negrafickévytížení přenosových cest IP vrstvy (MikroTik™ RouterOS)záloha nastavení (MikroTik™ RouterOS)

Obecnépřidávání nových a editace stávajících zařízení,omezení přístupu podle přístupových práv.

11

RosInfoMimofunkční požadavky

snadno rozšiřitelný, modulární návrh,

jednoduché nasazení a správa,

jednoduché uživatelské rozhranní,

cílovými uživateli jsou administrátoři sítě či mírně pokročilí uživatelé,

data přístupná pro další systémy

12

RosInfoNávrh

13

SQL

databáze

Round robin

databáze

uživatel

webserver

Fetcher

PilsFree

ImporterAnalyzer

Pinger

Monitorovaná síť

ICMP requestICMP replySNMP, FTP,

TELNET, SSH,...

PilsFree

databáze

Backend Frontend

RosInfoFetcher

14

Uložit čas t1,spustit workery

Přidělovat práci

Požádat o práci

Práce?

Farmer Worker

Došla

Přidělena

Všechna zařízení?

Ne

Počkat dot1 + 5 min

Ano

Ukončit

Spustit moduly

Detekovattyp zařízení

RosInfoFetcher – doba zpracování 420 zařízení

15

RosInfoFetcher – strategie přidělování práce

16

ImplementaceBackend

2 databázeMySQL (aktuální informace)

RrdTool (historie, grafy)

PingerAnsi C, mysql, rrdtool, raw sokety

FetcherPHP, mysql, php_rrdtool

Procesy – fork

Přidělování práce – sokety

17

ImplementaceFrontend

XHTML + CSS

Architektura MVC

Framework KohanaPHP

Javascript jQuery + doplňky

Ajax

Nice URLhttp://localhost/index.php?action=edit&host=1

http://localhost/host/edit/1

18

ProblémyPinger 1/2

Každou minutu získáme velké množství informací.

Pro 744 zařízení je potřeba každou minutuaktualizovat 2 232 rrd souborů

o velikosti 335 MB

To vede k tomu, že server přestává na malý okamžik reagovat.

Měření ovlivněné není, ale odezva webového rozhranní zasažena je.

19

ProblémyPinger 2/2

Možná řešeníSnížení velikostí souborů

snížením počtu záznamů, což má ve výsledku vliv na „jemnost“ grafů,

snížením počtu ukládaných parametrů.

Ukládat hodnoty s delší periodouztráta informace

Neukládat hodnoty najednouRozložit ukládání do celých 60 vteřin.

Zvýšení výkonu úložištěSeparátní výkonný disk pro data.

20

Závěr

Aplikace RosInfo

GNU GPL verze 3

http://sourceforge.net/projects/rosinfo/

21