autonóm és hibatűrő informatikai rendszerek

31
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Autonóm és hibatűrő informatikai rendszerek 2013.09.09.

Upload: lark

Post on 15-Feb-2016

47 views

Category:

Documents


0 download

DESCRIPTION

Autonóm és hibatűrő informatikai rendszerek. 2013.09.09. A félévről. Előadók dr. Pataricza András Kocsis Imre (op. felelős) + meghívott előadók ikocsis @ mit.bme.hu , IB418, (+36 1 463) 2006 1 ZH (~félév közepén), szóbeli vizsga http://www.inf.mit.bme.hu/edu/courses/autonom. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Autonóm és hibatűrő  informatikai  rendszerek

Budapesti Műszaki és Gazdaságtudományi EgyetemMéréstechnika és Információs Rendszerek Tanszék

Autonóm és hibatűrő informatikai rendszerek

2013.09.09.

Page 2: Autonóm és hibatűrő  informatikai  rendszerek

A félévről Előadók

o dr. Pataricza Andráso Kocsis Imre (op. felelős)o + meghívott előadók

[email protected], IB418, (+36 1 463) 2006

1 ZH (~félév közepén), szóbeli vizsga

http://www.inf.mit.bme.hu/edu/courses/autonom

Page 3: Autonóm és hibatűrő  informatikai  rendszerek

Motiváció Ezredforduló: „rendszermenedzsment-válság”

Beüzemelés és karbantartás költségei!o És egyéb minőségi jellemzői, pl. rendelkezésreállás

N.B.: „enterprise software” nézőpont

‚Computing systems’ complexity appears to be approaching the limits of human capability, yet the march toward increased interconnectivity and integration rushes ahead unabated.’ (Kephart et al. 2003)

Page 4: Autonóm és hibatűrő  informatikai  rendszerek

Motiváció

Történelmi perspektíva: belső adatközpontok, Tivoli et al., utility computing’, dinamikus WS-ek, stone knives and bearskins

Ami nem látszott: cloud computing

As systems become more interconnected and diverse, architects are less able to anticipate and design interactions among components, leaving such issues to be dealt with at runtime. (Kephart et al. 2003)

Page 5: Autonóm és hibatűrő  informatikai  rendszerek

„Autonóm számítástechnika”

Az autonomic computing (AC, autonóm informatika) az autonóm idegrendszert modellező rendszertervezési paradigma. A rendszer alapvető állapotváltozóiban bekövetkező változás a teljes rendszert viselkedését megváltoztató beavatkozást vált ki, amely biztosítja, hogy a rendszer egyensúlyi állapotba kerül a környezetével.

Page 6: Autonóm és hibatűrő  informatikai  rendszerek

„Autonóm számítástechnika” 2001: IBM „manifesto” az önmenedzsment jegyében

Fő inspiráció: az (emberi) idegrendszero Tágabb értelemben a biológiai rendszerek

Három alapvető elvo Szabályozási körök (control loop)o „dinamikus tervkésztés”o Öntudattal rendelkező (self-aware), reflektív rendszerek

Rendszerszintű megközelítéso Automatizálás + felügyelet minden rétegbeno Federált, heterogén komponenensek kohezívan együttműködnek

Page 7: Autonóm és hibatűrő  informatikai  rendszerek

Self-* tulajdonságok

Forrás: [1], p 43

Page 8: Autonóm és hibatűrő  informatikai  rendszerek

Self-* tulajdonságok• A self-* (ön*) tulajdonságok AC rendszerek

makroszkopikus tulajdonságai

Page 9: Autonóm és hibatűrő  informatikai  rendszerek

Önkonfiguráció - Self-configuration• Automatikus adaptáció a dinamikusan változó

környezethez• Belső adaptáció

o Komponensek hozzáadása vagy elvétele (software)

o Futás közbeni újrakonfiguráció• Külső adaptáció

o A globális infrastruktúra szerintsaját magát állítja be a rendszer

Belső állapot

Környezet

Page 10: Autonóm és hibatűrő  informatikai  rendszerek

Öngyógyítás - Self-healing• Külső zavarás felismerése, diagnosztizálása és

szolgáltásmegszakítás nélküli kezelése• Autonóm problémafelismerés és

megoldás• A hibás komponenseket

o detektálni,o izolálni,o javítani,o újraintegrálni. Hibás komponens

Page 11: Autonóm és hibatűrő  informatikai  rendszerek

Önoptimalizáció - Self-optimization• Erőforrások automatikus monitorozása, hangolása,

felügyeleteoMűködés nem előre jelezhető körülmények közötto Erőforrás kihasználás maximalizálása

emberi beavatkozás nélkül• Dinamikus erőforrás allokáció és

terhelés-menedzsmento Erőforrás: tárhely, adatbázis,

hálózato Példa: dinamikus szerver fürtök

Resourcemanagement

Page 12: Autonóm és hibatűrő  informatikai  rendszerek

• Támadásokra való felkészülés, detektálás, azonosítás és védelemo Felhasználói hozzáférés

definiálása és felügyeleteminden erőforrásra

o Jogosulatlan hozzáférés ellenivédelem

Önvédelem - Self-protection

Belső erőforrás

Külső erőforrás

Page 13: Autonóm és hibatűrő  informatikai  rendszerek

Megvalósítási minta: MAPE-K

Forrás: [1], p 44

Page 14: Autonóm és hibatűrő  informatikai  rendszerek

Autonomic Element - AE•Az architektúra alapeleme a

•Felügyelt egységből• Adatbázis, alkalmazásszerver , stb

•És autonóm menedzserből álló Autonóm egység

• Feladatai:• A funkcionalitás nyújtása• Saját viselkedésének felügyelete a self-

* tulajdonságok alapján• Együttműködés más autonóm

egységekkelAz autonóm egység

Managed ElementES

Monitor

Analyze

Execute

Plan

Knowledge

Autonomic Manager

Page 15: Autonóm és hibatűrő  informatikai  rendszerek

Általánosított „ágens”

Page 16: Autonóm és hibatűrő  informatikai  rendszerek

AE: Kölcsönhatások

•Kapcsolatok AE-k között:– Dinamikus, ideiglenes,

célorientált– Szabályok és kényszerek

definiálják– Egyezség által jön létre

• Ez lehet tárgyalás eredménye– Teljes spektrum

• Peer-to-peer• Hierarchikus

– Házirendek (policy) szabályozhatják

Page 17: Autonóm és hibatűrő  informatikai  rendszerek

Önszervezés Az önszervezés

o alacsony szintű egységekben végrehajtott o dinamikus folyamatok összessége, amely soráno struktúra vagy rend jelenik meg o globális szinten.

Az önszervező viselkedést eredményező szabályokat (amelyek a kölcsönhatásokat meghatározzák) az AE-k csupán lokális információ alapján alkalmazzák

Page 18: Autonóm és hibatűrő  informatikai  rendszerek

AC referencia architektúraRészben vagy teljesen automatizált folyamatok(pl. ITIL folyamatok)

Az AC rendszer által felügyelt erőforrások

IT építőelemek, és összekapcsolásukleírása

Építőelemek kombinálása tipikusforgatókönyvekké

Page 19: Autonóm és hibatűrő  informatikai  rendszerek

Kölcsönhatások

Page 20: Autonóm és hibatűrő  informatikai  rendszerek

Kitekintés: AC és MI [3] Policy (~szabály, házirend, eljárásrend) alapú tervezés

o Állapot alapú

Actiono ECA (~üzleti szabály)

Goalo „Célállapot”; a rendszer dönt (pl. heurisztika)

Utility function (hasznosság)o Minden állapotnak „érték”; nem bináris hasznosságo Rugalmasabb működés, nehezebb specifikáció

Page 21: Autonóm és hibatűrő  informatikai  rendszerek

Eljárásrendek: specifikációs szintek

Page 22: Autonóm és hibatűrő  informatikai  rendszerek

Példa: Action policy „Gold” és „Silver” tranzakciók egy adatközpontban Policy ütközés, „vergődés”

Mi lesz az osztott erőforrásokkal?

Megoldás: pl. a priori tudás bevitele(pl. Gold fontosabb, mint Silver,

bizonyos szint fölött nem kérünk plusz CPU-t, másik szerverre allokáljuk a terhelést, … )

Page 23: Autonóm és hibatűrő  informatikai  rendszerek

Példa: Goal policy Ugyanaz az adatközpont, cél: „Vágyott”+elérhető tartományok

Adott terhelés és erőforráskészlet mellett

T: adott tranzakcióosztály válaszidejeC: erőforrás

α: kapcsolat a CPU és a válaszidő közt λ: érkezési ráta

(egyszerű sorbanállási modell alapján)

Page 24: Autonóm és hibatűrő  informatikai  rendszerek

Példa: hasznosság alapú policy

Pl. SLA alapján Vezérelhet cél alapú policyt, pl. erőforrás

menedzser szintjéno Egyszerű specifikáció, komplex döntési logika

Page 25: Autonóm és hibatűrő  informatikai  rendszerek

Kihívások, feltételezések A hasznosság előre ismert

o Rossz specifikáció: Silver osztály „éhezik”o Nincsenek kiugróan fontos/hosszú tranzakciók

Taszkváltás hatása elhanyagolható Válaszidő egyértelműen mérhető

o Átlag? Max? Az erőforrásmenedzsment hatékony

o Nem ront a helyzeten az átkonfigurálás

Page 26: Autonóm és hibatűrő  informatikai  rendszerek

Példa: tanulságok Eredmény:

o Hihetően működőo automatikuso (valamennyire … erősen) deklaratívo újrakonfigurációs logikao ami SLA-k sértése ellen védo (persze nem tökéletes)

Figyeljük meg: matematikai apparátus…

Page 27: Autonóm és hibatűrő  informatikai  rendszerek

Autonóm rendszerek összehasonlítása QoS Költség Rugalmasság/Granularitás Autonómia foka Adaptivitás Reakcióidő Érzékenység Stabilitás

Page 28: Autonóm és hibatűrő  informatikai  rendszerek

Motivation for Autonomic Computing

• System Uncertainty– Very large scales– Ad hoc structures/behaviours

• p2p, hierarchical, …– Dynamic

• entities join, leave, change behaviour

– Heterogeneous• capability, connectivity,

reliability,– Lack of guarantees

• components, communication– Lack of common/complete

knowledge• number, type, location,

availability, connectivity, protocols, semantics

• Information Uncertainty– Availability, resolution, quality of

information– Devices capability, operation,

calibration– Trust in data, data models – Semantics

• Application Uncertainty– Dynamic behaviours

• space-time adaptivity– Dynamic and complex couplings

• multi-physics, multi-model, multi-resolution, ….

– Dynamic and complex (ad hoc, opportunistic) interactions

– Software/systems engineering issues

• Emergent rather than by design

Research directions

Page 29: Autonóm és hibatűrő  informatikai  rendszerek

Minek ez 2013-ban?

Page 30: Autonóm és hibatűrő  informatikai  rendszerek

AC aktualitása A mérnöki és matematikai aspektusok időtállóak „Keret”:

o Nemfunkcionális rendszeraspektusok adatvezérelt (rendszer)modellezése

o Diagnosztikao Felügyelet- és reakció-tervezéso Deklaratív automatizáláso „self-*” kommunikációo Tervezési minták

Aktuális domain: cloud rendszerek

Page 31: Autonóm és hibatűrő  informatikai  rendszerek

Források [1] Kephart, J. O., & Chess, D. M. (2003). The vision of autonomic computing.

Computer, 36(1), 41-50. IEEE Computer Society. doi:10.1109/MC.2003.1160055 [2] McCann, J., & Huebscher, M. C. (2004). Evaluation issues in autonomic

computing. Grid and Cooperative Computing – GCC 2004 Workshops (pp. 597–608). Springer. doi:10.1007/978-3-540-30207-0_74

[3] Kephart, J. O., & Walsh, W. E. (2004). An artificial intelligence perspective on autonomic computing policies. Proceedings. Fifth IEEE International Workshop on Policies for Distributed Systems and Networks, 2004. POLICY 2004. (pp. 3-12). IEEE. doi:10.1109/POLICY.2004.1309145