RAID Systeme

Redundant Array

Independent Disks

Einleitung:

Die Bezeichnung RAID

Die Abkürzung RAID bedeutet im englischen soviel wie "Angriff" oder "Überfall". Die Buchstaben stehen für Redundant Array of Independent Disk zu Deutsch: Fehlertoleranter Stapel unabhängiger Festplatten. Früher stand das I für Inexpensive (preisgünstig) , aber da sich große und kleine Plattenlaufwerke heute kaum noch in Sachen Zuverlässigkeit und Preis/Megabyte unterscheiden, tauschte man die Bezeichnung in Independent (Unabhängig / Selbständig).

Was ist RAID ?

Im Jahre 1987 entwickelte eine Gruppe von Wissenschaftler der Universität in Berkley/Kalifornien ein Konzept der RAID- Technologie. Die Herren Patterson, Gibson und Katz stellten Vergleiche über eine Verbund von kleineren Festplatten gegenüber großen Festplatte (SLED = Single Large Expensive Drive) an, wie sich diese in Bezug auf Kosten, Leistung, Datensicherheit und Flexibilität verhalten. Das Resultat war, daß man mit mehrere kleineren Festplatten gleiche oder sogar bessere Werte erzielte, als mit den großen (SLED). Lediglich im Bezug auf die Ausfallrate (MTBF = Mean Time between Failtures) schnitten die kleineren Platten schlechter ab.

Da es im Jahre 1988 einen Wildwuchs an inkompatiblen RAID- Systeme, von vielen Herstellern gab, sorgte dies für große Verwirrung, Unsicherheit und Kaufabstinenz bei den Anwendern. So schlossen sich im August 1992 die 8 Firmen (AIWA/CORE, Array, Data Genaral, ENDL, IBM, Segate, Symbios Logic/NCR, Technology Forums) zum RAB (RAID Advisory Board) zusammen, mit dem Ziel der Standardisierung, Zertifizierung und Ausbildung der RAID- Technologie.

Ein RAID- Array verbindet mehrere Festplatten zu einer logischen Einheit, wobei die Fehlertoleranz, Geschwindigkeit oder Kapazität primär optimiert werden soll. Es gibt verschiedene RAID-Levels die wiederum verschiedene Merkmale besitzen. Je nach dem Ziel der Optimierung und der Einsatzmöglichkeit wird die Entscheidung für den bestmöglichen RAID- Level fallen.

Warum RAID ?

Um in der heutigen Zeit der enorm wachsenden Anforderungen am Speicherbedarf und Datensicherheit in Netzen, wie zum Beispiel für Video on Demand, Audio- Video- Anwendungen, Online Datenbanken und Multimedia, zu gewährleisten bieten RAID- System eine optimale Verfügbarkeit der Daten, sowie eine Permanente Zugriffsmöglichkeit. Da mit RAID Systemen der Datenverlust stark eingeschränkt werden kann, ist es möglich durch Ausfallzeit enorme Unkosten zu vermieden. Mit Kapazitäten im Terrabyte Bereich und einer extrem hohen Datenübertragung mit Hilfe von Fibre Channel, bewältigen RAID- Lösungen diese immer großer werdende Datenflut!

Was bietet RAID ?

Absicherung gegen Ausfall einer Festplatte

Aufbau großer, logischer Laufwerke

Erhöhung der Datensicherheit durch Redundanz

Ständige Datenverfügbarkeit

Steigerung der Transferraten durch Parallelisierung

Beschreibung der RAID- Level

RAID 0 oder Data Striping (Non-Redundant Striped-Set)

Zwei oder mehrere zusammen geschaltete Festplatten, bei denen die Nutzdaten (ABCD..) in kleinere Blöcke (4-128 KB) aufgeteilt werden. Diese Blöcke werden abwechselnd auf den unterschiedlichen Platten des Array gespeichert. Für den Anwender und das System werden die Daten auf einer einzigen logischen Platte dargestellt. Hierbei entsteht keine Redundanz der Daten, es dient einzig und allein der Performancesteigerung beim Schreiben und Lesen und einer 100%tige Ausnutzung der Speicherkapazität, fällt dabei eine Festplatte aus, sind alle Daten verloren.

RAID 1 oder Drive Mirroring / Duplexing

Das RAID Level 1 Verfahren ist das älteste. Dieses Verfahren arbeitet mit Plattenspiegelung. In diesem System werden identische Daten auf zwei Festplatten gespeichert (100 % Redundanz). Fällt eine der beiden Festplatten aus, arbeitet das Betriebssystem mit der verbleibenden Festplatte weiter. Wegen einer 50%tigen Ausnutzung der Speicher-kapazität wird dieses System meist nur in kleineren Servern eingesetzt, da es schnell sehr teuer werden kann. Beim Duplexing hat jede Platte ihren Controller.

RAID 2 oder Hamming System

Im RAID Level 2 wird eine parallele Zugriffstechnik eingesetzt. Typischerweise sind die Schreib-Leseköofe der individuellen Platten synchronisiert. Bei diesem Verfahren werden die einzelnen Daten in Bytes aufgeteilt und auf den Festplatten des Arrays geschrieben, dabei wird der ECC (Error Correction Code) nach einem Hamming Algorithmus berechnet und auf zusätzliche Festplatten gespeichert. Wird ein 1-Bit-Fehler festgestellt, kann der Controller sofort den Fehler lokalisieren und korrigieren, so daß die Lesezugriffszeit nicht beeinträchtig wird. Heutzutage haben alle Massenspeicher ein ECC Verfahren integriert, so das eine Korrektur einzelner Bitfehler ein RAID 2 überflüssig macht.

RAID 3 oder Byte Striping with Parity

Auch im RAID 3 werden die anffallenden Daten parallel auf die Laufwerke geschrieben oder von dort gelesen. In einer RAID 3 Konfiguration werden die Daten in einzelne Bytes aufgeteilt und dann abwechselnd auf die Festplatten geschrieben, hierbei wird ein Parity Byte (XOR) für jede Datenreihe auf einer zusätzlichen Festplatte gespeichert. Bei Ausfall einer Platte, können die Daten aus den übrigen Nutzdaten und der gespeicherten Parity Information wieder berechnet werden. Es kann nur ein Schreib- oder Lesezugriff gleichzeitig stattfinden. Da moderne Betriebssysteme und Festplatten nicht mehr mit einzelnen Bytes, sondern mit Blöcken arbeiten, findet RAID 3 kaum noch Anwendung.

RAID 4 oder Block Striping with Parity

RAID 4 unterscheidet sich von RAID 3, daß die Daten in größere Blöcke (8, 16, 64 oder sogar 128 KB) anstatt in Bytes auf den Festplatten gespeichert werden. Ein Parity Block (vergleichbar mit der Summe der Daten aus dieser Zeile) wird berechnet und auf der Parity Festplatte gespeichert. Im RAID Level 4 wird ein unabhängige Zugriffstechnik eingesetzt. Dabei operiert jede Platte im Array unabhängig von den anderen. Bei großen sequentiellen Lese- Schreibzugriffen ist die Performance sehr gut, doch bei verteilten Zugriffen ist auch ein Zugriff auf den zugehörigen Parity Block notwendig (Prüfsumme erneut berechnen!), so das die Geschwindigkeit gebremst wird. Da diese Lösung (wie auch RAID 3) eine gute Performance, bei großen zusammenhängenden Daten, bietet wird sie gerne bei der Bildverarbeitung und oder im CAD-Bereich eingesetzt.

RAID 5 oder Block Striping with distribute Parity

Im Unterschied zu RAID 4 wird hier der Parity Block über die Festplatten verteilt. Jedes Laufwerk ist damit für einen Blockbereich Parity Laufwerk. Dies beschleunigt verteilte Schreibzugriffe, da es keine dedizierte Festplatte mehr gibt, welche zu einem Flaschenhals werden könnte. Die Festplatten werden nun gleichmäßig belastet und somit wird die Gesamt- Performance gesteigert. Deshalb ist RAID 5 das typische RAID- System, das bei Servern mit hohen Speicherkapazität verwendet wird. Besonderst für viele Zugriffe auf kleine Datenmengen geeignet, daher wird diese Variante gerne in Datenbanken eingesetzt.

RAID 6 (Gruppierung der Disks, mehrere Paritäten)

Erweiterung zu RAID 5, wobei die Festplatten in Gruppen eingeteilt werden. Hierbei dürfen so viele Festplatten gleichzeitig defekt gehen, wie Gruppen vorhanden sind, weil jede Gruppe ihre eigene Parity- Information hat. Zur Berechnung der Checksummen wird der Algorithmus von Reed-Solomon benutzt. Er berechnet zwei voneinander unabhängige Checksummen.

RAID 7 (Asynchron, Cache und Parity Verteilung)

RAID 7 ist zur Zeit noch nicht im RAB- Standard (aber im Gespräch !), es handelt sich hierbei um eine proprietäre Implementierung der Storage Computer Corp., sie baut auch auf den Level 5 auf und enthält eine Steuereinheit mit einem Echtzeit-betriebsystem, schnelle Datenbusse und mehrere größere Pufferspeicher. Die Daten aus dem Puffer sind von den Platten und dem Bus entkoppelt (asynchron). Hierdurch erfolgt eine erhebliche Beschleunigung gegenüber den anderen Verfahren. Die Paritätsinformationen können auf ein oder mehreren Platten (RAID 6) generiert werden und gleichzeitig können mehrere RAID- Level genutzt werden.

RAID 10 oder 0+1 (Mirrored Striping Array)

RAID 10 ist eigentlich nur ein Zusammenschluss von RAID 1 und RAID 0 hiermit wollte man die Eigenschaften beider RAID-Systeme koppeln. Sicherheit und sequentielle Performance. RAID 10 ist besonders geeignet, wenn große Dateien redundant gespeichert werden sollen, da keine Parity berechnet werden muss, sind Schreibzugriffe sehr schnell. Allerdings gehen 50 Prozent der Gesamtkapazität (wie bei RAID 1) für die Redundanz verloren. RAID 10 ist für Systeme kleinerer Nutzkapazität geeignet bei denen optimaler Datendurchsatz mit optimaler Datensicherheit verknüpft werden soll.

RAID Erweiterungen

Hot-swap / Hot plugable

Dies bietet Möglichkeit eine Komponente während des Betriebes ohne Ausschalten auszutauschen. Die neue Festplatte wird dann automatisch von dem Controller mit den entsprechenden Daten wiederhergestellt.

Hot spare / Hot standby / Hot Fix

Zum vorhanden RAID- System wird eine zusätzliche Festplatte hinzugefügt, die jederzeit bereit ist und wird im Fehlerfall aktiv wird. Diese Aufgabe wird direkt vom Controller übernommen. Er deaktiviert die defekte Festplatte im RAID Verband und aktiviert gleichzeitig die Reservefestplatte. Nun baut er die "neue" Festplatte genauso auf wie die ausgefallene.

Tabellarische Übersicht der standardisierten RAID- Systeme

RAID Level
Redundanz
Striping
Parity			Hamming	XOR	XOR	XOR	Reed
Min. Anz - / gesamt Disk		2 / x2	3 / +n				Grp.-Anzahl
Performance
Sicherheit
Beschreibung	Verteilung auf alle Platten	Spiegelung	Haming-Code (ECC)	Byte Verteilung mit Parity	Block Verteilung mit Paryty	Block und Parityverteilung	Asynchron, / Caching und Parity verteilung

RAID- Zukunft und Weiterentwicklung

Verbesserte Zugriffsschutzmechanismen

Verbesserung der Ausfallsicherheit (kein singulärer Fehlerpunkt)

Hierarchische Speicherorganisation (HSM)

Intelligente Speicherverwaltungssysteme

Beschleunigung der Paritätsbildung

Optimierung der Cache- Funktion

Automatische (Re-)Konfiguration bei Laufwerkswechsel

Speicherlaufwerke direkt am Netz ohne Server (NAS)

Arten von RAID -Systemen

Software RAID

Eine Softwarelösung wird durch ein Treiberprogramm (Netzwerk Betriebsystemen wie NetWare und WinNT bereits integriert) realisiert, die RAID Funktionalität wird von der CPU des Systems gemanagt. Eine redundante Absicherung des Betriebssystems ist somit nicht gegeben. Dies ist eine sehr billige Lösung, denn es wird nur ein SCSI- Adapter benötigt.

Hardware RAID

Die Funktionalität bei der Hardwarelösung wird eigens auf dafür entwickelten Controllern ausgeführt und sind vollständig unabhängig vom Betriebssystem. Das bedeutet, daß das RAID- System noch bevor das Betriebssystem geladen wird in vollem Umfang zur Verfügung steht und somit auch die Bootplatte direkt nach dem Einschaltet durch Redundanz abgesichert ist.

Host- basierende RAID- Lösungen

Hier wird der Controller direkt in den Bus (PCI, EISA) des Servers eingesteckt. Durch die direkte Anbindung erreicht man die maximal möglichen Transferraten (bei 64 Bit PCI bis zu 264 MB/s) und ist bei der Konfiguration des RAID selbst sehr flexibel. Es können Platten sowohl in den Server integriert, als auch alternativ in ein externes Gehäuse eingebaut werden.

Plattformunabhängige Disk Arrays

Die Festplatten und der RAID- Controller, welcher sämtliche RAID- Funktionen übernimmt, werden in einem externen Gehäuse untergebracht, und über einen SCSI-BUS an den Server angebunden. Dies bietet den Vorteil, das ein System Anbindung findet, für das es keine HOST- basierenden RAID- Controller gibt. Eine Erweiterung ist die SAF-TE Technik (SCSI Accessed Fault-Tolerant Enclosure), hier wird ein zusätzliches SCSI Gerät Integriert, welches die Überwachung von Temperatur, Lüfter, Netzteile, Einschübe usw. übernimmt und mit dem Controller kommuniziert. Je nach SCSI-BUS ist ein Anschluß von maximal 15 Geräten und einer Übertragungs-geschwindigkeit von 80 MB/s möglich.

Fibre Channel

Im Gegensatz zur SCSI- Technologie handelt es sich hierbei um einen Seriellen BUS. Die Übertragung kann sowohl über Kupfer als auch über Glasfaser erfolgen. Diese High-End Technologie bietet eine mögliche Bandbreite bis zum 1 GByte/s und einen Anschluß von bis zu 126 Geräten. Bei FC-AL ( Fibre Channel Arbitrated Loop) handelt es sich um die zur Zeit verbreitetste Variante. Die FC-AL Geräte werden über einen Hub mit einer PCI-Interface-Karte des Rechners verbunden. Eine 100 MB/s Verbindung kann über ein 25m Kupferkabel bzw. eine 10 Km Fibre-Optic-Leitung realisiert werden.

Quellen:

Bücher:

TecChannel - RAID im Überblick

Telekom Schulungsunterlagen - RAID

SCSI von Gary Field, Peter Ridge

Internet:

http://www.raidweb.com/whatis.html

http://www.icp-vortex.com/download/pdf/raid_d.pdf

http://www.tecchannel.de/hardware/422/1.html

Haupt | Fügen Sie Referat | Kontakt | Impressum | Nutzungsbedingungen

Literatur:
Dreimal Romeo und Julia - William Shakespeare
Death of a Salesman by Arthur Miller
Friedrich Hölderlin Leben und Werk
FAUST von Johann Wolfgang Goethe
Jakob Wassermann´s - Der Fall Maurizius

Geographie:
Die Ehe des Herrn Mississippi
Der Monsun
Gründe für die Aridität der Sahara
Produktionsfaktor GRUND - BODEN
Die Staaten der USA

Geschichte:
NATO - North Atlantic Treaty Organization
Arc de Triomphe
Geschichte - Das Tagebuch der Anne Frank
DIE AUFKLÄRUNG 1700 - 1770
Aquädukte im alten Rom