Home Technologien & Lösungen Storage & Backup Grundlagen Speicherlösungen: Kriterien zur Auswahl des richtigen Storage-Systems
18 | 05 | 2012
PDV-Systeme
Banner
Grundlagen Speicherlösungen: Kriterien zur Auswahl des richtigen Storage-Systems Drucken

Die Auswahl und Dimensionierung einer Storage-Umgebung ist kein leichtes Projekt. Vielfältig sind die Wege, unnötiges Geld zu verbrennen, aber ebenso groß sind die Risiken, die bei zu viel Geiz zur Katastrophe führen können. Dieser Artikel soll einen groben Überblick darüber vermitteln, welche Entscheidungsgrundlagen bei der Auswahl eines Storage-Systems tatsächlich zählen – und welche Argumente Sie getrost vergessen dürfen.

Die Gewichtung der nachfolgenden Kriterien ist natürlich von Fall zu Fall unterschiedlich und abhängig von den Rahmenbedingungen; die letztendlich richtige Zusammenstellung Ihrer Storage-Umgebung sollte daher nur auf einer individuellen Beratung basieren. Dennoch wird Ihnen dieser Artikel künftig als kleiner Leitfaden dienen.

Das liebe Budget …

Dieser ganz banale Aspekt ist häufig (leider) der entscheidende Punkt. Letztlich gibt es zwei Ansätze: Entweder ich habe ein Budget und muss versuchen, das Beste daraus zu machen, oder ich beantrage rechtzeitig das Budget, welches ich benötige, um eine tatsächlich optimale Lösung zu realisieren. Aber auch dann, wenn ich nur ein begrenztes Budget zur Verfügung habe, gibt es Möglichkeiten zur Optimierung:

Die einfachste Möglichkeit ist natürlich, den Einkaufspreis zu senken (… nicht den Preis zu drücken – darin besteht ein Unterschied!). Die Hersteller bieten unterschiedliche Lizenzmodelle für Ihre Storage- Systeme (Lizensierung nach Brutto- Volumen, Anschlusstechnik, Anzahl der zugreifenden Server, Funktionalitäten, Controller-Typ und/oder Protokollen). Abhängig von der Lizensierungspolitik ergeben sich bei ansonsten gleicher Eignung häufig erhebliche Preisunterschiede. Man sollte sich auch fragen, ob man unbedingt ein vollständig neues System benötigt oder ob sich nicht auch alle Anforderungen durch den Erwerb einer Renew-Lösung oder gar eines Gebraucht-Systems abdecken lassen. PDV-Systeme bietet beispielsweise auch bei Gebraucht-Systemen umfangreiche Garantie- und Service-Leistungen an, sobald diese nicht (mehr) durch den Hersteller selbst gegeben sind.

Ein weiterer Weg zur Senkung des Kaufpreises ergibt sich durch die Reduzierung der erforderlichen Storage-Kapazität um bis zu 50 Prozent. Keine Angst, Sie sollen nicht die Hälfte Ihrer Daten löschen. Aber verschiedene Hersteller bieten inzwischen die Möglichkeit des „Thin Provisioning“ an. Kurz umschrieben: Das Storage-System gaukelt den Servern mehr freie Kapazität vor als physikalisch tatsächlich vorhanden ist. Bezogen auf das Budget bedeutet das: Ich erziele eine deutlich bessere Auslastung meines Storage- Systems und muss weniger Kapazität auf Vorrat kaufen. Angenehmer Nebeneffekt ist, dass Volumes nicht mehr nachträglich vergrößert werden müssen (was insbesondere den einen oder anderen Windows-Adminstrator sicherlich erfreut). Speziell von NetApp gibt es mit Deduplizierung eine weitere Möglichkeit, die erforderliche Speicher- Kapazität deutlich zu senken. Mit Deduplizierung werden identische Datenblöcke nicht mehr doppelt oder mehrfach gespeichert. Insbesondere in VMWare-Umgebungen (ESX-Server und VDI) können so bis zu 50 Prozent der erforderlichen Kapazität eingespart werden.

Weniger Daten brauchen weniger Platten, weniger Platten brauchen weniger Shelfs, weniger Platten und weniger Shelfs bedeuten: deutlich geringerer Kaufpreis. Ziel erreicht.

Es gibt noch eine dritte Möglichkeit, Geld zu sparen: den Einsatz unterschiedlicher Plattentypen, abhängig von Alter und Aktualität der gespeicherten Daten (auf neudeutsch: Tiering). Hochaktuelle Daten sowie Informationen, auf die möglichst schnell zugegriffen werden muss, werden auf schnellen FibreChannel-Platten gespeichert, während ältere Dateien und Archivierungsdaten auf den langsameren, aber auch preisgünstigeren SATAPlatten gespeichert werden.

Systemwahl nach Hersteller

Grundsätzlich sollte die Auswahl eines Storage-Systems nicht nach dem Namen des Herstellers erfolgen. Es gibt jedoch – wie immer im Leben – auch hier Ausnahmen, die eine solche Vorgehensweise sinnvoll machen.

Ein gelegentlich anzutreffender Fall ist, dass Software-Hersteller ihre Produkte nur für bestimmte Hardware-Hersteller bzw. Storage-Systeme zertifiziert haben. Manchmal führen auch technische Gründe dazu, dass nur ein Hersteller in Frage kommt. Wenn Sie z. B. stolzer Besitzer einer HP-EVA sind und ein redundantes Rechenzentrum aufbauen wollen, so müssen Sie auch am zweiten Standort eine HP-EVA einsetzen, um zwischen den Storage-Systemen per „Continuous Access“ spiegeln zu können.

Auch andere Hersteller bieten Lösungen zur Virtualisierung kompletter heterogener Storage-Umgebungen an, wie z. B. HP oder DataCore. In all diesen Fällen sollte eine detaillierte Kostenbetrachtung erfolgen, um zu klären, ob ggf. doch der Austausch des vorhandenen Storage-Systems unterm Strich günstiger käme.

Vorhandene und künftige Betriebssysteme

Gerne übersehen, aber ganz wichtig: Werden alle Betriebssysteme, die ich derzeit einsetze oder die ich zukünftig einsetzen werde, von dem neuen Storage- System unterstützt? Nicht jedes Storage-System unterstützt alle Betriebssysteme. Setzen Sie z. B. OpenVMS ein, sinkt die Anzahl der in Frage kommenden Anbieter drastisch. In diesem Zusammenhang sollten Sie sich auch fragen, ob der Einsatz von Clustern geplant ist und ob diese von der entsprechenden Hardware unterstützt werden (auch hier sei als Beispiel OpenVMS (VMS-Cluster) genannt).

Setzen Sie VMWare oder ein anderes Virtualisierungsprodukt ein oder planen Sie die Virtualisierung Ihrer Server, sollten Sie prüfen, inwieweit der Hersteller der Storage-Hardware mit dem Hersteller der geplanten Virtualisierungs- Software kooperiert.

Anwendungen

Ein sehr wichtiges Kriterium für die Auswahl und die Dimensionierung eines neuen Storage-Systems sind die Anwendungen, die dieses System künftig nutzen sollen. Dabei ist in erster Linie wichtig, ob die jeweilige Anwendung dateiorientiert (neudeutsch: file-basierend) oder blockorientiert arbeitet. Dass nur eine dieser beiden Möglichkeiten benötigt wird, ist im Alltag relativ selten; in der Regel werden Sie sowohl dateiorientierte Anwendungen (z. B. Textverarbeitung, Excel, usw.) als auch blockorientierte Anwendungen (z. B. Datenbanken, Exchange) kombiniert im Einsatz haben. Das Verhältnis der beiden Zugriffsarten zueinander beeinflusst die Bruttokapazität, die ich benötige, um eine bestimmte Nettokapazität zu erreichen.

Generell haben die am Markt verfügbaren Storage-Systeme meistens entweder beim dateiorientierten Zugriff oder beim blockorientierten Zugriff ihre individuelle Stärke. Manche Systeme unterstützen z. B. nur einen (extrem schnellen) blockorientierten Zugriff und benötigen für dateiorientierten Zugriff entweder einen zusätzlichen NASHeader oder einen Fileserver, der diese Funktionalität zur Verfügung stellt (z. B. HP EVA).

Beim blockorientierten Zugriff gibt es hinsichtlich der erforderlichen Infrastruktur zwei Ansätze: den Zugriff über iSCSI oder über FibreChannel. Letztes ist deutlich teurer als iSCSI, da es eine spezielle separate Infrastruktur zwischen Server und Storage-System benötigt, ist aber im Vergleich zu iSCSI auch deutlich performanter. iSCSI nutzt dagegen für die Anbindung der Server an das Storage-System das vorhandene LAN oder ein separates LAN. LAN-Switches und Netzwerkarten sind ungleich günstiger als FibreChannel- Switches und HBAs, womit wir wieder beim Kosten-Aspekt wären.

NetApp-Systeme vereinigen übrigens dateiorientierten und blockbasierten Zugriff (über iSCSI und FibreChannel) in einem System (Anmerkung: der iSCSIZugriff ist kostenlos, den Rest können Sie für einen geringen Betrag lizensieren).

Performance

Die Performance ist eines der wichtigsten Kriterien bei der Auswahl eines Storage- Systems. Die Performance ist aber nicht nur abhängig von Hersteller und Modell, sondern auch von der Dimensionierung des Storage-Systems. Hier gilt nämlich:

  • Die Performance ist abhängig vom Raid-Level.
  • Die Performance ist abhängig von der Anzahl der gleichzeitig drehenden Spindeln, d.h. je mehr Festplatten im System verbaut sind, desto schneller wird mein Storage. Daraus folgt: Bei hohen Performance-Ansprüchen lieber viele kleine Platten als weniger große Platten.
  • Die Performance ist abhängig von den eingesetzten Plattentypen. Eine FibreChannel- Platte oder eine SAS-Platte mit 15.000 rpm ist nun mal deutlich schneller (und zuverlässiger) als eine SATA-Platte mit 7.200 rpm, kosten natürlich auch mehr.
  • Eine Performance-Verbesserung lässt sich auch über einen großen Cache erreichen.
  • Maximale Performance bieten Solid State Disks (SSD), die komplett auf RAM-Bausteinen basieren und keine mechanisch beweglichen Teile verwenden. NetApp und HP bieten SSDs neuerdings als Zusatzoption für einen Teil ihrer Storage-Systeme an.

… und die Verfügbarkeit

Um die Verfügbarkeit der Systeme zu erhöhen, bieten die Hersteller eine ganze Reihe von Optionen an. Hier gilt, dass Sie in erster Linie zunächst einmal für sich selbst festlegen müssen, welche Verfügbarkeit Sie benötigen. Wie lange darf das Storage-System ausfallen, ohne dass ich Probleme z. B. durch Produktionsstillstand bekomme? Wie lange dauert es, die Daten mit herkömmlichen Mitteln (Bandsicherung) wiederherzustellen? Und welcher Aufwand besteht, um neue Daten, die während eines Ausfalls des Storage-Systems im Produktionsprozess anfallen, nachzupflegen?

Eine sehr einfache Möglichkeit stellt die Auswahl des geeigneten Raid-Levels dar. Darf nur eine Platte ausfallen (z. B. RAID 5) oder dürfen 2 Platten gleichzeitig ausfallen (RAID 6, RAID DP), bevor es zu Datenverlusten kommt? Oder nutze ich z. B. RAID 1 (alle Platten sind gespiegelt)?

Um versehentlich gelöschte Dateien oder korrupte Volumes innerhalb von Sekunden wiederherstellen zu können, bietet sich der Einsatz von SnapShots an (Anmerkung des Verfassers: In der Art und Weise, wie das realisiert wird, und in dem geringen zusätzlichen Speicherbedarf für SnapShots liegt eine der großen Stärken von NetApp-Systemen. Einzelne Dateien wiederherstellen kostet nichts, ganze Volumes wiederherstellen gibt es gegen ein geringes Entgelt. Fragen Sie den Verfasser!)

Um sich gegen Hardwareausfälle abzusichern, ist die redundante Auslegung möglichst vieler Komponenten, insbesondere der Controller, möglich. Storage- Systeme, die z. B. nicht die Möglichkeit bieten, redundante Controller einzubauen, sollten Sie gar nicht erst in Betracht ziehen.

Um die Zeit, die für die Herstellung der Daten nach einem Ausfall benötigt wird, zu minimieren, können Sie z. B. auf das Verfahren Backup-To-Disk zurückgreifen. Eine Rücksicherung von Platten nimmt deutlich weniger Zeit in Anspruch als eine Rücksicherung von Bändern – falls diese nach langer Lagerung überhaupt noch lesbar sind.

Aufwendiger wird es, wenn Sie den Ausfall eines kompletten Storage-Systems oder eines kompletten Standortes abfangen wollen. In diesem Fall benötigen Sie in einem anderen Brandabschnitt ein zweites Storage-System, auf das die Daten vom primären System synchron, semi-asynchron (nur bei NetApp) oder asynchron gespiegelt werden. Die Funktionsweise dieser Verfahren zu beschreiben, würde den Rahmen dieses Artikels sprengen; daher sei hier auf entsprechende Fachliteratur verwiesen. In diesem Zusammenhang stellt NetApp MetroCluster einen Sonderfall dar, welches auf Knopfdruck ohne Datenverlust einen kompletten transparenten Failover von einem Standort zu einem anderen ermöglicht. Details zum Metro- Cluster finden Sie auf Seite 10 in diesem Heft.

Fazit

Abschließend bleibt mir noch ein kurzes Resümee: Ein zuverlässiges Storage- System kostet Geld, je nach Systemwahl und Ansprüchen an Verfügbarkeit und Performance mal mehr, mal weniger. Wer sich aber der Auswirkungen eines Ausfalls der IT-Infrastruktur, eines Datenverlustes oder eines Produktionsstillstandes im Klaren ist, wird das Storage-System auch mit dem notwendigen Respekt und der angebrachten Sorgfalt zusammenstellen und implementieren. Glauben Sie mir: Man schläft dann auch einfach besser.

 
Banner