Cohesity SpanFS™ and SnapTree®

Die Mission von Cohesity ist es, den sekundären Speicher neu zu definieren. Herkömmliche Storage-Lösungen, wie zum Beispiel Dedupe-Appliances, Backup-Software und NAS-Geräte, können nicht mit den Bedürfnissen des modernen Unternehmens Schritt halten. Unternehmen müssen schnell steigende Datenmengen verwalten. Hochrechnungen von IDC geben 6 Zettabytes im Jahr 2016 an und prognostizieren 93 Zettabytes bis 2025. Der Trend in Unternehmen geht auch Richtung Multi-Cloud, somit müssen Daten in Cloud-Umgebungen für Recovery-, Test/Dev- und analytische Zwecke verfügbar gemacht werden.

Um diese unternehmerischen Herausforderungen zu lösen, hat Cohesity das Konzept des Hyperconverged Secondary Storage vorangetrieben, welches es Unternehmen ermöglicht:

  • Daten von verschiedenen sekundären Storage-Lösungen auf einer einzigen Web-Scale-Platform zu konsolidieren – einschließlich Backups, Dateien und Objekte
  • Unmittelbare Bereitstellung von Daten für die Wiederherstellung, Test/Dev und Analysezwecke
  • Verwalten von Daten in Multicloud-Umgebungen

Diese Vision von Hyperconverged Secondary Storage konnte Cohesity mit alten, herkömmlichen Dateisystemen nicht realisieren. Herkömmliche Dateisysteme wurden nur dahingehend optimiert, um z. B. Inline-Dedupe mit variabler Länge für Backup-Ziele zu ermöglichen.

Um Legacy-Storage-Silos auf zu brechen, musste Cohesity ein völlig neues Dateisystem entwickeln: SpanFS.
SpanFS wurde entwickelt, um alle sekundären Daten, einschließlich Backups, Dateien, Objekte, Test/Dev und Analysedaten, auf einer einzigen Web-Scale-Platform effektiv zu konsolidieren und zu verwalten.

SpanFS ist das einzige Dateisystem in der Branche, das gleichzeitig NFS-, SMB- und S3-Schnittstellen, globale Deduplizierung und unbegrenzte Snapshots und Clones bereitstellt. Und es bietet eine native Integration in Public Clouds, um eine Datenstruktur in Multi-Cloud-Umgebungen zu unterstützen, so dass Unternehmen Daten in die Cloud für die Archivierung oder für komplexere Anwendungsfälle, wie Disaster Recovery, Test/Dev und Analytics, senden können. All dies geschieht auf der grenzenlos skalierbaren Architektur von Cohesity, um die ständig wachsenden Datenmengen effektiv zu verwalten.

Werfen wir einen genaueren Blick auf die Architektur von SpanFS und wie es sich grundlegend von Legacy-Dateisystemen unterscheidet. Auf der obersten Ebene stellt SpanFS standardisierte, global verteilte NFS-, SMB- und S3-Schnittstellen bereit. Unterhalb den Zugriffsprotokollen verwaltet die IO Engine für alle Daten, die in das System geschrieben oder gelesen werden, die IO- Operationen. Es erkennt automatisch zufällige und sequentielle IO-Profile, teilt die Daten in Chunks auf, führt die Deduplizierung durch und leitet die Daten basierend auf dem IO-Profil auf die am besten geeignete Speicherschicht (SSD, HDD, Cloud Storage) . Um nach zu vollziehen auf welchen Cluster-Knoten die Daten liegen, musste Cohesity auch einen völlig neuen Metadatenspeicher aufbauen. Der Metadatenspeicher besteht aus einem konsistenten, verteilten NoSQL-Store. Er sorgt für schnelle IO-Operationen im verteilten System. Die SnapTree-Technologie bietet eine verteilte Metadatenstruktur auf Basis von B+ Tree-Konzepten. SnapTree ist einzigartig in seiner Fähigkeit, unbegrenzte und häufige Snapshots ohne Leistungseinbußen zu unterstützen. SpanFS hat QoS-Controls in allen Ebenen eingebaut, so dass QoS abhängig vom Workload oder abhängig vom Mandant gesteuert werden kann. SpanFS kann auch replizieren, archivieren und Daten zu einem anderen Cohesity-Cluster oder in die Cloud auslagern.

SnapTree stellt einen völlig neuen Ansatz für die Verwaltung von Metadaten in verteilten Systemen dar. Im herkömmlichen Storage-Systemen bilden Snapshots die Glieder einer Kette, wobei jedes Glied die Änderungen aus dem vorherigen Snapshot enthält. Jedes Mal, wenn ein neuer Snapshot durchgeführt wird, wird ein zusätzliches Glied zur Kette hinzugefügt. Und genau das sorgt für enormen Leistungsverlust.

Um unbegrenzte Snapshots und Clones in verteilten Systemen zu gewährleisten, verwaltet SnapTree die Metadaten mit einer B+ Tree-Metadatenstruktur, fügt jedoch mehrere Neuerungen hinzu:

  • Verteilt die B+ Baumstruktur über Cluster-Knoten
  • Bietet gleichzeitigen Zugriff von mehreren Cluster-Knoten
  • Unterstützt die Erstellung von Instant-Clones und Snaps

Innerhalb SnapTree werden Views (Volumes) und Dateien anhand einen Baumstruktur von Zeigern (Pointers) dargestellt, die auf die zugrunde liegenden Daten zeigen. Der Wurzelknoten verweist auf einige Zwischenknoten, die wiederum auf die Blattknoten zeigen, die den Ort der Datenblöcke enthalten. Man kann Snapshots von kompletten Views (Volumes) machen oder auch nur von einzelne Dateien innerhalb der Views. Wenn Snapshots gemacht werden, erhöht sich nicht die Anzahl der Hops von der Wurzel bis zu den Blättern. Man kann Snapshots so oft machen wie man will – ohne jeglichen Leistungsverlust.

SpanFS und SnapTree in Kombination bieten ein einzigartiges Dateisystem, das speziell für die Konsolidierung von Sekundärspeicher entwickelt wurde. Dies ist die technische Grundlage, die Hyperconverged Secondary Storage ermöglicht. Damit gewinnt man die Kontrolle über seine Daten zurück.

Weitere Infos zu SpanFS und SnapTree:
Download White Paper
Light Board Video anschauen
Cohesity Website

Andreas Fleischmann
follow me