Kundenlogin

NoSQL

Unter NoSQL (Not only SQL) versteht man Datenbanken mit einem nicht relationalen Ansatz, die man auch als strukturierte Datenspeicher (structured storage) bezeichnet. Beispiele für NoSQL sind Amazon Dynamo und Google BigTable sowie die als Open-Source implementierten Apache Cassandra, CouchDB, OrientDB und MongoDB. Die Bezeichnung NoSQL in diesem speziellen Sinne von „Not only“ wird seit Anfang 2009 (eingeführt von Johan Oskarsson) verwendet und bezeichnet ein neues Konzept, das die Einschränkungen relationaler Datenbanken insbesondere bei verteilten Datenspeichersystemen aufzuheben versucht. Um mit sehr großen Datenmengen, häufigen Lese- und Schreibanfragen, komplexen Datenstrukturen und miteinander verzahnten Daten effizient umzugehen, wird auf das relationale Modell, insbesondere auf fixierte Tabellenschemata und Joins, verzichtet. Dieses relationale Modell ist nur bei gehäuften kleinen Transaktion und großen Batch-Transaktionen mit fast ausschließlich Lesezugriffen effizient. Hochskaliert wird eine Relationale Datenbank durch immer schnellere Hardware und zusätzlichen Speicher. NoSQL dagegen nutzt ein Verfahren, das als „scaling out“ bezeichnet wird. Dabei wird die Last auf viele beliebige Systeme verteilt. Zurzeit lässt sich NoSQL in 4 Kategorien unterteilen:

Key-Value Datenbanken nutzen eine Hash-Tabelle, in die Schlüssel mit einem jeweiligen Zeiger auf einen Datensatz eingetragen sind. Solche Abbildungen sind gewöhnlich mit Cache-Mechanismen ausgestattet.

Spaltenorientierte Datenbanken dienen zur Speicherung sehr großer und auf vielen Rechnern verteilter Datenmengen. Ein Zeilenschlüssel adressiert eine ganze Zeile einer Spaltenfamilie.

Dokumentenorientierte Datenbanken nutzen Dokumente, die Sammlungen anderer Schlüssel-Wert-Sammlungen sind. Die semi-strukturierten Dokumente sind in Dateiformaten wie JSON gespeichert.

Objektdatenbanken setzen sich zusammen aus Graphen bestehend aus Knoten, Kanten beziehungsweise Relationen und Knoteneigenschaften. Diese Modellierung durch Graphen skaliert über viele Rechner hinweg.

zurück