eBook129 Seiten51 Minuten

Neo4j 2.0: Eine Graphdatenbank für alle

Name: Neo4j 2.0: Eine Graphdatenbank für alle
Author: Michael Hunger
ISBN: 9783868026542

Von Michael Hunger

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Der Mehrwert von Informationen steckt nicht notwendigerweise in der reinen Menge von Daten, sondern vor allem in den Beziehungen
zwischen Elementen. Bisher war es nicht so einfach, die interessanten, vernetzten Domänen verlustlos in einer Datenbank zu
speichern und effizient abzufragen. Neo4j, besonders die neue Version 2.0, erlaubt es, komplexe Datenmodelle direkt zu modellieren
und herausfordernde Anwendungsfälle performant umzusetzen. In diesem Buch gibt Michael Hunger, langjähriger Mitarbeiter von Neo
Technology, an praktischen Beispielen einen Überblick zur Anwendung der quelloffenen Graphdatenbank.

Karussell überspringen

Datenbanken

SpracheDeutsch

Herausgeberentwickler.press

Erscheinungsdatum4. März 2014

ISBN9783868026542

Autor

Michael Hunger

Mehr von Michael Hunger lesen

Karussell überspringen

shortcuts
eBook-Reihen
shortcuts
vonUwe Baumann
schnell + kompakt
eBook-Reihen
schnell + kompakt
vonSteffen Fischer

Ähnlich wie Neo4j 2.0

Titel in dieser Serie (20)

Karussell überspringen

Abofallen im Netz: Wie Sie teure Klicks vermeiden
eBook
Abofallen im Netz: Wie Sie teure Klicks vermeiden
vonMichael Rohrlich
Bewertung: 0 von 5 Sternen
0 Bewertungen
Neo4j 2.0: Eine Graphdatenbank für alle
eBook
Neo4j 2.0: Eine Graphdatenbank für alle
vonMichael Hunger
Bewertung: 0 von 5 Sternen
0 Bewertungen
Zertifizierung für Softwarearchitekten: Ihr Weg zur iSAQB-CPSA-F-Prüfung
eBook
Zertifizierung für Softwarearchitekten: Ihr Weg zur iSAQB-CPSA-F-Prüfung
vonGernot Starke
Bewertung: 0 von 5 Sternen
0 Bewertungen
Agile Softwareentwicklung: Ein Leitfaden für Manager
eBook
Agile Softwareentwicklung: Ein Leitfaden für Manager
vonSteffen Fischer
Bewertung: 0 von 5 Sternen
0 Bewertungen
JavaScript für Java-Entwickler
eBook
JavaScript für Java-Entwickler
vonOliver Zeigermann
Bewertung: 0 von 5 Sternen
0 Bewertungen
SQL-Abfragen optimieren: Was Entwickler über Performance wissen müssen
eBook
SQL-Abfragen optimieren: Was Entwickler über Performance wissen müssen
vonRobert Panther
Bewertung: 0 von 5 Sternen
0 Bewertungen
JavaScript und TypeScript für C#-Entwickler
eBook
JavaScript und TypeScript für C#-Entwickler
vonOliver Zeigermann
Bewertung: 0 von 5 Sternen
0 Bewertungen
Cloud Computing: Rechtliche Grundlagen
eBook
Cloud Computing: Rechtliche Grundlagen
vonMichael Rohrlich
Bewertung: 0 von 5 Sternen
0 Bewertungen
Security im E-Commerce: Absicherung von Shopsystemen wie Magento, Shopware und OXID
eBook
Security im E-Commerce: Absicherung von Shopsystemen wie Magento, Shopware und OXID
vonTobias Zander
Bewertung: 0 von 5 Sternen
0 Bewertungen
CSS3: Die Referenz für Webentwickler
eBook
CSS3: Die Referenz für Webentwickler
vonDaniel Koch
Bewertung: 0 von 5 Sternen
0 Bewertungen
JavaScript für Java-Entwickler
eBook
JavaScript für Java-Entwickler
vonOliver Zeigermann
Bewertung: 0 von 5 Sternen
0 Bewertungen
Ihr Recht als Blogger: Juristische Tipps für Blogs, Podcasts und Co.
eBook
Ihr Recht als Blogger: Juristische Tipps für Blogs, Podcasts und Co.
vonMichael Rohrlich
Bewertung: 0 von 5 Sternen
0 Bewertungen
Ihr Recht bei Onlineauktionen. Juristische Tipps für eBay und Co.
eBook
Ihr Recht bei Onlineauktionen. Juristische Tipps für eBay und Co.
vonMichael Rohrlich
Bewertung: 0 von 5 Sternen
0 Bewertungen
Vorsicht Suchmaschine: Rechtliche Tipps für Google und Co.
eBook
Vorsicht Suchmaschine: Rechtliche Tipps für Google und Co.
vonMichael Rohrlich
Bewertung: 0 von 5 Sternen
0 Bewertungen
Dynamic Proxies: Effizient programmieren
eBook
Dynamic Proxies: Effizient programmieren
vonDr. Heinz Kabutz
Bewertung: 0 von 5 Sternen
0 Bewertungen
JavaScript für Java-Entwickler
eBook
JavaScript für Java-Entwickler
vonOliver Zeigermann
Bewertung: 0 von 5 Sternen
0 Bewertungen
Crime Scene Internet: Ein Streifzug durch das Computer- und Internetstrafrecht
eBook
Crime Scene Internet: Ein Streifzug durch das Computer- und Internetstrafrecht
vonMichael Rohrlich
Bewertung: 0 von 5 Sternen
0 Bewertungen
SQL Server: Performanceprobleme analysieren und beheben
eBook
SQL Server: Performanceprobleme analysieren und beheben
vonRobert Panther
Bewertung: 0 von 5 Sternen
0 Bewertungen
Zertifizierung für Softwarearchitekten: Ihr Weg zur iSAQB-CPSA-F-Prüfung
eBook
Zertifizierung für Softwarearchitekten: Ihr Weg zur iSAQB-CPSA-F-Prüfung
vonGernot Starke
Bewertung: 0 von 5 Sternen
0 Bewertungen
Ihr Recht als Programmierer: Juristische Tipps für Angestellte, Selbstständige und Freelancer
eBook
Ihr Recht als Programmierer: Juristische Tipps für Angestellte, Selbstständige und Freelancer
vonMichael Rohrlich
Bewertung: 0 von 5 Sternen
0 Bewertungen

Buchvorschau

Neo4j 2.0 - Michael Hunger

geschützt.

1 Einführung: Die Welt ist ein Graph

Wir sind umgeben von einem Netz aus Informationen

Von all den Informationen, die tagtäglich verarbeitet werden, ist ein beträchtlicher Anteil nicht wegen ihres Umfangs interessant, sondern wegen der inhärenten Verknüpfungen, die darin enthalten sind. Denn diese machen den eigentlichen Wert solcher Daten aus.

Verknüpfungen reichen von historischen Ereignissen, die zu Orten, Personen und anderen Ereignissen in Beziehung stehen (und selbst in der heutigen Politik ihre Auswirkungen zeigen), bis hin zu Genstrukturen, die unter konkreten Umwelteinflüssen auf Proteinnetzwerke abgebildet werden.

In der IT-Branche sind es Netzwerke, Computer, Anwendungen und Nutzer, die weitreichende Netze bilden, in denen Informationen ausgetauscht und verarbeitet werden. Und nicht zuletzt stellen soziale Netzwerke (ja, neben den virtuellen gibt es auch noch reale) aus Familien, Kollegen, Freunden, Nachbarn bis hin zu ganzen Kommunen einen wichtigen Aspekt unseres Lebens dar.

Jeder Teil unseres Lebens wird von zahlreichen Verbindungen zwischen Informationen, Dingen, Personen, Ereignissen oder Orten bestimmt. Große Internetfirmen versuchen natürlich, sich diese Informationen zunutze zu machen. Beispiele für großangelegte Projekte in dem Zusammenhang sind der Google Knowledge Graph¹ oder Facebook Graph Search².

Abbildung 1.1: Die Welt ist ein Graph

Vernetzte Informationen und Datenbanken

Wenn diese vernetzten Informationen in Datenbanken abgespeichert werden sollen, müssen wir uns Gedanken darüber machen, wie wir mit den Verbindungen umgehen. Normalerweise werden sie ignoriert, denormalisiert oder zusammengefasst, um in das Datenmodell der Datenbank zu passen und auch Abfragen schnell genug zu machen. Was dabei jedoch verloren geht, ist die Informationsfülle, die in anderen Datenbanken und Datenmodellen erhalten geblieben wäre. Genau in dieser Situation spielen Graphdatenbanken und das Graphdatenmodell ihre Stärken aus. Stark vernetzte Daten fallen in einer relationalen Datenbank sofort durch die schiere Menge an JOIN-Tabellen und JOIN-Klauseln in Abfragen auf (und durch die daraus resultierende schlechtere Abfragegeschwindigkeit).

Abbildung 1.2: Relationale JOIN-Tabelle

Graphdatenmodell

Die mathematische Theorie zu Graphen ist viel älter als man denkt. Leonard Euler begründete sie, als er einen Weg über die sieben Brücken des damaligen Königsbergs finden wollte, ohne eine doppelt überqueren zu müssen.³ Die Mathematik hat sich seitdem sehr ausführlich mit Graphtheorie und Graphalgorithmen befasst. Diese sollen aber nicht der Gegenstand dieses Buchs sein. Hier soll stattdessen praktisches Wissen für den pragmatischen und effektiven Umgang mit vernetzten Daten vermittelt werden.

Graphdatenbanken

Die Kombination aus Management von Graphstrukturen (und damit von vernetzten Daten) und Datenbankeneigenschaften wie Transaktionalität und ACID ist eine neuere Erscheinung. Graphdatenbanken, die dies leisten, sind Teil der NoSQL-Bewegung, die zumeist nicht relationale Datenbanken umfasst. Diese Datenbanken sind größtenteils quelloffen, entwicklerorientiert und mit einem Datenmodell versehen, das bestimmte Anwendungsfälle besonders gut unterstützt.

Graphdatenbanken sind dafür prädestiniert, relevante Informationsnetzwerke transaktional zu speichern und besonders schnell und effizient abzufragen. Das Datenmodell besteht aus Knoten, die mittels gerichteter, getypter Verbindungen miteinander verknüpft sind. Beide können beliebige Mengen von Attribut-Wert-Paaren (Properties) enthalten. Daher wird dieses Datenmodell auch als „Property-Graph" bezeichnet (Abbildung 1.3).

Jeder hat definitiv schon einmal mit Graphen gearbeitet. Sei es bei der Modellierung für eine relationale Datenbank (ER-Diagramm), beim Skizzieren von Domänenaspekten auf einem Whiteboard/Tafel (Symbole und Linien) oder einfach während der kreativen Sammlung von Informationen (Mindmaps). Graphen sind aufgrund der Einfachheit des Datenmodells und einer besonders leichten Visualisierung gut verständlich und leicht zu handhaben.

Abbildung 1.3: Property-Graph

Aber was ist nun so besonders an Graphdatenbanken? Dieses Kapitel geht näher auf dieses Thema anhand von Neo4j, einer Open-Source-Graphdatenbank ein. Sie ist nativ und in Java implementiert. Nativ bedeutet, dass Knoten und Beziehungen direkt in den internen Datenbankstrukturen als Records in den Datenbankdateien repräsentiert sind. Neo4j nutzt keine andere Datenbank als Persistenzmechanismus, sondern baut auf einer eigenen Infrastruktur auf, die speziell dafür entwickelt wurde, vernetzte Daten effizient zu speichern.

Wie schafft es eine Graphdatenbank, die hochperformante Navigation im Graphen zu realisieren? Das ist ganz einfach: mit einem Trick. Statt bei jeder Abfrage rechen- und speicherintensiv Entitäten immer wieder zu korrelieren, werden die Verbindungen beim Einfügen in die Datenbank als persistente Strukturen abgelegt. So wird zwar beim Speichern ein Zusatzaufwand in Kauf genommen, aber beim viel häufigeren Abfragen der Informationen können die direkt gespeicherten Verknüpfungsinformationen zur schnellen Navigation in konstanter Zeit genutzt werden.

Neo4j repräsentiert Knoten und Beziehungen in seinem Java-API als Java-Objekte (Node, Relationship) und im HTTP-API als JSON-Objekte. In der eigens für Graphen entwickelten Abfragesprache Cypher hingegen wird „ASCII-Art" verwendet.

Neo4js Abfragesprache Cypher

Was? ASCII-Art? Wie soll das denn funktionieren? Man denke einfach an Kreise und Pfeile auf einer Tafel oder einem Whiteboard, die man zum Diskutieren von Modellen schnell aufzeichnen kann. Das klappt, solange die Datenmengen, die es zu visualisieren gilt, klein genug oder nur konzeptionell sind, richtig gut. Bei größeren Graphen kann es schnell passieren, dass man den Wald vor Bäumen (oder Subgraphen) nicht mehr sehen kann. Aber wir wissen eigentlich, wonach wir suchen. Wir sind an

Gefällt Ihnen die Vorschau?

Seite 1 von 1

Neo4j 2.0: Eine Graphdatenbank für alle

Über dieses E-Book

Michael Hunger

Mehr von Michael Hunger lesen

shortcuts

schnell + kompakt

Ähnliche Autoren

Ähnlich wie Neo4j 2.0

Titel in dieser Serie (20)

Abofallen im Netz: Wie Sie teure Klicks vermeiden