Neo4j

Neo4j est un système de gestion de base de données au code source libre basée sur les graphes, développé en Java[3],[4] par la société suédo-américaine Neo technology. Le produit existe depuis 2000, la version 1.0 est sortie en [5].

Neo4j

Informations
Première version [1]
Dernière version 4.3.3 ()[2]
Dépôt github.com/neo4j/neo4j
Écrit en Java et Scala
Environnement Machine virtuelle Java
Type Base de données orientée graphe
Labeled Property Graph (d)
Licence Licence publique générale GNU version 3 et AGPL-3.0 (d)
Site web neo4j.com

Généralités

Neo4j permet de représenter les données en tant que nœuds reliés par un ensemble d'arcs, ces objets possédant leurs propres propriétés. Les propriétés sont constitués d'un couple de clé-valeurs de type simple tel que chaînes de caractères ou numérique; celles-ci peuvent être indexées. La modélisation est très proche des concepts métier, il n'est pas nécessaire d'utiliser de clés dans Neo4j, car les relations ont une existence propre. L'absence de modélisation rigide rend Neo4j bien adapté à la gestion de données changeantes et de schémas évoluant fréquemment.[réf. nécessaire]

La base de données Neo4j est construite pour être extrêmement performante pour traiter les liens entre nœuds. Ces performances sont dues au fait que Neo4j pré-calcule les jointures au moment de l'écriture des données, comparativement aux bases de données relationnelles qui calculent les jointures à la lecture en faisant appel aux Index et à la logique de clés. Ce qui fait de Neo4j une technologie adaptée à de larges ensembles de données connectées.[réf. nécessaire]

Les traversées utilisent le langage de requête Cypher[6],[7], standard de parcours des connexions, élaboré dans le but de réaliser plus simplement que SQL les opérations de parcours ou d'analyse de proximité qui sont les plus courantes lorsqu'on traite des données connectées.

Les bases de données de graphes sont des outils puissants pour répondre à des requêtes faisant intervenir des relations entre objets. La recherche du plus court chemin entre deux points du graphe permet par exemple de mettre en place des profils utilisant liens sociaux, géographie et analyse d’impact. [réf. nécessaire]

Exemples d'usages de Neo4j

  • Gestion de réseau/analyse d’impact : avoir la main sur son système et identifier en temps réel le client affecté par une maintenance ou une panne ;[réf. nécessaire]
  • Logistique : calculer le meilleur chemin pour livrer un client ;[réf. nécessaire]
  • Social, collaboration : rechercher très facilement qui sont les amis de mes amis ;[réf. nécessaire]
  • Recommandation : définir en temps réel la liste des produits achetés par mes amis que je n’ai pas moi même achetés ;[réf. nécessaire]
  • Master Data Management / Gestion de configuration : construction d’un référentiel standardisé performant et sans redondance pour vos données critiques hiérarchisées : hiérarchie d’entreprise et de produit ;[réf. nécessaire]
  • Droits d’accès : gestion des groupes, utilisateurs et droits rapidement et sans redondance ;[réf. nécessaire]
  • Géo-Spatial : modélisation d’une carte routière et calculs d’itinéraires ;[réf. nécessaire]
  • Biologie, interactions moléculaires : réduire les risques d’effets secondaires des médicaments en calculant en temps réel les interactions entre une protéine et une future molécule.[réf. nécessaire]

De tels exemples pratiques sont accessibles en ligne ou à télécharger sous forme d'études de cas via un site de dépôt associé[8].

Points forts de Neo4j

Cette section ne cite pas suffisamment ses sources (novembre 2017). 
Pour l'améliorer, ajoutez des références vérifiables [comment faire ?] ou le modèle {{Référence nécessaire}} sur les passages nécessitant une source.

Des requêtes haute performance

Le modèle de données du graphe permet l’exécution de requêtes complexes avec une haute performance, inhérentes aux données connectées des applications d’aujourd’hui.[réf. nécessaire]

Des projets livrés plus rapidement

Modéliser une base de données de graphes est une procédure simple. Les utilisateurs et clients peuvent capturer rapidement toutes sortes de données, structurées, semi-structurées et déstructurées et ainsi les stocker dans Neo4j. Pour une application industrielle, par rapport à une approche par base de données relationnelle, les temps de développement sont réduits, ainsi que les coûts de maintenance, tout en profitant de plus hautes performances.[réf. nécessaire]

La découverte de nouveaux cas d’usage

Très souvent les utilisateurs et clients de Neo4j démarrent un projet car ils n’ont pas pu trouver de solution à un problème bien précis avec d'autres systèmes de gestion de base de données. Puis ils découvrent, par la simplicité du modèle de données de graphes, de nouveaux cas d’usage très utiles dans le monde des startups ou des industries fortement concurrentielles. [réf. nécessaire]

Modèle

Neo4j est une base de donnée orientée graphe avec labels et propriétés (Labeled Property Graph), cela signifie que des données sous forme de propriétés peuvent être associées aux différents objets du graphe. Neo4j définit 2 types d'objets dans le graphe: les nœuds et les relations.

Nœuds

Les nœuds[9] servent à représenter des entités (objet physique, personne, concepts) et contiennent beaucoup d'informations sous forme de propriétés. Les nœuds peuvent être associés à des catégories grâce à l'utilisation d'un ou plusieurs labels.

Label[10]

Les labels servent à créer des groupes, des catégories de nœuds. Ils servent à la fois à décrire l'objet du nœud et à filtrer les recherches lors de requêtes. Les labels peuvent être accumulés sans limite de nombre sur un nœud.

CREATE (Keanu:Person:Actor {name:"Keanu Reeves"});
MATCH (p:Person) return p;  # Toutes les 'Person' du graphe
MATCH (a:Actor) return a;   # Tous les 'Actor' du graphe

Par convention, les labels doivent utiliser la mise en forme Camel[11]. Il est possible d'ajouter ou de supprimer des labels présents sur un nœud grâce à la fonction set:

MATCH (keanu:Person {name:"Keanu Reeves"}) set keanu :Director;
MATCH (keanu:Person {name:"Keanu Reeves"}) remove keanu :Actor;

Propriétés

Les propriétés décrivent une entité mais sont également le seul moyen de les différentier. Contrairement aux bases de données relationnelles il n'est pas coutume d'utiliser un identifiant unique pour chaque entité, les nœuds sont donc identifiés et différentiés par une combinaison de labels et propriétés.

Exemples de propriétés pouvant être utilisées comme identifiant unique:

  • name pour les personnes
  • title
  • uri ou url pour les livres ou les sites internets

Relation[12]

Une relation dans Neo4j est une association unidirectionnelle entre 2 nœuds, cependant Neo4j est également performant dans les deux directions de lecture. Une relation doit spécifier quel type de lien elle représente, pour cela le type de relation est spécifié à la construction avec la syntaxe ()-[:TYPE]->(). Comme les nœuds, la relation peut contenir des propriétés.

Il est impossible de supprimer un nœud tant qu'il existera des relations entre ce nœud et un autre. Pour supprimer un nœud et toutes ses relations automatiquement, il existe la commande detach delete n.

Propriété

Les propriétés d'un objet sont un ensemble de clé-valeur. Elles peuvent être appliquées sur les nœuds ou les relations. La plupart des formats de données numériques sont supportés comme les chaînes de caractères, les nombres entiers ou flottants, les booléens et les dates[13].

Accès

Pour sélectionner les nœuds ou relations qui possèdent une ou plusieurs propriétés , il est possible de les spécifier dans la section MATCH ou la section WHERE. Pour tester l'existence ou non d'une propriétés dans un objet, utilisez la syntaxe EXISTS(o.prop) ou NOT EXISTS(o.prop)[14].

MATCH (p {name:"Keanu Reeves"}) return p;
MATCH (p) WHERE p.name = "Keanu Reeves";

Modification

Après avoir sélectionné les objets à modifier, la valeur de la propriété peut être ajoutée ou modifiée avec set o.prop = val, et supprimée avec set o.prop = NULL[15], cela implique qu'une propriété ne peut pas contenir une valeur nulle.

À noter

Certains SGBD relationnels s'inspirent désormais de Neo4j pour proposer des extensions de données en graphe en utilisant les mêmes prédicats de navigation que le langage Cypher de Neo4J. C'est le cas en particulier de Microsoft SQL Server 2017 pour laquelle cette fonctionnalité est incluse dans le moteur SQL[réf. souhaitée].

Références

  1. « https://neo4j.com/blog/neo4j-1-0-released/ »
  2. « https://neo4j.com/release-notes/database/neo4j-4-3-3/ »
  3. (en) Todd Hoff, « Neo4j - a Graph Database that Kicks Buttox », High Scalability, Possibility Outpost, (consulté le ).
  4. (en) Gavin Terrill, « Neo4j - an Embedded, Network Database », InfoQ, C4Media Inc, (consulté le ).
  5. (en) « The top 10 ways to get to know Neo4j », Neo4j Blog, (consulté le ).
  6. Cypher.
  7. (en) « Syntax - Neo4j Cypher Manual », sur Neo4j Graph Database Platform (consulté le )
  8. Site de dépôt associé.
  9. (en) « Graph Modeling Guidelines », sur Neo4j Graph Database Platform (consulté le )
  10. (en) « Graph Modeling Guidelines », sur Neo4j Graph Database Platform (consulté le )
  11. (en) « Graph database concepts - Naming rules and recommendations », sur Neo4j Graph Database Platform (consulté le )
  12. (en) « Graph Modeling Guidelines », sur Neo4j Graph Database Platform (consulté le )
  13. (en) « Graph database concepts - Getting Started », sur Neo4j Graph Database Platform (consulté le )
  14. (en) « WHERE - Neo4j Cypher Manual », sur Neo4j Graph Database Platform (consulté le )
  15. (en) « SET - Neo4j Cypher Manual », sur Neo4j Graph Database Platform (consulté le )

Voir aussi

Articles connexes

  • Portail des bases de données
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.