L’une des tendances de 2017 sera incontestablement la mise à disposition de nouveaux SGBD (Système de Gestion de Base de Données), qui permettront de percevoir la même structure de données, soit comme une base relationnelle pour des traitements OLTP (On Line Transaction Processing) soit comme une base multidimensionnelle pour des traitements OLAP ((OnLine Analytical Processing). Une nouvelle startup, Splice Machine, entre dans l’arène.

Une architecture plus simple

Attention, il faut bien comprendre qu’il ne s’agit pas d’une organisation logique des données qui serait à la fois relationnelle et OLAP, qui aujourd’hui n’existe pas. Non, c’est la perception des données qui est hybride, le SGBD « s’arrangeant » pour que l’usager ne se rende pas compte de la « supercherie ».

Le principal avantage d’un SGBD hybride est qu’il évite de nombreuses manipulations, des extractions principalement pour mettre à la disposition des analystes de BI, des données qu’ils pourront éventuellement manipuler, agréger, voire modifier, pour exécuter des requêtes dans leur domaine, sans risquer de détériorer les données d’origine.

Mais en réalité, les traitements s’effectuent sur les mêmes données physiques, avec une gestion adaptée des blocages d’enregistrements pour les mises à jour, ce qui peut entraîner la création de « datasets » temporaires pour éviter d’attendre si 2 traitements, analytique et relationnel, portent sur les mêmes données. Ce que fait par exemple, SQL Server 2016.

Un nouveau venu est désormais présent dans l’arène, Splice Machine, une startup de San Francisco, qui propose une telle organisation, mais cette fois, directement dans le Cloud, pour soulager les administrateurs des tâches logistiques nécessairement plus lourdes, avec une architecture hybride.

La solution Splice Machine est très proche de la galaxie Hadoop, puisqu’elle est fondée sur une organisation NoSQL HBase d’Apache posée sur une architecture distribuée HDFS, pour garantir le mode Scale-out des ressources (extension automatique) et un moteur de requêtage Spark en mode « In Memory », qui devrait lui assurer de bonnes performances, la grande question quand on adopte cette organisation.

Du vrai relationnel

Si l’on peut admettre que les traitements OLAP seront un peu ralentis, il n’en est pas de même des accès RDBMS, qui devraient être aussi rapides que si le SGBD était nativement relationnel.

On vérifiera à l’usage.

En tout cas, Splice Machine a précisé, histoire de faire taire les critiques avant même qu’elles ne soient émises, que sa base sera une véritable Ansi-SQL, conforme ACID (Atomicité, Cohérence, Isolation, Durabilité) et qu’elle pourra recevoir un nombre illimité d’utilisateurs. Là on est moins convaincus…

Pour ce qui est des sauvegardes et restauration, elles s’effectueront avec le service S3 d’Amazon.

A vrai dire, il y aura 2 manières d’apprécier l’annonce Splice Machine.

Techniquement la compagnie a fait les bons choix et il ne devrait pas y avoir de problèmes rédhibitoires de performances.

C’est le côté startup qui est plus gênant. Car Splice Machine a évidemment pour vocation d’être rachetée et personne ne peut dire ce qu’il en adviendra, à partir du moment où il faudra l’intégrer dans une offre déjà structurée. Eternel problème.

D’autant que Splice Machine est à la recherche de « cobayes », des « early adopters » qui auraient de 5 TB à 3 PB de données à gérer, qui pourraient tester sa solution.

On est donc encore loin d’une solution totalement stabilisée…