Informatique décisionnelle open source

L'Informatique décisionnelle open source (open source business intelligence, OSBI) regroupe l'ensemble des solutions et techniques liées au décisionnel et dont le modèle s'appuie sur l'open source.

La quasi-totalité des domaines de l'informatique décisionnelle du monde propriétaire sont aussi couverts par l'OSBI.

L'OSBI, dont les codes logiciels sont en partie publics, n'a rien à voir avec l'open source intelligence (OSINT) qui désigne la recherche dans les sources publiques, c'est-à-dire les journaux, annuaires…

Bases de données

Le monde du logiciel libre propose des alternatives face aux systèmes de bases de données propriétaires Oracle ou Microsoft SQL Server. Les solutions les plus réputées sont :

ETL

Les ETL (extract-transform-load) sont les outils pour manipuler les données, comme pour la construction et l'alimentation des datawarehouse (entrepôts de données).

Les ETL open source permettent d'effectuer un grand nombre de traitements pour l'extraction (« E »), la transformation (« T ») et le chargement (loading, « L ») de données, ceci depuis ou vers un grand nombre de systèmes :

  • extraction et chargement de données en provenance de nombreux SGBD via les drivers JDBC : Oracle, PostgreSQL, MySql, MS SqlServer, IBM DB2, Sybase, Teradata
  • extraction et alimentation de fichiers plats : CSV, Excel, XML, fichier dont la longueur d'un enregistrement est fixe…
  • transtypage, ajouts de champs calculés et de constantes, mapping, normalisation et dénormalisation
  • Dédoublonnage de lignes, contrôles et routages de flux
  • validation et nettoyage de données
  • fonction de recherche (lookup) d'informations additionnelles permettant par exemple la jointure entre deux SGBD différents
  • extraction et chargement dans des progiciels spécifiques (SAP, SugarCRM…) ou des annuaires LDAP
  • fonctions décisionnelles : Slowly Changing Dimension, lecture de cubes OLAP (Mondrian (en), Palo (Palo)), agrégations
  • fonctionnalités orientées EAI : récupération et envoi de fichiers par FTP, SSH, Mail, Scripting, messages orientés services, Web Services

Il existe plusieurs ETL open source, avec des versions de base entièrement libres (gratuites) et des versions professionnelles (payantes). Ces dernières sont dotées de fonctionnalités avancées et permettant d'obtenir un support direct auprès de l'éditeur.

Les ETL open source les plus complets et reconnus sont les suivants :

  • Talend Open Studio : Talend Open Studio (TOS) est édité par la société Talend. Talend est un ETL dont l'interface graphique s'appuie sur Eclipse RCP et est de type « générateur de code » : un code spécifique est généré (et visible) pour chaque traitement d'intégration de données. Talend Integration Suite (TIS) désigne la version professionnelle, dont l'essentiel des fonctionnalités supplémentaires a pour but de fournir des fonctionnalités avancées d'entreprise : développement collaboratif, gestion des déploiements, console d'administration et de planification des jobs en production.
  • Pentaho (Pentaho) Data Integration (PDI) également connu sous le nom de « Kettle » : PDI est un ETL qui présente à peu de chose près les mêmes fonctionnalités que Talend, la différence principale étant son interface basée sur Java SWT et son mécanisme de « méta moteur ». PDI embarque en effet la totalité du code nécessaire dans son noyau et ne traite ainsi que les flux de données. Ainsi, un traitement Kettle peut être stocké sous forme de fichier plat (XML) ou bien dans un SGBD (« Kettle repository »), ce dernier servant également de référentiel de travail partagé. Un des attraits de PDI est son niveau d'intégration avec la plate-forme OSBI Pentaho : Kettle peut ainsi servir de source de données au moteur de reporting de Pentaho et même permettre l'élaboration de vues d'analyses multidimensionnelles avec le concept « Agile BI » et l'outil Pentaho Analyzer
  • CloverETL (en) : CloverETL est édité par la société Javlin
  • Streamsets
  • MentDB Weak[1] est une solution ETL open-source édité par la société Innov-AI. Le serveur est basé sur une couche de type Service Oriented Architecture (SOA) et permet avec un langage de programmation compressé (le MQL) d'effectuer des tâches ETL pour transférer des données d'un logiciel à un autre. Il possède aussi un générateur de code pouvant accélérer les développements ainsi que 26 modules de connexions standards prêt à l'usage (FTP, SSH, SFTP, Excel, CSV, JSON, XML, SQL ...). C'est un outil pensé pour du développement collaboratif, le déclenchement de jobs dans le temps et intègre quelques algorithmes de machine learning.

Outils de reporting

  • Jasper (iReport)
  • Eclipse Birt (Actuate)
  • JFreeReport / JFreeChart

Outils d'analyse multidimensionnelle

  • Mondrian
  • Palo (OLAP database) (en)

SGBD relationnels d'analyse

Plates-formes OSBI WEB

Moteurs d'analyses statistiques

Exploration de données et fouille de textes

Progiciel de gestion intégré (ERP)

Odoo

Axelor

Gestion de la relation client (CRM)

SugarCRM

Notes et références

Liens externes

  • osbi.fr - blog sur les solutions décisionnelles open source
  • Portail de l’informatique
  • Portail du management
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.