Comment l’Intelligence Artificielle améliorera-t-elle l’analyse des données ?
Les plateformes et les outils de Business Intelligence sont devenus nettement plus productifs et faciles à utiliser au cours de la dernière décennie. Le paradigme visuel a fini par dominer avec des graphiques et des tableaux de bord utilisés pour décrypter l’histoire que nous racontent les données. Cependant, seule une personne sur quatre ayant accès à une plateforme de BI l’utilise. Malgré les progrès réalisés, la BI reste relativement difficile à utiliser et la plupart des produits nécessitent plusieurs jours de formation pour être utilisés de manière optimale. Nous avons également de plus en plus de sources de données, ce qui rend plus difficile l’accès à une vision complète. Et la préparation des données, sous toutes ses formes (nettoyage, qualification, transformation), représente plus de la moitié de la tâche d’analyse.
Au cours des dernières années, l’intelligence artificielle (IA) a évolué à un rythme tel que nous voyons émerger des voitures autonomes, la prévention de la fraude est plus précise, parmi de nombreux autres scénarios. Comment l’IA peut-elle aider la Business Intelligence à évoluer et, plus important encore, comment aider les entreprises à devenir plus rentables, agiles et efficaces ?
La Business Intelligence (BI)
Les premières étapes de la BI dans toute entreprise commencent par le reporting. La génération de rapports est la capacité de récupérer des lignes de données et des colonnes avec des totaux et des sous-totaux que la personne utilisera pour prendre des décisions sur le sujet en question. Un rapport sur les ventes divisé par régions permettra au responsable des ventes d’identifier s’il avance dans la bonne direction.
Associer le rapport de vente à d’autres données, telles que les objectifs de vente, serait la prochaine étape afin d’obtenir une vision plus claire et plus ciblée de l’état du sujet de l’activité. Un indicateur calculé est une représentation de la performance d’une activité donnée ou non.
Au cours des dernières années, avec l’arrivée des nouvelles générations plus compétentes en matière de traitement des données et des outils logiciels plus complexes, le concept de « Self-Service BI » est apparu. C’est la capacité des Subject Matter Experts (SME), c’est-à-dire les responsables métier, des entrepreneurs et des utilisateurs non-techniques, d’exécuter de nombreuses tâches que seuls les Technical Data Experts (TDE) étaient jusqu’alors en mesure d’effectuer.
La capacité de communiquer avec les données via des langages tels que SQL jusqu’à la production de documents (rapports et tableaux de bord) faisait partie des tâches du TDE, nécessitant une communication poussée, la traduction des exigences métier en exigences techniques, et bien sûr l’ajout de temps et de ressources à l’analyse des données.
Cela nécessitait la capacité de produire des modèles de données pouvant fournir tout type de métriques à la demande. Le concept de « cubes », et non de rapports tabulaires, a été utilisé. Le TDE était désormais chargé de créer des entrepôts de données (data warehouse) et de produire des cubes de données que les utilisateurs métiers consommeraient ensuite à l’aide de tableaux croisés dynamiques et d’outils d’exploration.
Les cubes et les technologies ultérieures telles que les bases de données en mémoire et les bases de données en colonnes/verticales ont permis aux PME de devenir plus autonomes, mais le TDE devait néanmoins être intégré dans le processus qui oblige à discuter de la définition des exigences.
Les TDE doivent être encore plus impliqués qu’auparavant puisqu’avec des outils exploratoires tels que les cubes, la nécessité de définir des scénarios hypothétiques et des modèles prédictifs nécessite encore plus de connaissances techniques que la simple analyse de données. Outre une solide compréhension du traitement des données, cela nécessite des statistiques avancées, de la programmation logicielle et une compréhension plus large des hypothèses affectant le domaine en question.
Il n’est donc pas étonnant que, même aujourd’hui, avec le « Self-Service BI », le besoin d’experts techniques reste la norme et non l’exception, à moins que l’IA ne puisse intervenir et changer notre façon de voir les logiciels de BI.
L'Intelligence Artificielle (IA)
L’intelligence artificielle est un domaine d’étude qui existe depuis plusieurs décennies et qui a traversé de nombreux cycles d’intérêt et de concentration au fil des années. À bien des égards, peu de choses ont changé par rapport aux concepts de ce que cela signifie et ce que c’est. Cependant grâce à l’amélioration des performances et la capacité de traitement des ordinateurs et des centres de données, ainsi que la facilité d’accès à ceux-ci via Internet (cloud computing), l’IA entre dans les cercles académiques et des affaires.
Il est important de noter que l’intelligence artificielle est un domaine qui englobe de nombreux domaines d’étude, processus et outils. Le désir de faire apparaître des signes d’intelligence d’une machine, ou même d’un non-humain va de la science-fiction à la robotique, des mathématiques à la philosophie, de la biologie à la physique.
Un domaine plus concret et plus ciblé de l’IA est le Machine Learning (ML), en particulier la capacité d’une application logicielle ou d’un algorithme à apprendre ou à atteindre de plus en plus une tâche ou un objectif à partir de cycles itératifs. Il existe plusieurs approches et techniques pour la mise en œuvre du Machine Learning, notamment : régression, regroupement (clustering), réseaux de neurones (neural networks), classification, apprentissage par arbre de décision (decision tree learning) et apprentissage en profondeur (deep learning).
Vous avez probablement déjà utilisé certaines des techniques ci-dessus, par exemple si vous avez déjà interpolé ou extrapolé des données à l’aide d’Excel. Si vous avez une série de points de données dans un graphique et que vous souhaitez appliquer une formule mathématique pour décrire le comportement ou la tendance de vos données, vous effectuez un type de régression de ML (pour chaque X, vous obtiendrez un résultat spécifique Y).
Certains appareils d’apprentissage ont encore besoin de l’aide humaine pour déterminer si les résultats sont corrects ou non. Ce processus s’appelle l’apprentissage supervisé. L’apprentissage non supervisé est la méthode selon laquelle le logiciel peut comprendre que certains chemins ou résultats sont corrects ou incorrects et s’adapter en conséquence. Il est quelque peu trompeur que ce soit non supervisé, car il y a encore des données d’entraînement qui sont alimentées par des humains, mais ce qui est intéressant, c’est que l’algorithme n’a pas de présomption des règles ni même de ce qu’ils apprennent exactement. Le logiciel ne fait que réagir à l’interaction humaine et apprendre les résultats tout en stockant ce qui a été fait et en essayant différentes choses par la suite. Il reste encore beaucoup à faire dans le domaine de l’apprentissage non supervisé, ce qui rend le domaine de recherche passionnant et prometteur.
Business Intelligence et Intelligence Artificielle
Il semblerait que nous soyons allés aussi loin que possible avec des outils visuels facilitant le glisser-déposer, les graphiques et les tableaux de bord basés sur le menu. Nous avons besoin d’un renouveau si nous voulons rendre la BI plus naturelle à utiliser, plus productive et plus puissante. Tout comme la visualisation des données a aidé l’exercice de la BI, l’intelligence artificielle (IA) et le machine learning (ML) amélioreront la productivité et la compréhension des données complexes. Le rôle de l’IA dans la BI est déjà établi. La plupart des domaines de l’IA peuvent y contribuer. Au cours des prochaines années, nous verrons les améliorations suivantes. :
- BI plus communicative utilisant le traitement du langage naturel et ses dérivés.
- Différents niveaux d’automatisation de la préparation des données.
- Automatisation de la découverte de données à l’aide de technologies d’IA capables d’effectuer une recherche à grande vitesse dans les sources de données et leurs relations.
- Intégration des connaissances des spécialistes dans les outils de BI. Génération automatique de graphiques en fonction des données et du comportement des utilisateurs. Détection de modèles et de caractéristiques significatives dans les données, et communication via voix et langage. Création automatique de visuels et de commentaires.
- Une plus grande sophistication grâce aux algorithmes de ML intégrés aux plateformes de BI. Des tâches telles que la segmentation, la prévision, l’identification des aberrations et l’établissement de corrélations se feront automatiquement.
- Exécution plus rapide des requêtes gr��ce à l’utilisation intelligente de la technologie matérielle et à l’apprentissage basé sur l’IA.
- Accès élargi aux données, laissant à la plateforme de BI le soin de déterminer les relations entre les sources de données et de déterminer celles qui sont les plus pertinentes.
- Réduction des coûts de service associé aux services de conseil, de formation et de configuration.
Quelques exemples plus spécifiques de la façon dont l’IA aidera les utilisateurs professionnels dans leurs tâches quotidiennes d’analyse de données :
Comprendre les questions/problèmes de l’entreprise
L’une des principales raisons pour lesquelles les utilisateurs font encore confiance à des experts techniques est le SQL. SQL est la première langue mondiale utilisée pour la récupération de données. Il existe d’autres variantes, telles que le type de base de données No_SQL, mais elles sont insignifiantes par rapport aux bases de données SQL et relationnelles. La possibilité de poser des questions commerciales simples telles que « Quel est le comportement du produit XYZ ce mois-ci par rapport au marché et le mois dernier ? » est assez difficile même pour un humain de produire une requête SQL. Cela nécessite une compréhension importante de l’emplacement des données, de leur structure, de leurs défauts, de leur compilation, de leur formatage et de la visualisation du résultat final.
L’IA sera en mesure de comprendre le mot parlé ou écrit via le traitement du langage naturel (NLP) et de le traduire en langage de requête (SQL ou autre). Vous en avez déjà fait l’expérience si vous utilisez Google et saisissez une phrase de recherche ou si vous tapez simplement des mots. Les algorithmes d’apprentissage automatique de Google ont l’expérience accumulée à la fois pour comprendre ce qui a été saisi et pour le corriger.
Ce faisant, l’un des principaux obstacles de la BI est relevé par les experts techniques. Cependant, l’IA doit apprendre, car elle commettra sans aucun doute de nombreuses erreurs. Cela deviendra le rôle des TDE, apprenant à la machine à être plus précise à chaque fois.
Explication des données
Les humains sont imparfaits et facilement amenés à lire des informations qui n’existent pas dans les tableaux de bord. Par exemple, ce n’est pas parce qu’un graphique à courbes est très abrupt ou plat que cela signifie que la croissance de cette métrique est radicale ou inexistante. Il suffit de zoomer sur la courbe ou de modifier les dimensions du graphique pour parfois tirer des conclusions très différentes. Il existe de nombreux autres exemples montrant comment les visualisations de données, mal utilisées, peuvent influencer les utilisateurs.
Cependant, les machines n’ont pas d’yeux. Elles ne regardent pas les graphiques. Elles lisent les données qui composent le graphique. Et ce faisant, elles ne sont pas biaisées et peuvent détecter des défauts, des valeurs aberrantes, des nuances.
Mêmes données, même graphique, on cache quelque chose simplement parce que l’échelle commence à 0.
Les machines utiliseront la détection de modèle pour vous indiquer les caractéristiques du jeu de données que vous consultez. Elles peuvent ensuite construire un paragraphe d’explication sur ce qui se passe, quels sont les points clés à examiner et à quoi s’attendre. Elles peuvent même créer une « histoire de données » avec des images mettant en évidence les parties du graphique qui présentent un intérêt tandis que la voix générée par une machine explique les valeurs réelles, les variations, etc.
Correction et connexion des données
L’un des problèmes avec l’analyse des données est qu’il y a beaucoup de données incorrectes dans nos applications. Les données incorrectes ne sont pas nécessairement des erreurs ou des données vides, mais des données qui peuvent être calculées incorrectement s’il y a méconnaissance de la manière dont ces données sont remplies et de leur origine.
Prenons l’exemple d’une entreprise qui, après 3 ans d’implémentation d’un système de comptabilité, a ajouté une nouvelle colonne à l’un de ses nombreux tableaux avec une valeur convertie dans la devise principale de l’entreprise. Cette nouvelle colonne a ensuite été remplie correctement à partir de la 4ème année mais laissée vide les années précédentes, car ces données n’étaient pas disponibles. Tous leurs systèmes de BI ont donc déclaré leur « croissance » exceptionnelle, car il était auparavant égal à 0 (blanc) et cette année, il était supérieur à 0. C’est alors que nous avons décidé de remplir les années précédentes, mais en utilisant un taux de change statique qui encore une fois causait différents problèmes, principalement la précision dans les comparaisons entre l’année en cours et l’année précédente.
C’est le type de « connaissance » que les humains ont. Un TDE aurait connu l’historique d’une telle colonne et veillerait à ce que leurs rapports et l’analyse des données en tiennent compte. Mais que se passe-t-il lorsque le salarié ayant cette connaissance n’est plus employé par cette entreprise ? Ou cette personne n’est pas disponible à temps ? Où se trouve cette connaissance et qui est responsable de la maintenir à jour ?
L’apprentissage automatique peut également aider ici en créant une base de connaissances sur les modifications apportées au lignage de données, les transformations et la compréhension de son histoire. En étant en mesure de connecter automatiquement les données en détectant les modèles, en comprenant que les taux de change sont sensibles au temps, en les comparant aux valeurs réelles et en détectant les incohérences, comme dans l’exemple ci-dessus.
Conclusion
Les exemples ci-dessus ne sont que quelques exemples de la manière dont l’IA peut contribuer à la BI. L’intelligence artificielle alimente les voitures autonomes, la détection des fraudes, la reconnaissance faciale et de nombreux autres aspects de la vie. Évidemment, cela aura un impact similaire sur la BI et l’analyse des données.
Dans cinq ans, nous pouvons nous attendre à ce que la tâche de préparation des données soit en grande partie automatisée, à la fois pour la tâche de découverte des données et pour que la communication soit alimentée par la voix et le langage naturel.
Même l’analyse elle-même est un très bon candidat pour l’automatisation via l’IA. Cela permet aux entreprises et à la direction technique de continuer à innover et à optimiser leurs opérations.
Les avantages de la BI alimentée par l’IA changent la donne. C’est ce que vous pouvez découvrir plus en détail dans le livre blanc co-écrit par Telmo Silva, « Le Futur de la BI, l’Intelligence artificielle » disponible en téléchargement gratuit.
Télécharger le livre blancArticle sponsorisé. Les contributeurs experts sont des auteurs indépendants de la rédaction d’appvizer. Leurs propos et positions leurs sont personnels.
Diplômé en Ingénierie à l'Université de Toronto (BASc), a parcouru le monde pour implémenter des applications d'entreprise ERP, CRM et BI dans les secteurs de l'alimentation, du retail, des produits pharmaceutiques, de la santé et de l'industrie. Il est le fondateur et CEO de ClicData.