Avez-vous déjà vu un manuel scolaire sans image, une présentation chiffrée sans graphique, un bulletin météo sans carte ? Non, et vous allez comprendre pourquoi.

Nous sommes tous dotés de 5 canaux sensoriels (visuel, auditif, kinesthésique, olfactif et gustatif) qui nous permettent d’interagir avec le monde extérieur. Les 3 canaux sensoriels majeurs utilisés dans l’apprentissage, la mémorisation et la communication sont la vue, l’ouïe et le toucher. Sans forcément en avoir conscience, chacun d’entre nous va privilégier un voire deux canaux pour construire sa représentation mentale de l’information à traiter, mais aussi la façon de la penser, la mémoriser, la ressentir ou la restituer. Quel canal est le plus communément privilégié ? La vue ! En effet, plus de 80% de la population mondiale favorise et développe naturellement son canal visuel pour apprendre et communiquer. Notre culture est d’ailleurs très visuelle : l’art, la publicité, la télévision, notre canal visuel est très sollicité. Il ne faut donc surtout pas négliger ce point commun lorsque l’on souhaite transmettre une information.

1.    La dataviz, qu’est-ce c’est et à quoi ça sert ?

La visualisation des données (data visualization pour les bilingues ou encore dataviz pour les intimes) est un ensemble d’outils visuels permettant la représentation graphique d’informations ou de données, quels que soient leur nature, leur complexité ou leur nombre. Il peut s’agir de schémas, de graphiques standards ou non, de tableaux, de diagrammes ou encore de cartes. Les possibilités sont très vastes, tout dépend des données à représenter et du message à faire passer.

La dataviz peut être utilisée à différentes fins, le principal est de garder à l’esprit qu’elle représente un grand pouvoir, qu’il faut parfois maîtriser, mais surtout qu’elle n’est pas uniquement destinée aux équipes chargées des données.

On fait « parler » les données

Le premier objectif de la dataviz est de rendre intelligibles et exploitables des données ou des résultats. A partir d’une feuille de calcul contenant des données brutes, surtout si elle est de grande taille, il est quasiment impossible de tirer la moindre information globale. Avec la dataviz, les données prennent vie : elles peuvent montrer des tendances, des liens, d’autres peuvent apparaître comme aberrantes. Représentées graphiquement, les données peuvent enfin s’exprimer !

On parle la même langue

Et surtout, elles s’expriment dans un langage universel : celui des formes et des couleurs que nous avons appris avant même de savoir parler. Notre œil est naturellement attiré par les images, nous identifions facilement les nuances de couleurs et les différences de motifs. N’oublions pas que nous sommes en grande majorité des visuels : nous comprenons et retenons mieux une information lorsque nous la voyons et que nous pouvons nous l’approprier visuellement.

On prend efficacement des décisions

En révélant clairement les informations contenues dans des données, la dataviz représente une aide précieuse à la décision. Elle permet de recouper rapidement différentes informations, et d’en faire une lecture efficace sans analyses approfondies. On détecte plus facilement les tendances, on évalue efficacement une situation, on identifie rapidement les problèmes. Ce qui permet de prendre des décisions adaptées.

2.    Pourquoi la dataviz est-elle indispensable ?

La dataviz offre des moyens rapides, compréhensibles et efficaces de transmettre des informations (concepts, idées, tendances, résultats…).

La dataviz, c’est le cerveau de l’affaire

Notre cerveau est extrêmement limité lorsqu’il s’agit de traiter des données complexes, qui plus est sous un format purement textuel comme un rapport ou un tableau de données. Quoi de plus simple, intelligible et accessible qu’un graphique pour observer globalement ces données ?

Prenons l’exemple du suivi de croissance d’un enfant.

A chaque consultation pédiatrique, l’enfant est mesuré et pesé. Ces données sont comparées aux courbes de référence de l’OMS afin d’identifier tout problème lié à la croissance : risque éventuel d’obésité ou de carence, signe d’intolérance, cassures dans l’évolution du poids ou de la taille indiquant des pathologies sous-jacentes…

La récolte de ces données sur les 9 premières années d’un petit garçon conduit au tableau suivant :

Seriez-vous en mesure d’identifier le problème de croissance de cet enfant avec ce tableau de données ? Et avec ce graphique représentant en rouge l’évolution de son poids en bas et sa taille au-dessus, en fonction de son âge, tout cela superposé aux courbes de l’OMS ?

Grâce à ce graphique, nous sommes capables de détecter instantanément que le poids évolue normalement, avec une courbe bien centrée au milieu de celle de l’OMS, tandis que l’évolution de la taille ralentit et dévie dangereusement de la trajectoire normale qu’elle devrait suivre.

La dataviz nous aide à combler les limites de notre cerveau en exploitant ses forces et son mode de fonctionnement privilégié, à savoir son intérêt pour les formes et les couleurs, sa logique visuelle ou encore sa capacité d’analyse à partir de schémas organisés.

Les super pouvoirs de la dataviz

Selon les secteurs, la dataviz peut être un outil stratégique majeur, un vecteur de compréhension, une aide à la prise de décision et à la projection. Quels que soient les niveaux et les domaines d’expertise, un graphique permet de mettre tout le monde sur la même longueur d’onde : accès aux informations contenues dans les données pour en tirer le maximum et mise en lumière de ce qui est important pour faciliter l’analyse.

Un graphique bien choisi et bien réalisé remplace largement un long discours technique, il est beaucoup plus parlant que des feuilles de calculs et surtout il peut être fun. Prenons l’exemple de la production d’électricité en Suisse en 2014. L’idée est de mettre en avant la part importante d’énergie renouvelable produite. Quel meilleur moyen pour montrer le respect de la nature que d’utiliser la nature ? Ici, les morceaux de banane illustrent la part de chaque type d’énergie produite par la Suisse.

3.    A quel moment utiliser la dataviz ?

Dans le milieu professionnel ou personnel, dès que l’objectif est d’exploiter le plein potentiel des données, de prendre une décision importante, de transmettre un message, de faire comprendre une idée, la dataviz est votre meilleure alliée. La dataviz peut être utilisée n’importe où, n’importe quand et dans n’importe quel secteur d’activités. A l’époque du numérique et de la surgénération de données, tous les domaines d’activités sont amenés à traiter de la donnée, plus ou moins complexe et en plus ou moins grande quantité. Au-delà de la dataviz, l’analyse de ces données relève parfois de la data science.

Data science : la dataviz présente à toutes les étapes de l’analyse

Dans le cadre de la data science dont le but est de collecter, traiter et exploiter des données, la dataviz est d’abord une étape clé de traduction, d’aide à la compréhension, de tri et d’organisation de ces données. L’objectif est d’extraire un maximum d’informations exploitables à partir de données brutes, permettant de se familiariser plus facilement avec les données mais aussi d’éviter de nombreuses erreurs dans leur exploitation. Cette étape permet également de visualiser les premières tendances : une évolution en fonction du temps, un lien entre 2 évènements, des données aberrantes…

Rendues intelligibles, exploitables et cohérentes, les données peuvent ensuite subir de nombreuses analyses afin de les comparer, les modéliser, les classer ou les résumer. A cette étape, la dataviz est un outil indispensable pour expliquer les résultats de manière simplifiée, efficace et claire à tout type de public. Bien utilisée, elle permet une communication transversale entre les corps de métier et les analystes, les aidant dans leur prise de décision.

Quelques exemples de domaines où la dataviz joue un rôle clé

Nous le voyons chaque jour aux informations, les médias utilisent beaucoup la dataviz : un camembert pour illustrer les résultats d’un sondage, un diagramme en barres pour noter l’évolution du carburant en France… Les graphiques ont le vent en poupe dans la communication, et ce n’est pas le gouvernement ni les industries du marketing qui vont contredire cela. Dès la phase d’éducation de nos enfants, la dataviz intervient.

Au-delà de la communication vers l’extérieur, la dataviz contribue à 3 enjeux majeurs pour les entreprises : la compréhension de leurs données, la communication interne et la prise de décision stratégique. Grâce à la traduction visuelle de données et de résultats, les professionnels de tous secteurs peuvent améliorer leur quotidien grâce à la dataviz :

  • En finance, ils optimisent leur stratégie d’investissement en suivant plus efficacement les performances
  • En marketing de vente, ils optimisent leur ciblage commercial par une meilleure connaissance clients
  • En santé, ils s’assurent une communication efficace entre scientifiques (biologistes, chercheurs, médecins) et analystes
  • En recherche médicale, ils croisent différentes sources d’informations pour mieux comprendre l’origine des maladies
  • En direction d’entreprises, ils réalisent des bilans annuels efficaces avec chiffres clés et graphiques d’évolution

Et nous pourrions en citer des dizaines…

4.    Quel type de visualisation choisir ?

Quand on parle de visualisation de données, les plus néophytes d’entre nous vont certainement penser aux digrammes en barres ou aux camemberts que les chaînes d’info utilisent en permanence. Mais la dataviz, c’est bien plus que cela, il peut parfois s’agir d’un vrai travail de réflexion de trouver la visualisation qui sera la plus adaptée aux données étudiées et/ou au message à transmettre.

Partie émergée de l’iceberg dataviz : les graphes de bases

Parmi les visualisations les plus usuelles, nous trouvons :

  • Les tableaux récapitulatifs ou comparatifs
  • Les graphes indiquant des proportions ou un classement : diagrammes circulaires ou en barres, treemaps
  • Les graphes montrant une évolution dans le temps ou l’évolution d’une variable par rapport à une autre : diagrammes de points, de bulles, de lignes, de segments, de courbes ou de zones
  • Les graphes de distribution : diagrammes en barres avec empilement (par exemple une pyramide des âges), histogrammes, graphes de densité, digrammes en violon et boîtes à moustaches
  • Les graphes illustrant les corrélations entre variables : matrices de corrélation, heatmaps
  • Les graphes de données géospatiales : cartographie

Partie immergée de l’iceberg : les graphes non standards

Un certain nombre de graphiques existent pour des besoins très précis :

  • Les graphes illustrant certains résultats d’analyse de classification ou de modélisation : dendrogrammes, parallel coordinates plot, network diagram
  • Les graphes montrant des liaisons particulières : arc diagram pour visualiser un réseau par exemple, chord diagram pour résumer le trafic aérien d’un pays par exemple
  • Les graphes de brainstorming : nuages de mots, mind mapping
  • Les graphes pour la gestion de projet : diagramme de Gantt

Il est également possible de créer, à partir d’un ou plusieurs graphes usuels et de différents moyens de customisation, le graphique fournissant le résumé le plus complet ou captant au mieux la spécificité de la donnée. Dans ce cas, les possibilités sont multiples et des nouveautés sortent régulièrement. Tout graphe, usuel ou non, peut également être détourné : prendre la base d’une image pour créer le graphique, comme sur notre exemple de la banane. La seule limite est l’imagination.

La cerise sur l’iceberg : l’interactivité

Plusieurs logiciels permettent de créer des applications ou des interfaces permettant d’interagir directement avec les graphiques. Il peut s’agir de l’affichage de certaines informations clés lorsque le curseur pointe sur un point précis, la possibilité de zoomer sur des zones d’intérêt, de disposer de graphiques en cascades ou encore de tableaux de bords avec différents graphiques, tableaux et chiffres clés liées par des filtres communs.

Une banquise d’outils et de catalogues de dataviz

Les outils pour créer des graphiques et analyser ses données se comptent par dizaines sur le marché. Plus ou moins complexes et intuitifs, ils ne conviennent pas forcément à tout le monde, ne sont pas adaptés à tous les niveaux et sont parfois incompatibles avec les besoins en entreprise. Mais bien utilisés, avec les formations adéquates, ils permettent de créer des graphiques de qualité. Les catalogues aussi fleurissent sur le net : ils exposent de nombreuses possibilités graphiques, avec plus ou moins de détails sur leur utilisation et leurs limites.

Il est donc tout à fait possible de créer soi-même des graphiques mais il est en général préférable de faire appel à des spécialistes (statisticien, data analyst, data scientist), au moins pour un accompagnement dans cette démarche. C’est aussi pourquoi de nombreuses entreprises développent, à partir de logiciels de programmation en statistiques, leurs propres outils personnalisés et leurs propres catalogues, adaptés à leurs besoins ou à ceux de leurs clients. C’est le cas du Pôle d’Expertise d’IT&M STATS dont le catalogue s’adresse d’abord aux industriels de la life science comme les entreprises pharmaceutiques, cosmétiques, agroalimentaires ou les organismes de santé, mais aussi aux industries au sens large comme le marketing, le secteur bancaire ou l’énergie.

5.    Comment bien utiliser la dataviz ?

On peut quasiment tout faire avec un graphique et tous les moyens sont disponibles pour y parvenir, mais cela présente aussi des risques, c’est pourquoi il faut respecter quelques bonnes pratiques.

Scénario de l’histoire

La dataviz, c’est de la narration visuelle. Faire « parler les données », c’est leur permettre de nous raconter leur histoire. Mais faire les mauvais choix de représentation reviendrait à dérouler le mauvais scénario. Sans aller jusqu’à dire que la dataviz est un art, il faut garder en tête que l’utilisation de la dataviz est un acte délibéré avec un objectif précis et donc que certains principes sont à respecter.

Quand on crée une représentation graphique, il faut être conscient du contexte et de l’objectif, à chaque étape du processus de création : avant, pendant et même après. Le graphe choisi doit être une aide à l’atteinte de cet objectif : il est essentiel de comprendre en un coup d’œil le sujet traité, les informations représentées et le but de la représentation. Tout choix visuel doit également y contribuer.

Le graphique suivant est un exemple où le contexte et l’objectif ne sont clairement pas identifiables :

Le contexte concerne aussi le moyen par lequel le graphique va être présenté. S’agit-il d’une présentation orale ou écrite, formelle ou non, à fort enjeu stratégique ? A quelle étape d’une étude ou d’un processus se situe-t-on au moment de la présentation ? Selon la complexité du sujet et les spécificités du graphique, il faudra peut-être construire le discours autour du graphique, avec les explications nécessaires à sa bonne compréhension.

Pour toi public !

Il est indispensable de savoir à qui s’adresse l’histoire. À tout moment du processus, il faut avoir conscience du public visé par la représentation graphique, son niveau d’expertise, son langage professionnel et ses attentes. On doit adapter le choix du graphique, tous les éléments visuels et le discours autour à notre public, ses besoins et ses préoccupations.

Simple et efficace !

Le but principal d’un graphique est de délivrer un message, passer un ensemble d’informations sans fioriture et sans équivoque. Il faut que ce soit le plus limpide possible, ce qu’il faut retenir doit être évident et ne pas être noyé dans une quantité inutile d’informations parasites. Le visuel le plus simple est souvent le meilleur, il faut viser le juste besoin pour ne pas créer plus de questions que d’idées. Et surtout, les bons choix graphiques permettent d’éviter les erreurs d’interprétation, qui peuvent avoir des conséquences fâcheuses, voire catastrophiques.

Dans l’exemple suivant, trop d’informations ont été incluses dans le graphique, le rendant illisible et incompréhensible :

6.    En dataviz, les apparences sont importantes !

Tous les réglages graphiques de notre visualisation ont leur importance et vont contribuer à la bonne compréhension et à la clarté du graphique, ou tout le contraire.

Annoncez la couleur

Notre attention est naturellement captée par les couleurs et les formes mais elle peut vite être noyée quand trop d’informations se mélangent ou qu’il n’est pas possible de faire certaines distinctions. C’est pourquoi le choix d’une palette de couleurs harmonieuses mais aussi aux contrastes suffisants pour être distinguées les unes des autres est très important. Si vous n’êtes pas contraint par des couleurs d’entreprise, de nombreuses palettes existent dans les outils de visualisation ainsi qu’en ligne. Certaines s’adaptent même à certaines pathologies visuelles comme le daltonisme. Il est également possible de créer ses propres palettes de couleurs à partir d’images, de tableaux ou de photos.

Les couleurs doivent donner envie de s’attarder sur le graphique. A consommer avec modération mais à consommer quand même ! Il en est de même pour l’illustration du contenu par des images judicieusement choisies. On peut être professionnel et fun à la fois ! Dans l’exemple ci-dessous, la production de blé aux Etats-Unis entre 2016 et 2019 est associée à des couleurs reprenant celle de la nature avec le bleu du ciel, le vert de la terre fertile et le jaune du blé.

Taillez le bon costume

Tout ce qui constitue le cadre, le fond, les échelles de notre graphique sont d’une extrême importance. Pour une bonne lisibilité et une bonne compréhension, la taille de la fenêtre graphique doit être adaptée au support de présentation de ce graphique. Le choix d’un fond neutre évite de perturber la lecture du graphique. Et les échelles doivent être cohérentes avec les unités et les informations à faire passer. Par exemple, lorsqu’on veut comparer 2 graphiques selon des mesures similaires, il est essentiel que les échelles soient les mêmes (mêmes bornes, même précision et même quadrillage). Sur l’exemple ci-dessous, le même graphique est proposé suivant deux échelles différentes. A gauche, l’échelle indiquant le nombre de ventes ne commence pas à 0, ce qui peut prêter à confusion et nous pousser à conclure qu’il y a un réel problème avec ce produit. Mais à droite, avec le même graphique mais l’échelle commençant à 0, il est clair que la réalité n’est pas si catastrophique.​

Croyez en la légende

Une bonne légende est une aide à la compréhension du graphique. Pas toujours nécessaire, elle doit être utilisée dans un but précis afin de contribuer à la clarté du message. Dans l’exemple présenté ci-dessous, les résultats d’un sondage sur les jeux vidéo les plus populaires sont représentés sur un diagramme circulaire. En dehors du fait que le choix du graphique n’est pas optimal, la légende à rallonge avec plein de couleurs similaires n’aide pas du tout à s’y retrouver.

Bannissez la 3D

Sauf dans des cas très particuliers, le recours à la 3D est généralement une mauvaise idée car elle complexifie inutilement le graphique. Le graphique ci-dessous en est un parfait exemple : un diagramme en barres selon 2 variables. Les barres en 3D sont difficiles à comparer les unes aux autres et certaines sont cachées. ​

Rappelons-le, plus simple c’est souvent mieux, la preuve en image !

Conclusion

Miser sur un langage universel basé sur le visuel, c’est contribuer à rendre les informations accessibles et compréhensibles au plus grand nombre. Intégrer la dataviz à notre relation aux données, et le faire selon les règles de l’art, c’est avoir tout compris !