Un diagramme en violon (de l'anglais violin plot) est un graphique statistique permettant de comparer des distributions de probabilité. Il est similaire à un diagramme en boîte, auquel s'ajoute un diagramme de densité du noyau pivoté de chaque côté[1].

Exemple de diagramme en violon.
Exemple d'un diagramme en violon dans une publication scientifique dans PLOS Pathogens .

Histoire

modifier

Le diagramme en violon a été introduit, en 1997, par Jerry L. Hintze et Ray D. Nelson, comme un outil plus complet et précis que les diagrammes en boîte, créés par John Tukey en 1977[2]. Leur nom provient de leur ressemblance grossière avec un violon[2].

Création

modifier

Les diagrammes en violon sont similaires aux boîtes à moustaches, à la différence qu'ils affichent également la densité de probabilité des données à différentes valeurs, généralement lissée par un estimateur de densité à noyau. Un diagramme en violon inclut toutes les données qui le composent : un marqueur pour la médiane des données ; une boîte ou un marqueur indiquant l'écart interquartile ; et éventuellement tous les points d'échantillonnage, si le nombre d'échantillons n'est pas trop élevé.

Alors qu'un diagramme en boîte présente des statistiques récapitulatives telles que la moyenne, la médiane et les écarts interquartiles, le diagramme en violon permet de connaître la distribution complète des données. Il peut être utilisé avec des données multimodales (c'est-à-dire, ayant plus d'un pic). Dans ce cas, il montre la présence des différents pics, leur position et leur amplitude relative.

Usages

modifier

Comme les diagrammes en boîte, les diagrammes en violon sont utilisés pour représenter la comparaison d'une distribution variable (ou distribution d'échantillons) entre différentes « catégories » (par exemple, la distribution de température comparée entre le jour et la nuit, ou la distribution des prix des voitures comparée entre différents constructeurs automobiles).

Un diagramme en violon peut comporter plusieurs couches. Par exemple, la forme extérieure représente tous les résultats possibles. La couche suivante, à l'intérieur, peut représenter les valeurs observées 95 % du temps. La couche suivante (si elle existe) à l'intérieur peut représenter les valeurs observées 50 % du temps.

Les graphiques en violon sont moins populaires que les boîtes à moustaches, et peuvent être plus difficiles à comprendre pour les lecteurs qui ne les connaissent pas. Dans ce cas, une alternative plus accessible consiste à tracer une série d'histogrammes empilés ou de graphiques de densité de noyau.

Voir aussi

modifier

Références

modifier
(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Violin plot » (voir la liste des auteurs).
  1. « Violin Plot », NIST DataPlot, National Institute of Standards and Technology, 13 octobre 2015
  2. a et b (en) Hintze et Nelson, « Violin Plots: A Box Plot-Density Trace Synergism », The American Statistician, vol. 52, no 2,‎ mai 1998, p. 181–184 (ISSN 0003-1305, DOI 10.1080/00031305.1998.10480559, lire en ligne  )

Sur les autres projets Wikimedia :

Liens externes

modifier

📚 Artikel Terkait di Wikipedia

Pandas

à barres df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE')) df.plot.bar(stacked=True) plt.show() Box plot df = pd.DataFrame(np.random.rand(7

Plottes

Plottes est une commune française située dans le département de Saône-et-Loire, en région Bourgogne-Franche-Comté. Plottes est un village du sud de la

Chucky (franchise)

(franchise) » (voir la liste des auteurs). Cult of Chucky: Horror sequel plot details, teaser video revealed sur EW.com, consulté le 10 janvier 2017. « L'horrible

Liste d'attaques terroristes d'extrême droite déjouées

mai 2023). (en) AFP in Berlin, « German police arrest 12 over far-right plot to spark 'civil-war-like situation' », sur the Guardian, 14 février 2020

Visualisation de données

mettre en évidence une corrélation entre deux variables. Une ligne ou line plot est un nuage de points dans lequel les points ont été reliés entre eux (avec

Particle Data Group

hypotéthiques et sur la violation des lois de conservation. Reviews, Tables and Plots (Résumés, tables et courbes) – contient un résumé des concepts mathématiques

Diagramme quantile-quantile

En statistiques, le diagramme Quantile-Quantile ou diagramme Q-Q ou Q-Q plot est un outil graphique permettant d'évaluer la pertinence de l'ajustement

The First Frost

starring Bai Jingting and Zhang Ruonan: Complete release schedule, air time, plot, cast, & all you need to know », www.sportskeeda.com, 12 février 2025 (consulté