バイオリン図の例
PLOS Pathogensでのバイオリン図の例

バイオリン図(バイオリンず、: violin plot)は、数値データを描画する手法の一つであり、箱ひげ図の両脇に90度回転させたカーネル密度グラフを付加したものに近い[1]

概要

編集

バイオリン図は 箱ひげ図 に似ているが、異なる値のデータに確率密度を表示する点で異なっている。確率密度は、最も単純な場合にヒストグラムとなる。一般にバイオリン図には、箱ひげ図同様、データの中央値を示すマークと四分位範囲を示す箱も描かれる。この箱ひげ図に重ねて描画されるのはカーネル密度推定である。箱ひげ図のようにバイオリン図は複数のカテゴリ間での変数分布の比較に用いられる。例えば日中と夜間の温度分布の比較や、複数の製造業者での車両価格の分布などである。

箱ひげ図との比較

編集

バイオリン図には箱ひげ図よりも多くの情報が含まれる。箱ひげ図には平均/中央値と四分位範囲という要約統計量のみが含まれるのに対し、バイオリンプロットにはすべての分布データが含まれる。これはデータ分布がmultimodal(複数のピークがある)場合に特に有用である。このような場合、バイオリン図では複数のピークの位置と大きさが明確に表現されるが、これは箱ひげ図では表現されない。バイオリン図の内部には平均(または中央値)と四分位範囲が描かれる。特にサンプルサイズが大きくない場合には、すべてのサンプルデータが点や線として描かれる場合もある。

箱ひげ図よりも多くの情報が含まれるものの、バイオリン図はよりマイナーである点が欠点である。知名度が低いため、バイオリン図を知らない人にとっては意味が理解しづらい。このような場合、より分かりやすい代替図としてはヒストグラムを複数描画するか、カーネル密度を描画することが考えられる。

ソフトウェア

編集

バイオリン図は多くのソフトウェアパッケージで拡張機能として利用することができる。例えばR言語ではライブラリの vioplot, wvioplot, caroline, UsingR, lattice, ggplot2、Stataではアドオンコマンドの vioplot[2]Pythonではmatplotlib[3],Plotly[4],Seaborn[5]Originでの実装[6]などがある。

参考文献

編集
  1. ^ VIOLIN PLOT”. NIST DataPlot. National Institute of Standards and Technology (2015年10月13日). 2017年11月11日閲覧。
  2. ^ Hintze, Jerry L.; Nelson, Ray D. (1998). “Violin Plots: A Box Plot-Density Trace Synergism”. The American Statistician 52 (2): 181–4. doi:10.1080/00031305.1998.10480559. http://search.proquest.com/openview/dcd68eb137d2d6b08aa23f37e34e0b01/1?pq-origsite=gscholar. 
  3. ^ violin plots”. What's new in matplotlib. 2017年11月11日閲覧。
  4. ^ Violin Plots in Python”. Plotly Python API Library Reference. 2017年11月11日閲覧。
  5. ^ Waskom, Michael. “Violinplot from a wide-form dataset”. Seaborn: statistical data visualization. 2017年11月11日閲覧。
  6. ^ Violin Plot in Origin 2019”. 2018年10月29日閲覧。

外部リンク

編集

パブリックドメイン この記事にはパブリックドメインである、アメリカ合衆国連邦政府が作成した次の文書本文を含む。Dataplot reference manual: Violin plot. アメリカ国立標準技術研究所.

📚 Artikel Terkait di Wikipedia

Q-Qプロット

Q-Qプロット(英: Q–Q plot, quantile–quantile plot)は、統計学における確率プロットの一つで、2つの確率分布の分位数(quantiles)を互いにプロットして比較するグラフィカルな手法(英語版)である。プロット上の点 (x, y)

ベナン

pardons 'poison-plot' businessman who fled to France” (英語). RFI (2014年5月15日). 2022年6月3日閲覧。 ^ “Benin businessman accused in poisoning plot back from exile

箱ひげ図

箱ひげ図(はこひげず、箱髭図、英: box plot、box-and-whisker plot)は、データの統計的ばらつきをわかりやすく表現するための統計図である。主に多くの水準からなる分布を視覚的に要約し、比較するために用いる。ジョン・テューキーが1970年代に提唱した。様々な分野で利用されるが

フランスの首相

37: text:"政党:" - TextData attribute 'text' contains ~ (tilde). Tilde will not be translated into newline character (only in PlotData) READY No errors

R言語

でき、読み込み後は行列として扱えるので、画像処理にも用い得る。パイプやソケット(ポート参照)を扱う関数も用意されている。 plot 関数によって多彩なプロットができる。 plot は総称的な関数であり、引数として渡されたデータの種類によって、自動的に様々なグラフを描き分ける。他にヒストグラムを描画す

カーネル密度推定

ensity(1D用)とKs2density(2D用)の両関数がLabTalk言語、 Python、C言語からアクセス可能である。 PAST - Plot項目の中のHistogramで,カーネル曲線が描ける。 R言語 - density 関数で実装されている。 Stata - kdensity

Interactive Data Language

IDL はVAX/VMSのFORTRANから発祥しており、構文にもその痕跡がある。 x = findgen(100)/10 y = sin(x)/x plot,x,y ここで、findgen という関数は浮動小数点数の1次元の配列を返すもので、その値は0から始まる整数の列と同じである。

センター郡区 (アイオワ州アラマキー郡)

PrairieとLutheranとOld East Paint CreekとOld West Paint CreekとReynolds PlotとRoese PlotとWest Paint Creek Synodの9つの霊園が含まれている。 ^ US Board on Geographic Names