\( \DeclareMathOperator{\abs}{abs} \newcommand{\ensuremath}[1]{\mbox{$#1$}} \)

データの分析

1 データの代表値

変量(離散,連続):variable,(discrete,continuous)
 変量の集まりがデータ:data
代表値,平均値,中央値,最頻値:typical value,mean value,median,mode

日本は(相加)平均にこだわりすぎるようで,世の中は中央値がメインなんだそうだ。
幾何平均(相乗平均)のほうが相加平均より小さい。
maximaにmodeはないようだが,histgramをすれば一目瞭然。
以下,体重のデータで
統計処理もGeogebraはすごい。

(%i1) load(descriptive)$
(%i2) l1:[61.0,57.0,68.0,53.5,55.5,49.0,58.0,56.0,57.0,44.5,55.0,43.5,40.5,55.0,46.0,67.0,52.5,49.5,53.5,45.5]$
(%i3) mean(l1);
\[(\%o3)53.375\]
(%i4) geometric_mean(l1);
\[(\%o4)52.89954852300274\]
(%i5) median(l1);
\[(\%o5)54.25\]
(%i6) histogram(l1)$

図 1:
Diagram

2 データの散らばりと四分位範囲

範囲:range
四分位数:Quartile 第1四分位数Q1,第2四分位数Q2,第3四分位数Q3
四分位範囲:Q3-Q1:Interquartile range,四分位偏差(Q3-Q1)/2:Quartile deviation
箱ひげ図:Box-Wisker,Wiskeyではない

集団を表すのに,最高値,中央値,最低値,それから,最高値と中央値の中央値,最低値と中央値の中央値を利用する。
 小さい方から,最低値,第一4分位数,中央値,第二4分位数,最高値となる。
 ちなみに,第二4分位数から第一4分位数をひいたものの半分が四分位偏差という。
 これを,一気に目で見るのが(五数要約という),箱ひげ図。

(%i7) maxi(l1);
\[(\%o7)68.0\]
(%i8) mini(l1);
\[(\%o8)40.5\]
(%i9) range(l1);
\[(\%o9)27.5\]
(%i10) quantile(l1,3/4);
\[(\%o10)57.0\]
(%i11) quantile(l1,1/4);
\[(\%o11)48.25\]
(%i12) qrange(l1);
\[(\%o12)8.75\]
(%i13) boxplot(l1)$

図 2:
Diagram

図 3:
Diagram

3 分散と標準偏差

偏差,分散,標準偏差:deviation,variance,standard deviation

木の太さと高さのデータから これもGeogebraだな。

図 4:
Diagram
(%i14) l2:matrix([22,13],[27,15],[29,18],[19,14],[33,20]);
\[\tag{l2}\label{l2}\begin{pmatrix}22 & 13\\ 27 & 15\\ 29 & 18\\ 19 & 14\\ 33 & 20\end{pmatrix}\]
(%i15) mean(l2);
\[(\%o15)[26,16]\]
(%i16) std(l2);
\[(\%o16)[\frac{2\sqrt{31}}{\sqrt{5}},\frac{\sqrt{34}}{\sqrt{5}}]\]

4 データの相関

散布図:scatter plot
相関関係:correlation
相関表:correlation table
共分散:covariance
相関係数:correlation coefficient

(%i17) scatterplot(l2,point_type = diamant,point_size = 2,color = blue)$

図 5:
Diagram
(%i18) cor(l2);
\[(\%o18)\begin{pmatrix}1 & \frac{59}{{{2}^{\frac{3}{2}}}\,\sqrt{17}\,\sqrt{31}}\\ \frac{59}{{{2}^{\frac{3}{2}}}\,\sqrt{17}\,\sqrt{31}} & 1\end{pmatrix}\]
(%i19) float(%), numer;
\[(\%o19)\begin{pmatrix}1.0 & 0.9086606278597035\\ 0.9086606278597035 & 1.0\end{pmatrix}\]


Created with wxMaxima. inserted by FC2 system