統計 学習メモ
何かと必要になってきそうなので勉強をはじめるついでにメモ
データの整理 (記述統計学)
ある実験や、調査によって得られたデータの特性をとらえやすくするための整理手法。
測定尺度
データには、いくつかの種類があり、そのデータの形によっては実施することができる計算や、統計的手法が異なる。
1.量的データ
数値で表すことの出来るデータのこと。(℃,cm,gなど)
2.質的データ(カテゴリーデータ)
数値で表すことの出来ないデータ。(感想、性別、住所、IDなど)
量的データは、ある単位で表されている数値なため足し算や、平均など計算を行う事が出来る。一方、質的データは男.1 、女.2などのようにそれぞれに数値を与えることはあるが、それぞれを計算に使うことはできない。可能なことは、それぞれの数をカウントすることくらい。
度数分布表とヒストグラム
度数分布表やヒストグラムを作成することで、ある大量のデータを手に入れたときそのデータを直感的にそのデータの特性をつかむことが出来るようになる。
ざっくりデータ。
値段(円) | |
ラーメン屋1 | 700 |
ラーメン屋2 | 850 |
ラーメン屋3 | 600 |
ラーメン屋4 | 650 |
ラーメン屋5 | 980 |
ラーメン屋46 | 890 |
ラーメン屋47 | 930 |
ラーメン屋48 | 650 |
ラーメン屋49 | 777 |
ラーメン屋50 | 700 |
合計 | 37147 |
度数分布表 |
|||||
以上 | 未満 | 階級 | (以下) | 度数 | 相対度数 |
500 | 600 | 550 | 599 | 4 | 8 |
600 | 700 | 650 | 699 | 13 | 26 |
700 | 800 | 750 | 799 | 18 | 36 |
800 | 900 | 850 | 899 | 12 | 24 |
900 | 1000 | 950 | 999 | 3 | 6 |
階級 | ・・・あるデータの範囲 |
階級値 | ・・・階級にあたえられた値 |
度数 | ・・・あるデータの範囲に入っているサンプル(標本)の数 |
相対度数 | ・・・データ全体の数に対する度数の割合のこと |
全体を1としたときの割合 |
度数の計算をExcelで算出する場合、関数のFREQUENCY()を使う。
ヒストグラムは、棒グラフのこと。階級に対する度数の値や、相対度数の値から作成するとそれぞれの階級がどんな関係なのかを見やすくなる。
今日は、ここまで。
思ったよりも編集が大変だな・・・。画像とかはれないのかなぁ。
誕生日だと・・・
何か、黄色い象さんを追いかけているうちに誕生日が来てしもた。
早いわー。
今年は、象と統計関係でがんばろうと思います。
久々よねー
デジタルカメラの話。
D800EとD4がCP+で触れるとか。
これは、行ってみるしかない。
D4とD800Eのシャッターフィーリングが気になる。
招待してもRAいました!
招待ありがとうございますっ。
ゆるーく、日記書けたらいいな・・・。