ねこらぼノート

Practice and Theory of Thinking for Business, Science and Life

1変数データ、多変数データ

1変数データ、多変数データについて説明する。

目次

1変数データ、多変数データ(2変数データ、3変数データ、…)

変数には、身長、体重、性別などがある。2変数以上であるデータを多変数データと呼ぶ。変数の数のことを次元という単位で呼ぶこともある。

タイタニック号の乗客生存データ(参考文献より)をもとに例を説明する。

1変数データの例

IDは乗客を区別する番号である。1変数として、乗船していた座席の等級(船員、1等、2等、3等)がある。等級は、0が船員、1が1等、2が2等、3が3等である。

ID Class(等級)
0 0
1 1
2 2
3 3
4 3
5 2
6 3
7 0
8 2
9 0

2変数データの例

下の表では、2つ目の変数として、大まかな年齢がある。0が子供、1が大人である。「等級」と「大まかな年齢」の2つの変数があるため、2変数データと呼ぶ。

ID Class(等級) Age(大まかな年齢)
0 0 1
1 1 1
2 2 1
3 3 1
4 3 1
5 2 1
6 3 0
7 0 1
8 2 1
9 0 1

3変数データの例

下の表では、3つ目の変数として、性別がある。0が女性、1が男性である。「等級」、「大まかな年齢」に加えて「性別」の3つの変数があるため、3変数データと呼ぶ。

ID Class(等級) Age(大まかな年齢) Sex(性別)
0 0 1 1
1 1 1 1
2 2 1 0
3 3 1 1
4 3 1 0
5 2 1 1
6 3 0 1
7 0 1 1
8 2 1 1
9 0 1 1

4変数データの例

下の表では、4つ目の変数として、生存したか?がある。0が死亡、1が生存である。「等級」、「大まかな年齢」、「性別」に加えて「生存?」の4つの変数があるため、4変数データと呼ぶ。

ID Class(等級) Age(大まかな年齢) Sex(性別) Survived(生存?)
0 0 1 1 0
1 1 1 1 0
2 2 1 0 1
3 3 1 1 0
4 3 1 0 1
5 2 1 1 0
6 3 0 1 0
7 0 1 1 1
8 2 1 1 0
9 0 1 1 1

まとめ

1変数データ、多変数データについて説明した。

参考文献

Robert J. MacG. Dawson (1995), The `Unusual Episode' Data Revisited. Journal of Statistics Education, 3

付録

タイタニック号のデータから10行抽出した際のプログラムを付録として記載する。

GitHub - Titanicデータの確認