ねこらぼノート

Practice and Theory of Thinking for Business, Science and Life

2変数データ(量的データの定性的把握:散布図とその見方)

2変数データ(量的データ)を定性的に把握する方法について説明する。散布図とその見方について説明する。

目次

散布図

2変数があるときに、変数の1つを横軸、もう1つを縦軸にして、1点1点プロットする。次のような図になる。

タイタニック号のデータで作ってみる

横軸がAgeと縦軸がFareで散布図を作ってみた。この2変数は、関係なさそうですね。

点の数が多すぎる場合

散布図の問題として、図に点が多すぎるとよくわからなくなる。対策としては、2つある。1つは点の数を無作為抽出して減らす。もう1つは、分割表やヒートマップを作る。分割表とヒートマップについてはそのうち書きます。

散布図の見方

関係の有無、関係の数、関係の形、関係の向き、関係の強さという見方について説明する。

関係の有無

関係がある、関係がないの2つがある。

関係の数

関係の異なる層が混ざっていると、複数の関係が見られる場合がある。関係の数によって分類できる。1つの関係、多数の関係(2つ以上の関係)がある。

2つ以上の関係がある場合、層別化することが必要かもしれない。

関係の形

直線関係、二次関数関係、指数関係、上限・下限がある関係、円形などがある。

関係があり、1つの関係であり、直線関係であることを相関関係があると言う。(ただし、関係があることだけを相関関係ということもある。)

関係の向き

基本的には相関関係がある場合を前提として、関係の向きという観点で見る。関係の向きには、正の関係と負の関係がある。

関係の強さ

基本的には相関関係がある場合を前提として、関係の強さという観点で見る。関係の強さには、強いと弱いがある。

散布図の見方まとめ

散布図の見方として、関係の有無、関係の数、関係の形、関係の向き、関係の強さを説明した。まとめると次の表になる。

見方 内容
関係有無 関係がある、関係がない
関係の数 1個、2個、3個以上
関係の形 直線、二次関数、指数、上限・下限がある、円形等
関係の向き 正の関係、負の関係
関係の強さ 強い、弱い

まとめ

2変数データ(量的データ)を定性的に把握する方法について説明した。散布図の見方については、文献が見つけられなかったため独自の見解が多い。情報がありましたらtwitterにてご連絡をお待ちしております。

参考文献

  1. 統計学入門, 東京大学出版会
  2. 統計学 改訂版, 有斐閣

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

統計学 改訂版 (New Liberal Arts Selection)

統計学 改訂版 (New Liberal Arts Selection)

  • 作者: 森棟公夫,照井伸彦,中川満,西埜晴久,黒住英司
  • 出版社/メーカー: 有斐閣
  • 発売日: 2015/09/26
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る

付録

GitHub - 散布図

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

統計学 改訂版 (New Liberal Arts Selection)

統計学 改訂版 (New Liberal Arts Selection)

  • 作者: 森棟公夫,照井伸彦,中川満,西埜晴久,黒住英司
  • 出版社/メーカー: 有斐閣
  • 発売日: 2015/09/26
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る