2.10
住宅の価格とそれに対応する地上面積に関する定量的データを考えてみましょう。このような 2 つの変数を持つ量的データは、二変量データと呼ばれます。
原因として機能する変数は独立変数と呼ばれ、応答を示す別の変数は従属変数と呼ばれます。
この 1 つの変数と他の変数の依存性は、散布図を使用して視覚化できます。ここでは、独立変数 (地表面積) は X 軸に沿って表され、従属変数 (住宅価格) は Y 軸に沿って表されます。
地上面積に対応する価格をマークします。次に、この線の上下にほぼ同じ数のポイントが存在するように、最適な線を描画します。これらの点は、2 つの変数間の相関を識別するためのパターンを形成します。
地表面積の増加は住宅価格の上昇につながることに注意してください。このような増加傾向は、正の相関関係を示しています。
逆に、減少傾向が観察された場合、それは負の相関を示しています。トレンドがないということは、相関関係がないことを意味します。
2 つの変数 x と y の間の関係を表示する最も一般的で簡単な方法は、散布図です。散布図は、変数間の関係の方向を示します。明確な方向性は、次のいずれかが存在する場合に発生します。
散布図を見て、点が線、べき乗関数、指数関数、またはその他のタイプの関数にどれだけ近いかを確認することで、関係の強さを判断できます。線形関係の場合は例外があります。すべての点が水平線上にあり、「完全に適合」する散布図を考えてみましょう。実際、水平線は何の関係も示しません。
散布図を見るときは、全体のパターンと、偏差がある場合にはその偏差に注目する必要があります。
住宅の価格とそれに対応する地上面積に関する定量的データを考えてみましょう。このような 2 つの変数を持つ量的データは、二変量データと呼ばれます。
原因として機能する変数は独立変数と呼ばれ、応答を示す別の変数は従属変数と呼ばれます。
この 1 つの変数と他の変数の依存性は、散布図を使用して視覚化できます。ここでは、独立変数 (地表面積) は X 軸に沿って表され、従属変数 (住宅価格) は Y 軸に沿って表されます。
地上面積に対応する価格をマークします。次に、この線の上下にほぼ同じ数のポイントが存在するように、最適な線を描画します。これらの点は、2 つの変数間の相関を識別するためのパターンを形成します。
地表面積の増加は住宅価格の上昇につながることに注意してください。このような増加傾向は、正の相関関係を示しています。
逆に、減少傾向が観察された場合、それは負の相関を示しています。トレンドがないということは、相関関係がないことを意味します。
From Chapter 2:
Now Playing
データの集計と可視化
8.9K Views
データの集計と可視化
9.8K Views
データの集計と可視化
20.8K Views
データの集計と可視化
10.3K Views
データの集計と可視化
10.1K Views
データの集計と可視化
65.0K Views
データの集計と可視化
6.9K Views
データの集計と可視化
5.3K Views
データの集計と可視化
14.0K Views
データの集計と可視化
4.9K Views
データの集計と可視化
4.0K Views
データの集計と可視化
17.7K Views
データの集計と可視化
6.6K Views
データの集計と可視化
6.1K Views
データの集計と可視化
13.3K Views