データは、母集団またはサンプルから取得された情報の個々の項目です。データは、定性的(カテゴリ別)、定量的連続型、または定量的離散型に分類できます。研究で母集団全体を測定することは現実的ではないため、研究者はサンプルを使用して母集団を表します。無作為抽出は、母集団の各個人がサンプルに含まれる可能性が等しくなる方法を使用して選択された母集団の代表的なグループです。ランダム サンプリング方法には、単純なランダム サンプリング、層別サンプリング、クラスター サンプリング、および体系的なサンプリングが含まれます。コンビニエンスサンプリングは、偏ったデータを生成することが多いサンプルを選択する非ランダム法です。
データが収集されると、さまざまな形式で記述および表示できます。たとえば、ある人が特定の地域で家を買うことに興味を持っているとします。住宅価格についての多くの情報を持っていないので、買い手は不動産業者に価格のサンプルデータセットを提供するように頼むかもしれません。サンプルのすべての価格に目を通すのは、少し大変な作業です。より良い方法は、中央値と価格の変動を見ることかもしれません。中央値と変動は、データを説明するために使用できる2つの方法にすぎません。エージェントはまた、住宅価格を理解するためのより便利な方法であるかもしれないデータのグラフを提供するかもしれません。
サンプルデータを数値的およびグラフィカルに記述および表示する方法を詳しく説明する統計の領域は、「記述統計」と呼ばれます。統計グラフは、サンプルまたは母集団の形状または分布について学ぶのに役立つツールです。グラフは、データクラスターを観察し、データ値が少ない場所を特定するのが簡単なため、数字のスタックよりもデータを表示する効果的な方法です。新聞やインターネットでは、グラフを使用して傾向を示し、読者が事実と数字をすばやく比較できるようにしています。データの要約と整理に使用されるグラフには、ドット プロット、棒グラフ、ヒストグラム、幹葉グラフ、周波数ポリゴン (破線グラフの一種)、円グラフ、ボックス プロットなどがあります。
データは定量的データと定性的データに大別されることを思い出してください。
定量的データは、クラス内の生徒の身長の変化など、数値の測定値またはカウントを表します。
逆に、質的データはカテゴリデータとも呼ばれ、髪の毛の色の違いなどの非数値変数を表します。
効率的な統計分析のために、これらの整理されていない大規模なデータセットは、表形式で数値的に、またはグラフィカル形式で視覚的に要約され、表されます。
たとえば、1日の間に測定された温度変化は、表の形式で要約できます。
これらのデータは、グラフィカルに表すこともできます。ここでは、横軸に沿って時間を指定し、縦軸に沿って温度を表示します。
グラフ内のポイントを結合してパターンを形成し、日中の気温が時間とともにどのように変化するかを視覚的に理解できます。
また、このグラフは、その日に観測された極端な気温を示す他のデータ値からの外れ値も識別します。
Related Videos
Summarizing and Visualizing Data
8.9K 閲覧数
Summarizing and Visualizing Data
20.1K 閲覧数
Summarizing and Visualizing Data
7.6K 閲覧数
Summarizing and Visualizing Data
10.7K 閲覧数
Summarizing and Visualizing Data
57.9K 閲覧数
Summarizing and Visualizing Data
6.8K 閲覧数
Summarizing and Visualizing Data
5.6K 閲覧数
Summarizing and Visualizing Data
12.9K 閲覧数
Summarizing and Visualizing Data
5.4K 閲覧数
Summarizing and Visualizing Data
6.8K 閲覧数
Summarizing and Visualizing Data
4.3K 閲覧数
Summarizing and Visualizing Data
16.1K 閲覧数
Summarizing and Visualizing Data
5.1K 閲覧数
Summarizing and Visualizing Data
6.7K 閲覧数
Summarizing and Visualizing Data
13.8K 閲覧数