Dane to pojedyncze informacje uzyskane z populacji lub próby. Dane można sklasyfikować jako jakościowe (jakościowe), ilościowe ciągłe lub ilościowe dyskretne. Ponieważ nie jest praktyczne mierzenie całej populacji w badaniu, naukowcy używają próbek do reprezentowania populacji. Próba losowa to reprezentatywna grupa z populacji wybranej przy użyciu metody, która daje każdej osobie w populacji równe szanse na włączenie do próby. Metody losowego pobierania próbek obejmują proste pobieranie próbek losowych, pobieranie próbek warstwowych, pobieranie próbek klastrowych i pobieranie próbek systematycznych. Wygodne próbkowanie to nielosowa metoda wyboru próby, która często daje tendencyjne dane.
Po zebraniu danych można je opisać i przedstawić w wielu różnych formatach. Załóżmy na przykład, że dana osoba jest zainteresowana kupnem domu w określonej okolicy. Nie mając zbyt wielu informacji na temat cen domów, kupujący może poprosić agenta nieruchomości o podanie przykładowego zestawu danych o cenach. Czytanie wszystkich cen w próbce może być nieco przytłaczające. Lepszym sposobem może być przyjrzenie się medianie ceny i wahaniom cen. Mediana i zmienność to tylko dwa sposoby, których można użyć do opisania danych. Agent może również dostarczyć wykres danych, który może być wygodniejszym sposobem na zrozumienie cen domów.
Obszar statystyki, który szczegółowo opisuje numeryczne i graficzne sposoby opisywania i wyświetlania przykładowych danych, nazywa się “statystykami opisowymi”. Wykres statystyczny to narzędzie, które pomaga poznać kształt lub rozkład próbki lub populacji. Wykres może być bardziej efektywnym sposobem prezentowania danych niż stos liczb, ponieważ łatwo jest obserwować klastry danych i identyfikować pozycje, w których jest tylko kilka wartości danych. Gazety i Internet używają wykresów, aby pokazać trendy i umożliwić czytelnikom szybkie porównywanie faktów i liczb. Niektóre typy wykresów, które są używane do podsumowywania i organizowania danych, to wykres punktowy, wykres słupkowy, histogram, wykres łodygi i liścia, wielokąt częstości (typ wykresu linii przerywanej), wykres kołowy i wykres pudełkowy.
Przypomnijmy, że dane są ogólnie podzielone na dane ilościowe i dane jakościowe.
Dane ilościowe reprezentują pomiary lub zliczenia wartości liczbowych, takich jak różny wzrost uczniów w klasie.
I odwrotnie, dane jakościowe, znane również jako dane jakościowe, reprezentują zmienne nienumeryczne, takie jak różne kolory włosów.
W celu wydajnej analizy statystycznej te niezorganizowane, duże zbiory danych są podsumowywane i przedstawiane numerycznie w formie tabelarycznej lub wizualnej w formie graficznej.
Na przykład zmiany temperatury mierzone w ciągu dnia można podsumować w formie tabeli.
Dane te można również przedstawić graficznie. Tutaj czas jest podawany wzdłuż osi poziomej, a temperatura jest wyświetlana wzdłuż osi pionowej.
Punkty na wykresie są połączone, tworząc wzór, który zapewnia wizualne zrozumienie, jak temperatura w ciągu dnia zmienia się w czasie.
Wykres identyfikuje również wartości odstające od innych wartości danych, które wskazują na ekstremalne temperatury obserwowane w ciągu dnia.
Related Videos
Summarizing and Visualizing Data
8.9K Wyświetlenia
Summarizing and Visualizing Data
20.3K Wyświetlenia
Summarizing and Visualizing Data
7.6K Wyświetlenia
Summarizing and Visualizing Data
10.8K Wyświetlenia
Summarizing and Visualizing Data
57.9K Wyświetlenia
Summarizing and Visualizing Data
6.8K Wyświetlenia
Summarizing and Visualizing Data
5.6K Wyświetlenia
Summarizing and Visualizing Data
12.9K Wyświetlenia
Summarizing and Visualizing Data
5.4K Wyświetlenia
Summarizing and Visualizing Data
6.8K Wyświetlenia
Summarizing and Visualizing Data
4.3K Wyświetlenia
Summarizing and Visualizing Data
16.2K Wyświetlenia
Summarizing and Visualizing Data
5.1K Wyświetlenia
Summarizing and Visualizing Data
6.7K Wyświetlenia
Summarizing and Visualizing Data
13.9K Wyświetlenia