1.2:
Как классифицируются данные: категориальные данные
Переменная, обычно обозначаемая заглавными буквами, такими как X и Y, является характеристикой или измерением, которое может быть определено для каждого члена генеральной совокупности. Данные — это фактические значения переменных. Это могут быть цифры, а могут быть слова. Датум является одним значением.
Данные классифицируются в зависимости от того, поддаются ли они измерению или нет. Категориальные данные не могут быть измерены, вместо этого их можно разделить на категории. Например, если Y обозначает партийную принадлежность человека, некоторые примеры Y включают Республиканец, Демократ и Независимый. Y — категориальные данные. Категоризация популяции по цвету волос, возрасту, полу, группе крови являются примерами категориальных данных.
В некоторых случаях категориальные данные могут быть упорядочены определенным образом, и они подпадают под порядковую категорию. Рассмотрим список из пяти лучших национальных парков США. Пять лучших национальных парков можно ранжировать от одного до пяти, но различия между данными не поддаются измерению. Другим примером является опрос о круизе, в котором ответы на вопросы о круизе следующие: «отлично», «хорошо», «удовлетворительно» и «неудовлетворительно». Эти ответы упорядочены от наиболее желаемого ответа к наименее желательному. Однако различия между этими двумя фрагментами данных не поддаются измерению.
Этот текст адаптирован из стиля Openstax, Вводная статистика, раздел 1.1 Определения статистики, вероятности и ключевых терминов
Данные, научный термин, используемый для сбора данных наблюдений и измерений, составляют основу для всех статистических анализов и выводов.
Данные можно классифицировать в зависимости от того, можно ли их измерить или нет. Например, рассмотрим разные цвета волос. Нельзя измерить цвет волос в литрах или километрах, но вместо этого можно сгруппировать их по категориям, таким как черные, брюнетки или рыжие.
Такие наборы данных называются категориальными данными или качественными данными; они не могут быть измерены или подсчитаны, но могут быть помечены или отнесены к различным категориям.
Другим примером является человеческая кровь, которая подразделяется на четыре различных типа: A, B, O или AB.
В некоторых случаях категориальные данные могут быть упорядочены определенным образом, такие данные называются порядковыми категориями. Например, размер кофейных чашек (маленькие, средние, большие) или высота деревьев в лесу (низкие, средние, высокие) могут быть расположены в порядке возрастания размера.
Related Videos
Understanding Statistics
45.9K Просмотры
Understanding Statistics
32.1K Просмотры
Understanding Statistics
28.0K Просмотры
Understanding Statistics
28.1K Просмотры
Understanding Statistics
23.2K Просмотры
Understanding Statistics
14.5K Просмотры
Understanding Statistics
17.5K Просмотры
Understanding Statistics
11.9K Просмотры
Understanding Statistics
24.0K Просмотры
Understanding Statistics
6.4K Просмотры
Understanding Statistics
11.0K Просмотры
Understanding Statistics
10.2K Просмотры
Understanding Statistics
8.8K Просмотры
Understanding Statistics
11.9K Просмотры
Understanding Statistics
11.8K Просмотры