Descriptive Statistics / Описательная статистика

Собрание наиболее популярных методов описательной статистики (табличных и графических частотных распределений, мер центральной тенденции, мер разброса) в привязке к типам шкал исследуемых признаков и сравнению двух выборок этими методами. Здесь же интервальное оценивание доли и среднего арифметического значения.

Требуемый уровень подготовки пользователя: начальный.

Желательно владение методами: слияния файлов.

 
Краткое описание метода
Descriptive Statistics / Описательная статистика
Видео-рекомендации, каждая не более 3 мин.

Видео 1. Рассматривается участие в публичных демонстрациях (за два временных периода) - дихотомическая переменная, к которой применимы мода как мера центральной тенденции, а также среднее арифметическое, стандартное отклонение и дисперсия (все при условии особой интерпретации).

Видео 2. Интерпретация среднего арифметического для дихотомической переменной такова: если (как на видео) оно равно 1,96, а переменная имеет категории 1 и 2, то 96% респондентов имеют по этой переменной значение 2. Доли участвовавших в публичных демонстрациях в двух временных промежутках отличаются, но чтобы понять, значимы ли эти различия статистически, необходимо построить доверительные интервалы для долей и посмотреть на их пересечение. Если интервалы пересекаются - различий нет, и наоборот.

Видео 3. Доверительный интервал для доли рассчитывается следующим образом: к выборочной доле прибавляется и от неё же отнимается значение стандартной ошибки, умноженной на значение z для выбранного уровня доверительной вероятности (для уровня 95% это 1,96). Таким образом определяются верхняя и нижняя границы интервала соответственно. Чтобы не считать интервалы вручную, можно воспользоваться специальным онлайн-калькулятором. В рассматриваемом кейсе интервалы пересекаются, следовательно, различий между долями нет (то есть нет увеличения числа участвующих в демонстрациях).

Видео 4. Если рассматриваемую дихотомическую шкалу анализировать строго как номинальную, то к ней были бы применимы мода (мера центральной тенденции) и энтропийный коэффициент вариации (мера разброса).

Видео 5. Расчёт энтропийного коэффициента вариации: вначале рассчитывается сумма произведений имеющихся долей на натуральные логарифмы этих долей (это наблюдаемое значение энтропии), затем сумма произведений равномерно распределенных долей (единица, делённая на число категорий) на натуральные логарифмы этих долей (это максимальное значение энтропии), отношение первой суммы ко второй и есть энтропийный коэффициент вариации (ЭКВ). Чем ближе значение коэффициента к единице - тем выборка разнороднее (выше разброс). Аналог энтропийного коэффициента вариации - коэффициент качественной вариации.

Видео 6. Следующая анализируемая переменная - интерес к политике, ранговая (порядковая). К таким переменным применимы мода, медиана и квартили (с последующим расчётом квартильного размаха). Квартильный размах - это разница между значениями третьего (верхнего, 75%) и первого (нижнего, 25%) квартилей ; она показывает, в какое число категорий "укладываются" центральные 50% наблюдений . В рассматриваемом кейсе распределения на обеих подвыборках можно считать бимодальными.

Видео 7. Последняя анализируемая переменная - возраст, интервальная. К переменным такого типа применимы все меры центральной тенденции и все меры разброса, в том числе нормированные. Наиболее чувствительной и точной мерой центральной тенденции можно назвать среднее арифметическое - показывает значение, равноудалённое от всех остальных значений. Возможно также построить доверительный интервал к среднему для поиска значимых различий (например, с помощью команды Explore или онлайн-калькулятора). Вводится важный термин: гомоскедастичность (статистическое равенство вариаций условных распределений).

Видео 8. Резюме: тип шкалы определяет применимые меры описательной статистики. Для номинальных шкал - мода, энтропийный коэффициент вариации или коэффициент качественной вариации, для дихотомических - все меры, кроме медианы и квартильного размаха...

Видео 9. ... для порядковых шкал - мода и энтропийный коэффициент вариации, медиана и квартильный размах, для интервальной - все меры центральной тенденции и разброса (как абсолютные, так и нормированные, например, коэффициент качественной вариации). Для описания интервальных шкал удобно использовать команду Explore, в которой есть возможность также графически представить распределения и проверить их на соответствие нормальному (с помощью тестов Колмогорова-Смирнова и Шапиро-Уилка, где проверяется нулевая гипотеза о том, что распределение соответствует нормальному). Визуализировать распределения графически с помощью различных диаграмм можно также в меню Frequencies.

Комментарии можете оставлять прямо в Youtube

© А. Ротмистров

  • Вконтакте App Icon
  • Иконка Facebook с прозрачным фоном
  • YouTube Классик