top of page
Compare Means / Сравнение средних

Собрание популярных методов оценки наиболее репрезентирующих признак значений (средних арифметических и медиан), а также сравнения этих значений.

Поиск парных связей через сравнение двух и более групп (подвыборок) по таким зачниям. Группирующим признаком выступает категориальный признак (номинальный или ранговый), а зависимым - интервальный или метрический.

Непараметрические аналоги предназначены для решения тех же задач для ранговых признаков.

Требуемый уровень подготовки пользователя: начальный.

Желательно владение методами: описательной статистики.

Brief description of the method
Brief description of the method
t-tests
T-tests
Each video's shorter than 3 min.

Video 1 (Rus. + Eng. subtitles). The problem statement: the assumption that Russians work for 40 hours a week is examed (the statistical hypothesis regarding the equality of the mathematical expectation to a constant; a mathematical expectation is a population's analogue to a sample's mean). Since a one sample's mean compared to a constant is considered, a one-sample T-test is applied (a synonym for Student's one-sample test). An inference regarding the statistical hypothesis is made by the significance value (sig.): if the value is less than the conventional level of significance (usually 0.05), then, the hypothesis is rejected. The next task is to compare a workweek duration between Russia and Germany (the statistical hypothesis is that the mathematical expectations of this characteristic for the two countries are equal). The two variables' ('country' and 'weekwork duration') roles are different because the former is grouping and the last is been analyzed. The grouping variable ('country') divides the sample into to subsamples -- Russia and Germany, wich are independent one to another. That is why a T-test for independent samples is applied.

Video 2 (Rus. + Eng. subtitles). Continuation. I select Russia and Germany by "Select cases" option. In the test for independent samples, a preliminary statistical hypothesis about the equality of population variances is examed. An inference about the hypothesis is made by the significance value (sig.). If the variances are assumed equal the upper row of 'Independent Samples Test' table is relevant; if they are NOT assumed equal the lower one is relevant. By a significance value (sig.) in the relevant row the main statistical hypothesis, whether the mathematical expectations of weekwork duration for Russia and Germany are equal, is examed. The next task is to determine whether a respondent's workweek duration coincides with his partner's one. Since the variables 'respondent's workweek duration' and 'partner's workweek duration' play equivalent roles and the samples of respondents and their partners are interrelated, a T-test for paired samples is applied.

Video 3 (Rus. + Eng. subtitles).

The statistical hypothesis on the equality of mathematical expectations is examed. An inference regarding the statistical hypothesis is made by the significance value (sig.). Summary.

 

Comments can be left on Youtube directly

nonparametric tests
Nonparametric Tests
Видео-рекомендации, каждая не более 3 мин.

Видео 1.

Непараметрические тесты по своим функциям - это аналоги параметрических тестов (t-тестов, ANOVA), которые применимы к ранговым шкалам. Строго говоря, непараметрическими называются методы, которые никак не зависят от параметров распределения. Проводится сравнение параметрических и непараметрических одновыборочных тестов, а также оценивается устойчивость первых (результаты применения к ранговым шкалам не устойчивы).

Видео 2.

Одновыборочный тест знаков Вилкоксона - аналог одновыборочного t-теста, проверяет статистическую гипотезу о равенстве медианы какой-то константе.

Видео 3.

Одновыборочный тест знаков Вилкоксона склонен к отвержению нулевой гипотезы. Причина этого - даже незначительное отклонение распределения от симметричности при большой выборке.

Видео 4.

Непараметрические аналоги t-теста для независимых выборок: тесты Mann-Whitney U, Kruskal-Wallis, Median. Параметрический тест для независимых выборок также не устойчив при использовании его на ранговых переменных.

Видео 5.

Mann-Whitney U предназначен для сравнения двух выборок, а Kruskal-Wallis и Median - для множества выборок. Mann-Whitney U и Kruskal-Wallis сравнивают распределения рангов в выборках, Median - медианы в выборках.

Видео 6.

С точки зрения устойчивости непараметрические тесты для независимых выборок показывают лучшие результаты, чем параметрический
t-тест. Аналоги параметрического t-теста для парных выборок - тест знаков и тест Вилкоксона.

Видео 7.

Оба метода основаны на расчёте положительных и отрицательных разниц, для определения значения статистики используются меньшие. Если значение стандартизованной статистики положительное, то это означает, что выше ранги у второй сравниваемой переменной (она указана второй в таблице с гипотезами, но первой на графике разниц), и наоборот.

Видео 8.

Тест знаков устойчив к использованию его на ранговых переменных. Резюме: все рассмотренные непараметрические тесты, кроме одновыборочного теста Вилкоксона, показывают устойчивые результаты при применении их на ранговых переменных (в отличие от параметрических).

Комментарии можете оставлять прямо в Youtube

anova
AnOVa / Дисперсионный анализ
Видео-рекомендации, каждая не более 3 мин.

Видео 1.

Если необходимо сравнить средние между множеством групп (более двух), то следует применять дисперсионный анализ (ДА, AnOVa). В видео реализуется графическое представление изучаемых объектов.

Видео 2.

Подготовка ДА: анализ выбросов.

Видео 3.

Дисперсионный анализ применяется только в случае равенства дисперсий, поэтому дополнительно к тесту в опциях необходимо запросить тест на гомогенность дисперсий (а также тесты Brown-Forsythe и Welch - для случая неравенства дисперсий). В случае неравенства дисперсий (то есть в ситуации гетероскедастичности) результаты проверки исходной гипотезы о равенстве всех средних следует искать не в таблице ANOVA, а в таблице с результатами робастных тестов (Brown-Forsythe и Welch). Обычно их результаты согласованы. Вывод о проверке гипотезы ставится на основании значения sig.: если оно меньше принятого уровня значимости (обычно 0,05), то гипотезу следует отвергнуть. В случае, когда гипотеза отвергается и наблюдаются различия в средних, определить группы, между которыми есть различия, можно с помощью специальных Post Hoc тестов (разных для случая равенства и неравенства дисперсий).

Видео 4.

Дисперсионный анализ разделяет всю вариацию на внутригрупповую и межгрупповую: чем больше межгрупповая и меньше внутригрупповая вариация, тем больше разница в средних.

Видео 5.

В случае, когда необходимо обнаружить различия между множеством групп по ранговому, а не интервальному признаку, следует применять непараметрический дисперсионный анализ Kruskall-Wallis.

Видео 6.

Резюме: если необходимо найти различия между множеством групп по интервальному признаку, то используется параметрический дисперсионный анализ (в случае равенства дисперсий итоги проверки находятся в таблице ANOVA, в случае неравенства - в таблице робастных тестов); если необходимо найти различия по ранговому признаку, то применяется непараметрический дисперсионный анализ Kruskall-Wallis, который оценивает не равенство средних как таковых, а равенство средних рангов.

Комментарии можете оставлять прямо в Youtube

Post hoc tests
Post hoc tests
Matrix of methods

If AnOVa reveals differences between groups, it is necessary to understand which groups differ from each other. This task is performed by post hoc tests.

 

Since all post hoc tests are procedures for multiple comparisons, they are required to control the overall Type I error rate. (Regarding AnOVa applying, the overall Type I error rate deals with the found out difference among mathematical expectations, meanwhile these mathematical expectations are equal one to another in the population). If the test contains too strict correction for multiple comparisons, it is called conservative and has low statistical power (the probability to reject the null hypothesis). If the test doesn’t contain a strict correction, it is called liberal and has a high statistical power, but the overall Type I error rate in such a test is also high.


The choice of post hoc test depends on three factors: (un)equality of samples of the compared groups, (un)equality of population variances within these groups and the level of statistical power (or on the opposite side – the overall Type I error rate). The table on the right (it is clickable) contains the following symbols:

L – liberal test,

C – conservative test,

B – both liberal and conservative test ("balance").

Post hoc tests anova
bottom of page