Probit Regression / Пробит-регрессия

Метод для поиска зависимости категориальной переменной от интревальных и метрических предикторов, а также одного категориального.

Метод, похожий на логистическую регрессию, но основанный не на моделировании логарифма отношения вероятностей интересующих категорий зависимой переменной, а на моделировании аргумента функции нормального распределtния, через которую и рассчитывается вероятность интересующей категории зависимой переменной. 

Требуемый уровень подготовки пользователя: высокий.

 
Краткое описание метода
 
Probit Regression / Пробит-регрессия
Видео-рекомендации, каждая не более 3 мин.

Видео 1. Рассмотрение результатов дискриминантного анализа, расчет скоринга.

Видео 2. Роль категориальных переменных в линейном многочлене (на примере страны): если в линейной комбинации итоговой модели остался набор дихотомических переменных о стране проживания респондента, это говорит о том, что форма зависимости между зависимой переменной и оставшимися независимыми переменными в этих странах одинакова, различается только сдвиг линии зависимости по оси Y.

Видео 3. Сдвиг линии графика или изменение наклона графика? Если речь идет о втором, линейный многочлен должен задаваться иначе - через перемножение предикторов. Определить, различается ли наклон, можно при помощи пробит-регрессии.

Видео 4. Для работы с пробит-регрессией необходимо перейти от базы с респондентами к базе с профилями и весами профилей (числом респондентов, соответствующих профилям). Подготовка массива: отбор переменных, создание новой, работа с пропусками.

Видео 5. Подготовка массива: работа с пропусками, запуск Custom table (для работы с этой командой необходимо изменить тип шкалы всех используемых переменных на категориальный - ранговый или номинальный).

Видео 6. Подготовка профилей: работа с Custom Tables, перенос данных в Excel, удаление дубликатов, повторный запуск Custom table.

Видео 7. Перенос профилей в SPSS.

Видео 8. Запуск Probit regression и Parallelism test (проверяет статистическую гипотезу о равенстве наклона линий для разных категорий "факторной" переменной, в настоящем случае - страны). Если гипотеза в Parallelism test отвергается, то наклон линии все же зависит от этой переменной.

Видео 9. Интерпретация Parallelism test и Pearson Goodness-of-Fit Test, показывающего качество подгонки предсказанных значений относительно эмпирических (если гипотеза в этом тесте отвергается, то это это говорит о низком качестве модели, т.е. о значимом несоответствии наблюдаемых и предсказанных значений). Если гипотеза в Parallelism test принимается, то можно интерпретировать и результаты пробит-регрессии (Parameter Estimates).

Видео 10. Summary: в рассматриваемом кейсе форма зависимости между участием в профсоюзных или аналогичных организациях и другими предикторами всё же различается от страны к стране, что противоречит результатам дискриминантного анализа. Возможная стратегия дальнейшей работы над кейсом - применение логлинейного анализа.

Комментарии можете оставлять прямо в Youtube

© А. Ротмистров

  • Вконтакте App Icon
  • Иконка Facebook с прозрачным фоном
  • YouTube Классик