Preview

Заводская лаборатория. Диагностика материалов

Расширенный поиск

ОШИБКИ ПРИ ИСПОЛЬЗОВАНИИ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ И ДЕТЕРМИНАЦИИ

https://doi.org/10.26896/1028-6861-2018-84-3-68-72

Полный текст:

Аннотация

Коэффициенты корреляции и детерминации широко используют при статистическом анализе данных. При этом достаточно часто допускают те или иные ошибки. Некоторые из них рассмотрены в данной статье. Ограничимся случаем двух переменных. Наиболее часто используют линейный парный коэффициент корреляции Пирсона и непараметрические ранговые коэффициенты Спирмена и Кендалла. Согласно теории измерений коэффициент корреляции Пирсона можно применять к переменным, измеренным в шкале интервалов (и в шкалах с более узкой группой допустимых преобразований, например, в шкале отношений). Его нельзя применять при анализе порядковых данных. Непараметрические ранговые коэффициенты Спирмена и Кендалла предназначены для оценки связи порядковых переменных. Их можно использовать и в шкалах с более узкой группой допустимых преобразований, например, в шкалах интервалов или отношений. Критическое значение при проверке значимости отличия коэффициента корреляции от нуля зависит от объема выборки и приближается к нулю при его росте. Поэтому использование «шкалы Чеддока» некорректно. При применении пассивного эксперимента коэффициенты корреляции можно обоснованно использовать лишь для прогнозирования, но не для управления. Для получения предназначенных для управления вероятностно-статистических моделей необходим активный эксперимент. Как показал С. Н. Бернштейн, влияние выбросов на коэффициент корреляции Пирсона весьма велико. Эффект «вздувания» коэффициента корреляции состоит в том, что при увеличении числа проанализированных наборов предикторов заметно растет максимальный из соответствующих коэффициентов корреляции — показателей качества приближения. Распространенная ошибка состоит в использовании коэффициента детерминации для оценки качества восстановления зависимости методом наименьших квадратов.

Об авторе

А. И. Орлов
Институт высоких статистических технологий и эконометрики Московского государственного технического университета им. Н. Э. Баумана.
Россия
Москва.


Список литературы

1. Орлов А. И. Прикладная статистика. — М.: Экзамен, 2006. — 671 с.

2. Орлов А. И. Устойчивость в социально-экономических моделях. — М.: Наука, 1979. — 296 с.

3. Налимов В. В. Теория эксперимента. — М.: Наука, 1971. — 208 с.

4. Ермаков С. М., Бродский В. З., Жиглявский А. А. и др. Математическая теория планирования эксперимента. — М.: Физматлит, 1983. — 392 с.

5. Бернштейн С. Н. Об одном элементарном свойстве коэффициента корреляции / Зап. Харьк. матем. тов. 1932. № 5. С. 65 – 66; Бернштейн С. Н. Собрание сочинений. Т. IV. Теория вероятностей. Математическая статистика. — М.: Наука, 1964. С. 233 – 234.

6. Колмогоров А. Н. К вопросу о пригодности найденных статистическим путем формул прогноза / Журн. геофиз. 1933. Т. 3. С. 78 – 82; Колмогоров А. Н. Теория вероятностей и математическая статистика. — М.: Наука, 1986. С. 161 – 167.

7. Орлов А. И. Методы поиска наиболее информативных множеств признаков в регрессионном анализе / Заводская лаборатория. Диагностика материалов. 1995. Т. 61. № 1. С. 56 – 58.

8. Орлов А. И. Проблема множественных проверок статистических гипотез / Заводская лаборатория. Диагностика материалов. 1996. Т. 62. № 5. С. 51 – 54.

9. Сердобольский В. И., Орлов А. И. Статистический анализ при большом числе параметров / Программно-алгоритмическое обеспечение прикладного многомерного статистического анализа. Тезисы докладов III Всесоюзной школы-семинара. — М.: ЦЭМИ АН СССР, 1987. С. 151 – 160.

10. Орлов А. И. Организационно-экономическое моделирование: учебник. В 3-х ч. Ч. 1. Нечисловая статистика. — М.: Изд-во МГТУ им. Н. Э. Баумана, 2009. — 542 с.

11. Орлов А. И. Статистический контроль по двум альтернативным признакам и метод проверки их независимости по совокупности малых выборок / Заводская лаборатория. Диагностика материалов. 2000. Т. 66. № 1. С. 58 – 62.

12. Лойко В. И., Луценко Е. В., Орлов А. И. Современные подходы в наукометрии: монография. — Краснодар: КубГАУ, 2017. — 532 с. https://elibrary.ru/item.asp?id=29306423.

13. Орлов А. И. Статистические пакеты — инструменты исследователя / Заводская лаборатория. Диагностика материалов. 2008. Т. 74. № 5. С. 76 – 78.


Рецензия

Для цитирования:


Орлов А.И. ОШИБКИ ПРИ ИСПОЛЬЗОВАНИИ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ И ДЕТЕРМИНАЦИИ. Заводская лаборатория. Диагностика материалов. 2018;84(3):68-72. https://doi.org/10.26896/1028-6861-2018-84-3-68-72

For citation:


Orlov A.I. ERRORS IN THE USE OF CORRELATION AND DETERMINATION COEFFICIENTS. Industrial laboratory. Diagnostics of materials. 2018;84(3):68-72. (In Russ.) https://doi.org/10.26896/1028-6861-2018-84-3-68-72

Просмотров: 3332


ISSN 1028-6861 (Print)
ISSN 2588-0187 (Online)