МОДЕЛЬ АНАЛИЗА СОВПАДЕНИЙ ПРИ РАСЧЕТЕ НЕПАРАМЕТРИЧЕСКИХ РАНГОВЫХ СТАТИСТИК
https://doi.org/10.26896/1028-6861-2017-83-11-66-72
Аннотация
Непараметрическая статистика — одна из точек роста современных математико-статистических методов исследования. В непараметрической статистике важное место занимают ранговые критерии, основанные на использовании рангов элементов выборок (результатов наблюдений), а не самих числовых значений элементов выборок. Ранги — это номера элементов выборок в соответствующих вариационных рядах, построенных путем перестановки результатов наблюдений в порядке неубывания. Распределения ранговых критериев получены в предположении, что функции распределения результатов наблюдений непрерывны. Из этого предположения следует, что вероятность совпадения значений случайных величин, образующих анализируемые выборки, равна нулю. Однако в реальных данных встречаются совпадения. Следовательно, неверно предположение, что функции распределения результатов наблюдений непрерывны, а потому известными теоремами о распределениях ранговых статистик, строго говоря, пользоваться нельзя. Тем не менее при небольшом числе совпадений обычно рекомендуют применять ранговые статистики, иногда вводя те или иные поправки. Таким образом, над классической математико-статистической теорией устанавливают дополнительную надстройку в целях учета совпадения данных. Естественно, возникает вопрос о степени обоснованности тех или иных методов учета совпадения данных расчета. Предлагаем вероятностно-статистическую модель, объясняющую появление совпадений и дающую алгоритмы анализа совпадений. Эта модель основана на предположении о появлении совпадений данных в результате «слипания» мало различающихся результатов наблюдений. Поэтому добавляем малую поправку к каждому элементу совпадающей группы результатов наблюдений и в результате получаем выборку без совпадений, для которой рассчитываем значение ранговой статистики. Рассмотрев различные варианты поправок, получаем «облако» значений ранговой статистики. Анализ этого «облака» позволяет получить статистические выводы. В качестве примера рассмотрен двухвыборочный критерий Вилкоксона.
Об авторе
А. И. ОрловРоссия
Список литературы
1. Орлов А. И. Точки роста статистических методов Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 103. С. 136 – 162.
2. Орлов А. И. Структура непараметрической статистики (обобщающая статья) Заводская лаборатория. Диагностика материалов. 2015. Т. 81. № 7. С. 62 – 72.
3. Орлов А. И. Непараметрические критерии согласия Колмогорова, Смирнова, омега-квадрат и ошибки при их применении Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 97. С. 32 – 45.
4. Орлов А. И. Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона? Заводская лаборатория. Диагностика материалов. 1999. Т. 65. № 1. С. 51 – 55.
5. Орлов А. И. Двухвыборочный критерий Вилкоксона — анализ двух мифов Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 104. С. 91 – 111.
6. Орлов А. И. Состоятельные критерии проверки абсолютной однородности независимых выборок Заводская лаборатория. Диагностика материалов. 2012. Т. 78. № 11. С. 66 – 70.
7. Орлов А. И. Методы проверки однородности связанных выборок Заводская лаборатория. Диагностика материалов. 2004. Т. 70. № 7. С. 57 – 61.
8. Орлов А. И. О проверке однородности связанных выборок Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2016. № 123. С. 708 – 726.
9. Холлендер М., Вулф Д. А. Непараметрические методы статистики. — М.: Финансы и статистика, 1983. — 518 с.
10. Орлов А. И. О методологии статистических методов Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 104. С. 53 – 80.
11. Орлов А. И. Статистика интервальных данных (обобщающая статья) Заводская лаборатория. Диагностика материалов. 2015. Т. 81. № 3. С. 61 – 69.
12. Орлов А. И. Устойчивые математические методы и модели Заводская лаборатория. Диагностика материалов. 2010. Т. 76. № 3. С. 59 – 67.
13. Гаек Я., Шидак З. Теория ранговых критериев. — М.: Наука, 1971. — 376 с.
14. Орлов А. И. Прикладная статистика. — М.: Экзамен, 2006. — 671 с.
Рецензия
Для цитирования:
Орлов А.И. МОДЕЛЬ АНАЛИЗА СОВПАДЕНИЙ ПРИ РАСЧЕТЕ НЕПАРАМЕТРИЧЕСКИХ РАНГОВЫХ СТАТИСТИК. Заводская лаборатория. Диагностика материалов. 2017;83(11):66-72. https://doi.org/10.26896/1028-6861-2017-83-11-66-72
For citation:
Orlov A.I. THE MODEL OF COINCIDENCE ANALYSIS IN THE CALCULATION OF NONPARAMETRIC RANK STATISTICS. Industrial laboratory. Diagnostics of materials. 2017;83(11):66-72. (In Russ.) https://doi.org/10.26896/1028-6861-2017-83-11-66-72