Критерий Колмогорова

Теоретические сведения

Критерий Колмогорова применяется в случае, когда функция распределения F(t)  непрерывна, то есть для статистической модели  X1 ~ FF О FC,  где  FC - множество всех непрерывных функций распределения. Рассмотрим следующее расстояние между эмпирической и теоретической функциями распределения, называемое расстоянием Колмогорова:
Dn=D(Fn*,F)=
sup
-Ґ < t < Ґ 
|Fn*(t)-F(t)| =
max
-Ґ < t < Ґ 
|Fn*(t)-F(t)|.
Распределение статистики  Dn=Dn(X1,X2,...,Xn обладает тем замечательным свойством, что при выполнении гипотезы  H0 : F=F0 это распределение не зависит от конкретного вида  F0 и совпадает с распределением, соответствующим, например, модели X1 ~ U(0, 1). Указанное свойство называется непараметричностью критерия. Обозначим через Fn(t) функцию распределения статистики Dn при выполнении гипотезы H0: F=F0. В качестве статистики критерия Колмогорова выбирается расстояние Колмогорова умноженное на n1/2, где n - объем выборки:
Tn=n1/2
sup
-Ґ < t < Ґ 
|Fn*(t)-F(t)|.

А. Н. Колмогоров доказал следующие два свойства статистики Tn:
1) Если гипотеза H0 верна, то Tn с ростом n сходится к случайной величине J с функцией распределения, называемой функцией распределения Колмогорова:
FJ(t)=1-2 Ґ
е
k=1 
(-1)k+1exp(-2k2 t2);
2) Если гипотеза H0 неверна, то Tn сходится почти наверное к Ґ при n®Ґ.
Таким образом, "асимптотический" достигаемый уровень значимости критерия Колмогорова равен:
a*=1-FJ(Tn)=2 Ґ
е
k=1 
(-1)k+1exp(-2k2 Tn2).
В то время как "истинный" достигаемый уровень значимости равен: a**=1-Fn(Dn).



Вычисления

Помощь (как выполнить вычисления?)

Введите исследуемую выборку


Выберите распределение
U[a,b] N(a,s) E(a)
a b a s a



Результаты вычислений
Объем выборки Значение Dn на выборке Значение Tn на выборке Асимптотический
достигаемый уровень значимости
Истинный
достигаемый уровень значимости



Помощь (как выполнить вычисления)

Для того чтобы произвести вычисление, необходимо поместить в текстовое поле изучаемую выборку (это можно сделать, набрав соответствующие значения вручную либо скопировав, скажем, из Excel). Затем c помощью радиокнопки выделить, какую основную гипотезу следует проверять. Предлагается проверка гипотезы о том, что выборка имеет равномерное (U[a,b]), нормальное (N(a,s)) либо экспоненциальное распределение (E(a)). Далее следует задать параметры распределения. Затем нажать кнопку "Вычислить", после чего в таблице "Результаты вычислений" появятся соответствующие значения.

Отметим, что в качестве десятичного разделителя в числах можно использовать и точку, и запятую. Удалять значения из первой таблицы можно двойным щелчком мыши. Особо обратим внимание! В качестве разделителя между отдельными числами ни в коем случае не следует использовать точку и запятую, так как эти знаки используются в качестве десятичного разделителя. Отделить одно число от другого можно, используя "пробел" или "ввод".
Например, такой ввод в текстовое поле корректен:
0,23   0,56   0.98
0,98   1,56   9,9   7.908
Соответственно будут обрабатываться семь значений: 0.23   0.56   0.98   0.98   1.56   9.9   7.908.