Распределение расстояния Колмогорова

Теоретические сведения

Теорема (Масси, 1950). Пусть (X1...Xn) - выборка с равномерной на отрезке [0,1] функцией распределения и
Dn=
sup
x О [0,1] 
|Fn(x)-x|,
где Fn(x) - выборочная функция распределения. Тогда
P(Dn < k/n)=U(k,n)n!/nn,   k=1,...,n-1,
где U(j,m+1), j=1,...,2k-1; m=0,1,...,n-1, удовлетворяют системе рекуррентных соотношений:
U(j,m+1)= j+1
е
i=1 
U(i,m)/(j+1-i)!
с граничными условиями:
U(i,m)=0,        i і 2k,
U(i,0)=0,      i=1,...,k-1
U(k,0)=1,
U(i,0)=0,      i=k+1,...,2k-1.


Доказательство.
Разделим интервал (0,1) на n равных интервалов Ik=((k-1)/n,k/n), k=1,...,n. Пусть случайная величина (x1,...,xn) указывает, сколько элементов выборки (X1,...,Xn) попали соответственно в I1,...,In. Величина (x1,...,xn) имеет, очевидно, n-1-мерное полиномиальное распределение, при этом:
p(r1,...,rn)=n!/(r1!...rn!nn)
и однозначно определяет Fn(x). Поэтому P(Dn < k/n) находится суммированием p(r1,...,rn) по всем точкам выборочного пространства (r1,...,rn), для которых supx О [0,1]|Fn(x)-x| < k/n. Если двигаться слева направо по графику Fn(x), лежащему полностью внутри полосы E, для которой |Fn(x)-x| < k/n при x=1/n,2/n,...,(m+1)/n, то график должен проходить через одну из точек (m/n,(m-k+i)/n, i=1,...,2k-1. Назовем эти точки A(i,m), i=1,..., 2k-1. Пусть
U(i,m)=
е
(i) 
1/(r1!...rm!),
где е(i) означает суммирование по всему множеству значений (r1,...,rn), для которых график Fn(x) приходит в A(i,m), оставаясь внутри полосы E. Тогда, так как Fn(x) не убывает, график может достичь A(j+1,m), только пройдя через одну из точек A(1,m),...,A(j+1,m), причем rm+1 примет соответственно значения j, j-1, ...,1, 0. Следовательно, мы должны иметь
U(j,m+1)= j+1
е
i=1 
U(i,m)/(j+1-i)!
для j=1,2,...,2k-1 и m=0,1,...,n-1, причем, конечно, U(i,m)=0 при i і 2k. Более того, очевидно, что U(i,m) удовлетворяет следующим граничным условиям:
U(i,0)=0,      i=1,...,k-1
U(k,0)=1,
U(i,0)=0,      i=k+1,...,2k-1
.


Рекурсивный алгоритм представленный предыдущей теоремой реализован в следующей электронной таблице. Для сравнения мы приводим значения
K(n1/2k/n), где K(x) - функция распределения Колмогорова (известно, что P(Dn <x)» K(n1/2x)). Обратим внимание, что гораздо быстрее, нежели n1/2Dn, сходится к предельному распределению Колмогорова модифицированная статистика (n1/2+0.12+0.11/n1/2)Dn, поэтому мы приводим, опять же для сравнения, значения K((n1/2+0.12+0.11/n1/2)k/n).

Вычисления

Помощь (как выполнить вычисления?)

Введите параметры
распределения расстояния Колмогорова
k n



Результат вычислений
P(Dn < k/n ) K(n1/2k/n) K((n1/2+0.12+0.11/n1/2)k/n)



Помощь (как выполнить вычисления)

В поля ввода "k" и "n" вводятся целые числа, после чего необходимо нажать на кнопку "Вычислить". Обратим внимание, что уже при n=10 возникают существенные задержки в работе программы.