Оценки Розенблата-Парзена

Теоретические сведения

Пусть (X1...Xn) - выборка с распределением P. Пусть Q - какое-нибудь распределение, имеющее плотность. Положим
Pn**(B)= n
е
i=1 
Q((B-Xi)/hn)/n,
где hn® 0 при n®Ґ. Если распределение P - абсолютно непрерывно относительно меры Лебега, то распределение Pn** будет удовлетворять теоремам типа теоремы Гливенко-Кантелли, то есть можно показать, что

sup
x 
|Fn**(x)-F(x)|® 0, п.н.
Преимущество распределения Pn** перед обычным выборочным распределением Pn*(B)=еi=1nIXi(B)/n состоит в том, что это распределение имеет плотность
fn*(x)= n
е
i=1 
q((x-Xi)/hn)/(nhn),
(q - плотность распределения Q), которая при каждом x сближается с плотностью f(x) распределения P. Функцию fn*(x) называют ядерной оценкой или оценкой Розенблата-Парзена плотности f(x).
В дальнейшем мы будем предполагать, что выполняется условие:
d2=тq2(t)dt < Ґ.
Теорема. Пусть f(x) - непрерывна и ограничена, hn® 0 при n®Ґ, так что nhn®Ґ, то
fn*(x)=fn(x)+zn(x)/(nhn)1/2,
где fn(x) - неслучайная функция, такая что fn(x)®f(x) при hn® 0. Случайные величины zn(x) - асимптотически нормальные, т.е. zn(x) слабо сходятся к случайной величине, имеющей нормальное распределение с нулевым средним и дисперсией равной f(x)d2.
В нижеследующих электронных таблицах мы рассмотрим построение fn*(x) в случае, если q(x) имеет три разных представления,
первое представление мы условно назовем гладким:
q(x)=((1+cos(x))/(2p))I{|x| Ј p},
второе представление - прямоугольным:
q(x)=I{|x| Ј 1/2},
третье представление - треугольным:
q(x)=(1-|x|)I{|x| Ј 1}.

Последовательность hn также можно выбрать, мы предлагаем следующие три варианта:
hn=1/(1+ln(n)),

hn=n-1/3
и
hn=n-1/2.




Вычисления

Внимание! Для работы электронных таблиц необходим java-компилятор, который бесплатно скачивается здесь. Обратим внимание, что скачивается Java SE Development Kit (JDK) JDK 6 Update 14, причем Update может быть более ранним (то есть меньшим 14-ти) или более поздним.

Помощь (как выполнить вычисления?)

Введите исследуемую выборку
   
Выберите подход к определению последовательности hn
hn=1/(1+ln(n)),
hn=n-1/3,
hn=n-1/2.



Внимание! Ваш браузер не поддерживает Java!


Помощь (как выполнить вычисления)

Для того чтобы произвести вычисление, необходимо поместить в текстовое поле изучаемую выборку (это можно сделать, набрав соответствующие значения вручную либо скопировав, скажем, из Excel).

Далее необходимо выбрать один из трех подходов к определению последовательности hn.

Затем необходимо выбрать вид плотности распределения ("гладкая", "прямоугольная" или "треугольная") с помощью соответствующего флажка (по умолчанию установлен флажок "гладкая плотность").

Далее остается нажать кнопку "Построить график". Изменить горизонтальный или вертикальный масштаб построенного рисунка можно соответсвенно с помощью горизонтальной или вертикальной полосы прокрутки (полосы прокрутки находятся справа от рисунка).

Особо обратим внимание! В качестве разделителя между отдельными числами ни в коем случае не следует использовать точку и запятую, так как эти знаки используются в качестве десятичного разделителя. Отделить одно число от другого можно, используя "пробел" или "ввод".
Например, такой ввод в текстовое поле корректен:
0,23   0,56   0.98
0,98   1,56   9,9   7.908
Соответственно будут обрабатываться семь значений: 0.23   0.56   0.98   0.98   1.56   9.9   7.908.