Построение полигона и гистограммы

Теоретические сведения

Пусть имеется выборка (X1,...,Xn). Как обычно X(1)=min{X1,...,Xn} и X(n)=max{X1,...,Xn}. Разобьем интервал изменения данных [X(1),X(n)] на k участков одинаковой длины. Сколько участков взять? Есть несколько подходов к определению числа участков разбиения k. здесь [num] - целая часть числа num. Обратим внимание, что третий подход реализован в Excel. Далее обозначим через h=(X(n)-X(1))/k. Построим границы интервалов группировки следующим образом: xstart=X(1) и каждая следующая точка получается из предыдущей добавлением h при этом конечной точкой будет X(n) , соответственно: xfinish= X(n) . В итоге получим интервалы группировки: [xstart, xstart+h),...,[xfinish-h,xfinish]. Обратим внимание, что последний интервал мы выбираем замкнутым. Для i-го интервала группировки, обозначим его [ai, bi) (последний интервал [ak, bk]) - определим число ni элементов выборки попавших в этот интервал. Тогда полигоном называется непрерывная ломаная, построенная по точкам Ai=((ai+bi)/2, ni/(nh)),  i=1,2,...k. На i-ом интервале группировки построим прямоугольник с высотой ni/(nh). Фигура, состоящая из объединения по всем i таких прямоугольников, называется гистограммой.



Вычисления

Внимание! Для работы электронных таблиц необходим java-компилятор, который бесплатно скачивается здесь. Обратим внимание, что скачивается Java SE Development Kit (JDK) JDK 6 Update 14, причем Update может быть более ранним (то есть меньшим 14-ти) или более поздним.

Помощь (как выполнить вычисления?)

Введите исследуемую выборку
   
Выберите подход к определению числа участков разбиения
k=1+[log2(n)] (формула Стэрджесса),
k=1+[1.72 n1/3],
k=1+[n1/2].



Внимание! Ваш браузер не поддерживает Java!



Результаты вычислений
Координаты вершин Ai полигона Интервалы группировки Si и
числа попаданий ni элементов выборки
в интервалы группировки



Помощь (как выполнить вычисления)

Для того чтобы произвести вычисление, необходимо поместить в текстовое поле изучаемую выборку (это можно сделать, набрав соответствующие значения вручную либо скопировав, скажем, из Excel).

Далее необходимо выбрать один из трех подходов к определению числа участков разбиения.

Затем необходимо выбрать вид интересующего графика ("полигон" или "гистограмма") с помощью соответствующего флажка (по умолчанию установлен флажок "гистограмма").

Далее остается нажать кнопку "Построить график". Изменить горизонтальный или вертикальный масштаб построенного рисунка можно соответсвенно с помощью горизонтальной или вертикальной полосы прокрутки (полосы прокрутки находятся справа от рисунка).

Ниже в текстовом поле "Результаты вычислений" можно посмотреть координаты вершин, по которым строится полигон, а также соответствующие интервалы группировки и числа попаданий элементов выборки в эти интервалы.

Особо обратим внимание! В качестве разделителя между отдельными числами ни в коем случае не следует использовать точку и запятую, так как эти знаки используются в качестве десятичного разделителя. Отделить одно число от другого можно, используя "пробел" или "ввод".
Например, такой ввод в текстовое поле корректен:
0,23   0,56   0.98
0,98   1,56   9,9   7.908
Соответственно будут обрабатываться семь значений: 0.23   0.56   0.98   0.98   1.56   9.9   7.908.