Найти в Дзене
Piter Melnikov

Построение выборочной функции распределения в Excel

Оглавление

Выборочный метод и выборочная функция распределения

На практике часто бывают ситуации, когда полное исследование каждого объекта из интересующей совокупности по различным причинам невозможно. В этих случаях из всей совокупности объектов случайным образом отбирают ограниченное число объектов и подвергают их исследованию. Вся совокупность объектов, из которых производится выборка называется генеральной совокупностью. Совокупность случайно отобранных из генеральной совокупности объектов называется выборочной совокупностью. Число объектов в совокупности называется ее объемом. На практике сведения о законе распределения случайной величины получают независимыми многократными повторениями опыта. На основе полученной информации из полученной выборки можно вычислить приблизительные значения для функции распределения и другие характеристики случайной величины. Выборочной или эмпирической функцией распределения случайной величины называют функцию равную частоте появления событий F (x)= nx/n.
Для построения выборочной функции распределения весь диапазон изменения случайной величины Х разбивают на ряд интервалов одинаковой ширины (от 5 до 15) и затем вычисляют количество значений случайной величины Х, попав-ших в каждый интервал.

Построение выборочной функции распределения

В табличном процессоре для построения выборочной функции распределения используется специальная функция ЧАСТОТА и инструмент пакета анализа Гистограмма. Функция ЧАСТОТА вычисляет частоты появления случайных величин в интервалах значений и выводит их как массив чисел. Функция имеет параметры:
ЧАСТОТА(массив_данных; массив_интервалов ),
где:
-
массив_данных – массив или ссылка на диапазон данных, для которых вычисляются частоты;
-
массив_интервалов – массив или ссылка на множество интервалов, в которые группируются значения аргумента массив_данных . Количество элементов в возвращаемом массиве на единицу больше, чем в задано в параметре массив_интервалов. Дополнительный элемент содержит количество значений больших, чем максимальное значение в интервалах.
Инструмент
Гистограмма служит для вычисления выборочных и интегральных частот попадания данных в указанные интервалы значений. Выходным результатом является таблица и гистограмма. Чтобы включить инструмент Гистограмма следует на ленте Данные в группе Анализ выбрать Анализ данных (Data Analysis) .
В раскрывшемся диалоговом окне Анализ данных из списка следует выбрать Гистограмма (Histogram) (рис. 1) – откроется диалоговое окно Гистограмма. Вид диалогового окна Гистограмма приведен на рис. 2.

Рис. 1
Рис. 1
Рис. 2.
Рис. 2.

Диалоговое окно имеет следующие параметры:
-
Входной интервал (Input Range) – поле, предназначенное указания адресной ссылки на диапазон, содержащий исследуемые данные;
-
Интервал карманов (Bin Range)– поле, в котором может быть указана ссылка на диапазон ячеек, содержащий выбранные интервалы, в которые группируются значения аргумента Входной интервал ;
-поле
Выходной диапазон (Output Range) предназначено для ввода адресной ссылки на верхнюю левую ячейку выходного диапазона;
-опция
Интегральный процент (Comulative Percentage) устанавливает режим генерации интегральных процентных соотношений и включает в гистограмму график интегральных процентов;
- опция
Вывод графика (Chart Output) устанавливает режим автоматического вывода графика на рабочий лист, содержащий входной диапазон.
Технологию построения эмпирического распределения рассмотрим на примере.
Пример. Построить эмпирическое распределение рейтинга студентов по результатам экзаменов, оцененных в баллах для следующей произвольной выборки: 48, 51, 64, 62, 55, 71, 74, 79, 80, 86, 91, 99, 83, 50. Задачу решить двумя способами: с применением функции ЧАСТОТА с применением инструмента Гистограмма пакета анализа.

Решение с применением функции ЧАСТОТА
1. В ячейку A2 рабочего листа введем текст “Наблюдения”, а в диапазон A3:A16 – числа из заданной выборки (см рис. 3).

Рис. 3.
Рис. 3.

2. В ячейке B2 запишем текст “Шкала баллов”, а в ячейки диапазона B3:B6 – баллы, соответствующие шкале для вывода пятибалльной оценки – 50, 70, 85, 100. Это означает, что баллы диапазона 1 – 50 эквивалентны оценке “неудовлетворительно”, баллы, находящиеся в диапазоне 51 – 70 – оценке “удовлетворительно” и т.д.
3. В ячейки C2, D2 и E2 введем тексты “
Абсолютные частоты”, “Относительные частоты” и “Накопленные частоты” соответственно. Абсолютные частоты – это частота попадания случайной величины из выборки в соответствующий интервал. Относительная частота представляет собой частное от деления значения относительной частоты на количество элементов выборки. Накопленные частоты – это сумма относительных частот.
4. Выделим диапазон C3:C7 и на ленте
Формулы выберем Вставить функцию. В открывшемся окне диалога Мастер функций выберите категорию Статистические, а в списке функций – функцию ЧАСТОТА (рис. 4).

Рис. 4.
Рис. 4.

Раскроется диалоговое окно функции ЧАСТОТА .
5. Установим параметры функции:
-
массив_данных – установим ссылку на диапазон, содержащий выборку случайных величин (A3:A16);
-
массив_интервалов – установим ссылку на диапазон, содержащий шкалу для вывода оценки (B3:B6).
6. Так как функция
ЧАСТОТА возвращает результат в виде массива, нажмем комбинацию клавиш Ctrl + Shift + Enter. В ячейки диапазона C3:C7 будет выведен результат – абсолютные частоты попадания случайных величин в интервалы, заданные в ячейках диапазона B3:B6 (рис. 3).
Таким образом, в результате проведенного исследования получены статистические оценки частот по случайной выборке: неудовлетворительно – 2, удовлетворительно – 4, хорошо – 5, отлично – 3.

Решение с применением инструмента Гистограмма
1. В ячейку A2 рабочего листа введем текст “Наблюдения”, а в диапазон A3:A16 – числа из заданной выборки (см. рис. 5).

Рис. 5.
Рис. 5.

2. В ячейке B2 запишите текст “Шкала баллов”, а в ячейки диапазона B3:B6 – баллы, соответствующие шкале для вывода пятибалльной оценки.
3. На ленте
Данные в группе Анализ выберем Анализ данных – откроется диалоговое окно Анализ данных.
4. В окне диалога
Анализ данных выберем из списка Гистограмма – откроется диалоговое окно Гистограмма .
5. Введите параметры в соответствующие поля диалогового окна
Гистограмма :
-
Входной диапазон – укажем диапазон ячеек, в котором размещены результаты выборки (A3:A16);
-
Интервал карманов –укажем ссылку на диапазон ячеек, содержащий выбранные интервалы – шкалу для вывода оценки (B3:B6);
-установим переключатель
Выходной_интервал ;
-
Выходной диапазон - введем адресную ссылку на верхнюю левую ячейку выходного диапазона (C2);
-установим опцию
Интегральный процент ;
-установим опцию
Вывод графика .
6. Кликнем на кнопке ОК. В результате на рабочий лист будет выведена таблица и диаграмма .
Как видно из полученных результатов оба рассмотренные способа дают одинаковые результаты. На основании полученных результатов выборочную функцию распределения можно записать в виде:

-7

Рекомендуем почитать