7.3.1 Выборочный метод и выборочная функция
распределения
На практике часто бывают
ситуации, когда полное исследование каждого объекта из интересующей совокупности
по различным причинам невозможно. В этих случаях из всей совокупности объектов
случайным образом отбирают ограниченное число объектов и подвергают их
исследованию. Вся совокупность объектов, из которых производится выборка
называется генеральной совокуп-ностью. совокупность случайно отобранных из
генеральной совокупности объектов называется выборочной совокупностью. Число
объектов в совокупности называется ее объемом. На практике сведения о законе
распределения случайной величины получают независимыми многократными
повторениями опыта. На основе полученной информации из полученной выборки можно
вычислить приблизительные значения для функции распределения и другие
характеристики случайной величины. Выборочной или эмпирической функцией
распределения случайной величины называют функцию равную частоте появления
событий F (x)= nx/n. Для построения выборочной функции распределения весь
диапазон изменения случайной величины Х разбивают на ряд интервалов одинаковой
ширины (от 5 до 15) и затем вычисляют количество значений случайной величины Х,
попав-ших в каждый интервал.
4.3.2
Построение выборочной функции распределения
В табличном процессоре для построения выборочной функции
распределения используется специальная функция ЧАСТОТА и
инструмент пакета анализа Гистограмма. Функция
ЧАСТОТА вычисляет частоты появления случайных величин в
ин-тервалах значений и выводит их как массив чисел. Функция имеет параметры:
ЧАСТОТА(массив_данных; массив_интервалов
), где:
-массив_данных – массив или
ссылка на диапазон данных, для которых вычисляются частоты;
-массив_интервалов – массив или ссылка на
множество интервалов, в которые группируются значения аргумента
массив_данных
. Количество элементов в возвращаемом массиве на единицу
больше, чем в задано в параметре массив_интервалов. Дополнительный элемент
содержит количество значений больших, чем максимальное значение в интервалах.
Инструмент
Гистограмма служит для вычисления выборочных и
интегральных частот попадания данных в указанные интервалы значений. Выходным
результатом является таблица и гистограмма. Чтобы включит инструмент
Гистограмма следует выполнить команду меню
Сервис - Анализ данных, и далее в раскрывшемся диалоговом
окне Анализ данных из списка выбрать
Гистограмма – откроется диалоговое окно
Гистограмма. Вид диалогового окна
Гистограмма приведен на рисунке.
Диалоговое
окно имеет следующие параметры:
-Входной интервал – поле, предназначенное
указания адресной ссылки на диапазон, содержащий исследуемые данные;
-Интервал карманов – поле, в котором может быть
указана ссылка на диапазон ячеек, содержащий выбранные интервалы, в которые
группируются значения аргумента Входной интервал
;
-поле Выходной диапазон предназначено для ввода
адресной ссылки на верхнюю левую ячейку выходного диапазона;
-флажок Интегральный процент
устанавливает режим генерации интегральных процентных соотношений и включает в
гистограмму график инте-гральных процентов; - флажок Вывод
графика
устанавливает режим автоматического вывода графика на рабочий
лист, содержащий входной диапазон.
Пример
12. Построить эмпирическое распределение рейтинга студентов по
результатам экзаменов, оцененных в баллах для следующей произвольной выборки:
48, 51, 64, 62, 55, 71, 74, 79, 80, 86, 91, 99, 83, 50. Задачу решить двумя
способами: с применением функции ЧАСТОТА, с применением
инструмента Гистограмма
пакета анализа
Решение
с применением функции ЧАСТОТА
1. В ячейку А2 рабочего листа
введите текст “Наблюдения”, а в диапазон А3:А16 – числа из заданной выборки (см
рис.).
2. В ячейке В2 запишите текст “Шкала баллов”, а в
ячейки диапазона В3:В6 – баллы, соответствующие шкале для вывода пятибалльной
оценки – 50, 70, 85, 100. Это означает, что баллы диапазона 1 – 50 эквивалентны
оценке “не-удовлетворительно”, баллы, находящиеся в диапазоне 51 – 70 – оценке
“удовлетворительно” и т.д.
3. В ячейки С2, D2 и E2 введите тексты “Абсолютные
частоты”, “Относительные частоты” и “Накопленные частоты” соответственно.
Абсолютные частоты – это частота попадания случайной величины из выборки в
соответствующий интервал. Относительная частота представляет собой частное от
деления значения относительной частоты на количество элементов выборки.
Накопленные частоты – это сумма относительных частот.
4. Выделите диапазон С3:С7 и выполните команду меню Вставка - Функция. В открывшемся окне диалога Мастер функций выберите категорию Статистические, а в списке функций – функцию ЧАСТОТА.
Раскроется диалоговое окно функции ЧАСТОТА .
5. Установите параметры функции:
массив_данных – установите ссылку на диапазон, содержащий
выборку случайных величин (А3:А16);
массив_интервалов – установите ссылку на
диапазон, содержащий шкалу для вывода оценки (В3:В6).
6. Так как
функция ЧАСТОТА возвращает результат в виде массива, нажмите комбинацию клавиш
Ctrl + Shift + Enter. В ячейки диапазона С3:C7 будет выведен результат –
абсолютные частоты попадания случайных величин в интервалы, заданные в ячейках
диапазона В3:B6.
Таким образом, в результате
проведенного исследования получены статистические оценки частот по случайной
выборке: неудовлетворительно – 2, удовлетворительно – 4, хорошо – 5, отлично –
3.
Решение с применением инструмента
Гистограмма
1. В ячейку А2 рабочего листа введите текст “Наблюдения”, а в диапазон
А3:А16 – числа из заданной выборки (см. рис. ).
2. В ячейке В2 запишите текст “Шкала
баллов”, а в ячейки диапазона В3:В6 – баллы, соответствующие шкале для вывода
пятибалльной оценки.
3. Выполните команду меню Сервис -
Анализ данных – откроется диалоговое окно Анализ данных.
4. В
окне диалога Анализ данных выберите из списка Гистограмма – откроется диалоговое окно Гистограмма .
5. Введите параметры в
соответствующие поля диалогового окна Гистограмма :
-Входной диапазон – укажите диапазон ячеек, в котором размещены
ре-зультаты выборки (А3:А16);
-Интервал карманов –укажите ссылку на
диапазон ячеек, содержащий выбранные интервалы – шкалу для вывода оценки
(В3:В6);
-установите переключатель Выходной_интервал ;
-Выходной диапазон - введите адресную ссылку на верхнюю левую
ячей-ку выходного диапазона (С2);
-установите флажок Интегральный
процент ;
-установите флажок Вывод графика .
6. Щелкните
на кнопке ОК. В результате на рабочий лист будет выведена таблица и диаграмма .
Как видно из полученных результатов оба рассмотренные способа дают
одинаковые результаты. На основании полученных результатов выборочную функцию
распределения можно записать в виде:
Упражнение 8. Решите задачи, помещенные на рабочем листе с названием
"Распределения” рабочей книги Stat.xls . Чтобы открыть рабочую книгу, щелкните на кнопке "Открыть"