7.3.6 Использование инструментов табличного процессора для регрессионного анализа
Важную роль при исследовании взаимосвязей между статистическими выбор-ками кроме корреляционного и дисперсионного анализа играет регрессионный анализ. Регрессия позволяет проанализировать воздействие на какую-либо за-висимую переменную одной или более независимых переменных и позволяет установить аналитическую форму (модель) этой зависимости. Если рассматривается зависимость между одной зависимой переменной Y и не-сколькими независимыми X1, X2, …, Xn, то речь идет о множественной линей-ной регрессии. В этом случае уравнение регрессии имеет вид: Y = a0 + a1X1 + a2X2 +…+anXn, где a1, a2, …, an - коэффициенты при независимых переменных, которые нужно вычислить (коэффициенты регрессии), a0 –константа. При построении регрессионной модели важнейшими моментами являются оценка ее адекватности (эффективности) и значимости, на основании которых можно судить о возможности применения в практике полученной модели. Мерой оценки адекватности регрессионной модели является коэффициент детерминации R2 (R-квадрат), который определяет, с какой степенью точности полученное уравнение регрессии аппроксимирует исходные данные. Значимость регрессионной модели оценивается с помощью критерия Фишера (F – критерия). Если величина F – критерия значима (р < 0,05), то регрессион-ная модель является значимой.
В MS Excel можно аппроксимировать экспериментальные данные линейным уравнением до 16 порядка: Y = a0 + a1X1 + a2X2 +…+a16X16. Для вычисления ко-эффициентов регрессии служит инструмент Регрессия, который можно включить следующей последовательностью операций:
1. Выполнить команду Сервис - Анализ данных .
2. В раскрывшемся окне диалога Анализ данных выбрать из списка строку Регрессия – раскроется окно диалога Регрессия .
3. В группе Входные данные в поле Входной интервал Y указать адресную ссылку на диапазон, содержащий значения зависимой переменной, а в поле Входной интервал Х – ссылку на диапазон, содержащий значения независимых переменных, т.е. переменных влияние которых на зависимую переменную Y оценивается, установить флажок Метки, если исходная таблица имеет названия столбцов и флажок Константа-ноль , если а0=0.
4. В группе Параметры выхода указать, куда следует выводить результаты вычислений.
5. Если необходимо получить визуальную картинку отличия экспериментальных точек от предсказанных регрессионной моделью, то установить флажок График подбора .
6. Если нужно получить график нормальной вероятности, то установить флажок График нормальной вероятности .
В выходном диапазоне после выполнения вычислений отображаются результаты дисперсионного анализа, коэффициенты регрессии, стандартная погреш-ность вычисления Y, среднеквадратичные отклонения, количество наблюдений, стандартные погрешности для коэффициентов. Значения коэффициентов регрессии размещаются в столбце Коэффициенты:
- Y- пересечение a0;
- X1 - a1
- X1 – a2 и т.д.
В столбце Р – Значение содержится оценка достоверности отличия соответствующих коэффициентов от нуля. Если P > 0,05, то коэффициент можно считать нулевым. Это означает, что соответствующая независимая переменная практически не влияет на зависимую переменную. Значение R – квадрат определяет, с какой степенью точности регресси-онное уравнение будет аппроксимировать экспериментальные данные. Если R – квадрат > 0,95, то точность аппроксимации высокая. При 0,8< R – квадрат< 0,95 аппроксимация удовлетворительная. В случае, когда R – квадрат <0,6, точность аппроксимации недостаточна и модель требует улучшения.
Кроме инструмента Регрессия в MS Excel для получения параметров уравнения регрессии есть функция ЛИНЕЙН и функция ТЕНДЕНЦИЯ для получения значения Y в требуемых точках.
Пример 20. Имеются статистические данные о затратах, связанных с рекламой по телевидению, с рекламой в метро и объеме реализации продукции в рублях, приведенные в таблице.

Требуется найти регрессионные коэффициенты для независимых переменных Затраты на рекламу по телевидению и Затраты на рекламу в метро на объем реализации продукции и построить уравнение регрессии.
Решение.
1. На рабочем листе в диапазон А1: С8 введите данные приведенной таблицы (см. рис.).
2. Включите инструмент Регрессия. В открывшемся диалоговом окне установите параметры (см. рис. ):

- Входной интервал Y – диапазон С1:C8;
- Входной интервал X – диапазон A1:B8;
- Переключатели Метки, Константа - ноль ;
-Выходной интервал – адрес D1;
- Флажок График нормальной вероятности;
- Флажок График остатков.
После щелчка на кнопке ОК в диапазон D1:L21 будет выведен результат регрессионного анализа.
Полученные результаты:
1. Коэффициент детерминации R – квадрат = 0,893 ( аппроксимация удовле-творительная).
2. Значимость F = 0,00762 (р < 0,05- регрессионная модель значима).
3. Y – пересечение a0 =0.
4. a1= 5,478 – коэффициент при независимой переменной Затраты на рекламу по телевидению< /em> .
5. a2 = 52,502 - коэффициент при независимой переменной Затраты на рекламу в метро.
С учетом полученных данных уравнение регрессии будет иметь вид:
Y= 5,478X1 + 52,502X2 ,
где
Х1
величина затрат на рекламу по телевидению ,
Х2
величина затрат на рекламу в метро.
       К предыдущей
Открыть содержание
Hosted by uCoz