Тема 5. Парная линейная регрессия

Процедура "Регрессия" пакета "Анализ данных"

Процедура «Регрессия» пакета «Анализ данных»

Процедура решает простейшую задачу парной линейной регрессии:

  – по заданным значениям  , i =1, 2, …, n  строит методом наименьших квадратов линейную функцию регрессии ;

– вычисляет некоторые статистики для анализа качества аппроксимации.

Исходные данные для функции

— выборочные значения , i =1, 2, …, n  

Содержание отчёта о вычислениях, которые выполняются процедурой, определяется пользователем.

Основные численные результаты представлены в трёх таблицах под общим заголовком

 

ВЫВОД ИТОГОВ

 

Регрессионная статистика

Множественный R

 

R-квадрат

 

Нормированный R-квадрат

 

Стандартная ошибка

 

Наблюдения

 

 

 

Здесь:

 

R-квадрат – коэффициент детерминации:   ;

Стандартная ошибка  — стандартная ошибка регрессии:  ,     ;

Наблюдения —  количество наблюдений n.

 

 

Дисперсионный анализ

 

 

 

 

df

SS

MS

F

Значимость F

Регрессия

 

 

 

 

 

Остаток

 

 

 

 

 

Итого

 

 

 

 

 

 

 

 

 

 

 

 

В двух строках таблицы отображаются статистики, относящиеся соответственно к регрессии и к остаткам регрессии:

df — число степеней свободы: ;

SS — сумма квадратов регрессии: ;

MS — среднее суммы квадратов регрессии, сумма квадратов, делённая на число переменных m, в данном случае m = 1.

F — значение критерия Фишера: ;

Значимость F —  вычисленное по выборке значение плотности вероятности распределения Фишера с (1, n-2) степенями свободы;

Следующая таблица — основная таблица, описывающая линию регрессии.

 

 

Коэффициенты

Стандартная

ошибка

t-статистика

P-Значение

Y-пересечение

 

 

 

 

Переменная X 1

 

 

 

 

 

Нижние 95%

Верхние 95%

Нижние

p%

Верхние

p%

 

 

 

 

 

 

 

 

 

В двух строках таблицы отображаются статистики, относящиеся соответственно к константе b (Y-пересечение) и к коэффициенту a  (Переменная X 1) в уравнении линии регрессии y = ax + b:

Коэффициенты — значения коэффициентов соответственно b  и a  в уравнении линии регрессии y = ax + b;

 Стандартная ошибка— стандартная ошибка регрессии:  , ;

t-статистика — вычисленное по выборке значение критерия Стьюдента для проверки значимости коэффициентов (нулевая гипотеза – коэффициент равен нулю): точечная оценка коэффициента, делённая на его стандартную ошибку: ;

P-Значение значение плотности вероятности распределения Стьюдента  с (n-2) степенями свободы (малые значения вероятности свидетельствуют в пользу значимости коэффициентов).

Нижние 95%, Верхние 95%, Нижние 90.0%, Верхние 90.0% — соответственно нижние и верхние границы доверительных интервалов для коэффициентов b  и a (границы вычисляются с 95% доверительной вероятностью вычисляются по умолчанию,  и с p%, заданной пользователем).

На приведенном ниже рисунке можно видеть решение задачи для различных типов аппроксимирующих функций.

Пример работы с процедурой "Регрессия"

Хостинг от uCoz