Процедура "Регрессия" пакета "Анализ данных"

Процедура «Регрессия» пакета «Анализ данных»

Процедура решает простейшую задачу парной линейной регрессии:

– по заданным значениям , i =1, 2, …, n строит методом наименьших квадратов линейную функцию регрессии ;

– вычисляет некоторые статистики для анализа качества аппроксимации.

Исходные данные для функции

— выборочные значения , i =1, 2, …, n

Содержание отчёта о вычислениях, которые выполняются процедурой, определяется пользователем.

Основные численные результаты представлены в трёх таблицах под общим заголовком

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R
R-квадрат
Нормированный R-квадрат
Стандартная ошибка
Наблюдения

Здесь:

R-квадрат – коэффициент детерминации: ;

Стандартная ошибка — стандартная ошибка регрессии: , ;

Наблюдения — количество наблюдений n.

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия
Остаток
Итого

В двух строках таблицы отображаются статистики, относящиеся соответственно к регрессии и к остаткам регрессии:

df — число степеней свободы: ;

SS — сумма квадратов регрессии: ;

MS — среднее суммы квадратов регрессии, сумма квадратов, делённая на число переменных m, в данном случае m = 1.

F — значение критерия Фишера: ;

Значимость F — вычисленное по выборке значение плотности вероятности распределения Фишера с (1, n-2) степенями свободы;

Следующая таблица — основная таблица, описывающая линию регрессии.

Коэффициенты

Стандартная

ошибка

t-статистика

P-Значение

Y-пересечение

Переменная X 1

Нижние 95%

Верхние 95%

Нижние

Верхние

В двух строках таблицы отображаются статистики, относящиеся соответственно к константе b (Y-пересечение) и к коэффициенту a (Переменная X 1) в уравнении линии регрессии y = ax + b:

Коэффициенты — значения коэффициентов соответственно b и a в уравнении линии регрессии y = ax + b;

Стандартная ошибка— стандартная ошибка регрессии: , ;

t-статистика — вычисленное по выборке значение критерия Стьюдента для проверки значимости коэффициентов (нулевая гипотеза – коэффициент равен нулю): точечная оценка коэффициента, делённая на его стандартную ошибку: ;

P-Значение значение плотности вероятности распределения Стьюдента с (n-2) степенями свободы (малые значения вероятности свидетельствуют в пользу значимости коэффициентов).

Нижние 95%, Верхние 95%, Нижние 90.0%, Верхние 90.0% — соответственно нижние и верхние границы доверительных интервалов для коэффициентов b и a (границы вычисляются с 95% доверительной вероятностью вычисляются по умолчанию, и с p%, заданной пользователем).

На приведенном ниже рисунке можно видеть решение задачи для различных типов аппроксимирующих функций.

Процедура "Регрессия" пакета "Анализ данных"

Пример работы с процедурой "Регрессия"

Видео

Видео

Видео