Регрессии статистически



Для отбора факторов в уравнение регрессии необходимо учитывать тесную связь с себестоимостью. При отборе факторов руководствуются следующими требованиями:

Следовательно, прежде чем делать окончательные выводы относительно построенного уравнения регрессии, необходимо проверить автокорреляцию остаточных величин.

После построения уравнения регрессии необходимо сделать проверку его значимости: с помощью специальных критериев установить, не является ли полученная зависимость, выраженная уравнением регрессии, случайной, т.е. можно ли ее использовать в прогнозных целях и для факторного анализа. В статистике разработаны методики строгой проверки значимости коэффициентов регрессии с помощью дисперсионного анализа и расчета специальных критериев (например, F-критерия). Нестрогая проверка может быть выполнена путем расчета среднего относительного линейного отклонения (ё), называемого средней ошибкой аппроксимации:

Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена с помощью эвристических или многомерных статистических методов анализа. Наиболее приемлемым методом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность данного метода заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, насколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции (R). Одновременно используется и обратный метод, т.е. исключение факторов, ставших незначимыми на основе ?-крите-рия Стьюдента. Фактор является незначимым, если его включение в уравнение регрессии только изменяет значение коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициент регрессии не изменяется (или меняется несущественно), то данный признак существен и его включение в уравнение регрессии необходимо.

Для нахождения параметров линейной множественной регрессии необходимо решить систему уравнений:

Для точного описания уравнения регрессии необходимо знать условный закон распределения зависимой переменной Y при условии, что переменная X примет значение дс, т. е. Х=х. В статистической практике такую информацию получить, как правило, не удается, так как обычно исследователь располагает лишь выборкой пар значений (х/, у,) ограниченного объема п. В этом случае речь может идти об оценке (приближенном выражении, аппроксимаций) по выборке функции регрессии. Такой оценкой1 является выборочная линия (кривая) регрессии:

Для получения уравнения регрессии достаточно предпосылок 1 — 4. Требование выполнения предпосылки 5 (т. е. рассмотрение «нормальной регрессии») необходимо для оценки точности уравнения регрессии и его параметров.

Для соизмерения предприятий по уровню эффективности производства на основе уравнения регрессии необходимо создать систему соизмерителей, т. е. систему величин /Q (t), характеризующая степень изменения показателя при переходе от базисных условий производства к другим г.

Когда речь идет о линейной регрессии, необходимо знать, насколько значимо отличаются от нуля величины параметров регрессии. Для проверки этого выдвигаются гипотезы:

Изучая уравнение линейной регрессии мы предполагали, что реальная взаимосвязь фактора X и отклика 7 линейна, а отклонения от прямой регрессии случайны, независимы между собой, имеют нулевое математическое ожидание и постоянную дисперсию. Если это не так, то статистический анализ параметров регрессии некорректен и оценки этих параметров не обладают свойствами несмещенности и состоятельности. Например, это может быть, если в действительности связь между переменными нелинейна. Поэтому после получения уравнения регрессии необходимо исследовать его ошибки.

Необходимо убедиться, что значения параметров регрессии значимо отличаются от нуля. Для проверки этого выдвигаются гипотезы:

Для решения уравнения регрессии необходимо определить значения параметров а, Ь, с. Их значения равны: ''


дает в критическую область и мы принимаем гипотезу Н0 . Это означает, что при заданном уровне значимости соответствующий параметр регрессии статистически незначимо отличается от нуля.

В противном случае мы принимаем гипотезу HI . Это означает, что при заданном уровне значимости соответствующий параметр регрессии статистически значимо отличается от нуля.

Так как критерии проверки для обоих параметров регрессии находятся в критической области, мы принимаем гипотезу Н]. Это означает, что при заданном уровне значимости параметры регрессии статистически значимо отличаются от нуля.

Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс как обусловленный влиянием фактора х, т. е. регрессией у по х, так и вызванный действием прочих причин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию. Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное воздействие на результату. Это равносильно тому, что коэффициент детерминации г2^ будет приближаться к единице.

Практически если фактические значения tbj > 3, то совершенно ясно, что значение коэффициента регрессии статистически достоверно. Уравнение может быть использовано для прогнозирования.

Уравнение регрессии статистически значимо — F, tb, r^ превышают табличные значения: при 5 %-ном уровне существенности и числе степеней свободы 23: F = 4,28; tb = 2,069; г^ = 0,398; при 1 %-ном уровне значимости: / = 7,88; tb = 2,807; V = 0,507).

Уравнение регрессии статистически значимо: F = 15,6; R = 0,766; R = 0,741; (а = 11,8;/4 = 3,9; /е = 4,1.

жении (коэффициент регрессии статистически значим на уровне 10%), а

Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс как обусловленный влиянием фактора х, т. е. регрессией у по х, так и вызванный действием прочих причин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию. Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное воздействие на результату. Это равносильно тому, что коэффициент детерминации г2^ будет приближаться к единице.

Практически если фактические значения ibj > 3, то совершенно ясно, что значение коэффициента регрессии статистически достоверно. Уравнение может быть использовано для прогнозирования.

Уравнение регрессии статистически значимо — F, tb, r^ превышают табличные значения: при 5 %-ном уровне существенности и числе степеней свободы 23: F = 4,28; tb = 2,069; г^ = 0,398; при 1 %-ном уровне значимости: / = 7,88; tb = 2,807; V = 0,507).


Распределяется следующим Распределяют пропорционально Распределения экономических Распределения дивидендов Распределения капитальных Работникам предприятия Распределения населения Распределения определяется Распределения перевозок Распределения потребительских Распределения продукции Распределения сжиженных Распределения стьюдента вывоз мусора снос зданий

Яндекс.Метрика