Интервала группировки



Согласно второму подходу интервалы группировки можно выбрать и неравными (возрастающими или убывающими). Этот подход обычно применяется при большой вариации и неравномерности распределения признака по всему интервалу его изменения.

б) Далее необходимо определиться, каким образом разбить указанный диапазон на группы или интервалы группировки. Как правило, весь диапазон разбивают приблизительно на 5—10 групп. Конечно, это всего лишь рекомендация, и во многих случаях целесообразно проводить разбивку на большее или меньшее число групп. Далее, обычно группы имеют одинаковую интервальную протяженность, что, впрочем, иногда представляет неудобство. Интервалы группировки данных могут быть определены в 100 ф. ст. Таким образом, мы можем подсчитать количество работников, зарабатывающих от 300 до 400 ф. ст., от 400 до 500 ф. ст. и т. д.

Объем выпуска колеблется в диапазоне от 20.2 до 29.1. На рис. 1.3 представлена таблица распределений, составленная на основе вышеприведенных данных с разбивкой на соответствующие интервалы группировки.

Такие данные называются дискретными, так как переменная (количество отсутствовавших) может быть представлена только точными значениями, т. е. целыми числами. Для такой переменной интервалы группировки в таблице частот, в отличие от предыдущих примеров, где указывался только нижний предел, обычно имеют и верхние и нижние пределы.

Скорее всего, интервалы группировки будут просто указаны, как они есть.

Формула, приведенная в предыдущем примере, может быть использована для любых данных, сведенных в таблицу частот. Однако если в таблице указаны интервалы группировки, тогда необходимо брать срединные значения каждого интервала в качестве значений х. Рассмотрим следующую таблицу частот, содержащую доходы группы работников:

Таким образом, мода равняется 1 работнику. Как видно на примере такой простой таблицы частот, определение моды не представляет труда. Мы просто находим и соотносим ее со значением соответствующей переменной. Однако если таблица частот содержит интервалы группировки, то процесс определения становится более сложным, что мы и увидим на следующем примере.

Процесс первоначального определения медианы с целью получения среднего значения может быть распространен на таблицы частот, содержащие интервалы группировки, как это видно на следующем примере. Рассмотрим заработную плату группы работников, что мы уже делали ранее:

После определения числа групп следует определить интервалы группировки.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Согласно второму подходу интервалы группировки можно выбрать и неравными (возрастающими или убывающими). Этот подход обычно применяется при большой вариации и неравномерности распределения признака по всему интервалу его изменения. При выборе размера интервала группировки руководствуются здравым смыслом и логикой, опираясь при этом на распределения прошлых периодов и традиционно сложившиеся подходы в группировке. При использовании этого подхода интервалы часто выбирают таким образом, чтобы группы были равнозапол-ненными.


Оператор 7. Определение длины интервала группировки.

Операторы 9—13. Определение максимального и минимального значений для каждого интервала группировки.

Операторы 22—23. Определение среднего значения х для каждого интервала группировки.

Оператор 24. Вычисление нормированного отклонения tj для каждого интервала группировки.

Оператор 25. Подпрограмма определения плотности вероятности теоретического распределения для каждого интервала группировки. Выборка может быть произведена из таблиц, приведенных в [20].

Оператор 26. Расчет теоретических частот распределения для каждого интервала группировки.

Важнейший вопрос при проведении такого рода исследования - выбор интервала группировки. Существуют два основных подхода (метода) к его решению.

чение может быть вызвано желанием обеспечить некоторую качественную однородность выделяемых групп единиц совокупности). В последнем случае длина интервала группировки находится делением размаха вариации, т.е. разности между максимальным и минимальным значениями груп-пировочного признака, на предполагаемое число групп.

При выборе размера интервала группировки руководствуются здравым смыслом и логикой, опираясь при этом на распределения прошлых периодов и традиционно сложившиеся подходы в группировке. При использовании этого подхода интервалы часто выбирают таким образом, чтобы группы были равнозаполненными.

Каждый столбец гистограммы отображает значение частот для определенного интервала группировки. Например, два работника, получающие от 300 до 400 ф. ст., представлены первым столбцом диаграммы. В общем, размеры столбцов гистограммы пропорциональны отображаемому ими значению частот.

В процессе группировки значений в интервалы, как в данном примере, мы потеряли значительную часть исходной первичной информации. Например, невозможно точно определить наиболее часто встречающееся характерное значение. Может не быть двух работников, получающих одинаковую зарплату, отсюда — и единственной моды. Параллельно мода может оказаться в любом из интервалов группировки данной таблицы. Например, если два работника получают точно 300 ф. ст. и больше ни один работник не получает одинаковой с другим заработной платы, тогда, строго говоря, мода составляет 300 ф. ст. Но это даже и не близко к значению средней! Так как существенная часть информации отсутствует, нам необходимо на основании имеющихся данных определить наиболее вероятное значение моды. Из таблицы видно, что наиболее часто повторяется интервал 600—700 ф. ст. Отсюда естественно предположить, что мода находится в пределах данного интервала. Можно определить моду как срединное значение в данном интервале, т. е. 650 ф. ст. И хотя в этом есть резон, все же лучше определить среднее относительно значений частот по обе стороны наибольшего значения. Мы видим, что значение частот для интервала, меньшего 600—700, больше значения частот для интервала, большего 600—700. Поэтому более вероятно, что мода находится в первой половине интервала группировки 600—700. Например, она может быть равна не 650 , а 640 ф. ст. или 630 ф. ст.


Изменения организационно Изменения отражаются Изменения переменных Изменения политической Изменения потребления Изменения прибыльности Изменения происходящие Изменения производственных Изменения реального Индивидуального предложения Изменения соответственно Изменения стоимости Изменения технических вывоз мусора снос зданий

Яндекс.Метрика