Статистическая наука предполагает ряд последовательных действий, с целью изучения своего предметна. Ночная все с наблюдения продолжается процесс исследования обработкой собранных данных, а уже после этого данные анализируются при помощи различных обобщающих показателях. Понятие статистического наблюдение было рассмотрено ранее. Теперь же поговорим о сводке и группировке статистических данных.
Сводка – это научно организованная обработка результатов наблюдения, включающая в себя контроль, систематизацию, группировку, составление таблиц и подведение итогов. По сути, сводка это общий процесс обработки данных. Данные СВОДЯТСЯ, отсюда и название сводка!
Составным процессом сводки является группировка данных.
Группировка это разбиение совокупности на группы, однородные по какому-либо признаку, например мужчины и женщины – группируем по полу а групп получается две.
Процесс группировок основывается на двух основополагающих элементах:
— группировочный признак – это признак, по которому происходит объединение отдельных единиц в группы.
— интервал (для количественных признаков) – очерчивает количественные границы групп.
Интервалы бывают
— равные – расстояние между верхней и нижней границей во всех интервалах одинаковое – например интервалы 3-6, 6-9, 9-12 будут равными, потому что во всех расстояние 3.
— неравные – в таких интервалах расстояние между границами может быть различным – 1-10, 10- 100, 100-500.
— закрытые – такие интервалы имеют две границы нижнюю и верхнюю – например интервал 5-10 закрытый, нижняя граница у него 5 а 10 это уже верхняя граница.
— открытые – интервалы не имеют либо нижней, либо верхней границы, в статистике открытые интервалы выглядят так – до 100 в этом интервале нет нижнего предела но есть верхний 100, или 50 и более в этом интервале нижний предел есть 50, а вот верхнего нет, поэтому он является открытым.
Виды группировок.
В статистике при обработке данных могут использоваться разные виды и способы группировки данных, в зависимости от конечных целей исследования.
Структурная группировка – используется для изучения структуры или долей явления, путем объединения элементов в близкие по смыслу группы
№ п/п | Количество обучающихся в группе, человек | Число явившихся | Число не явившихся | Доля неявок |
1. | до 10 | – | – | – |
2. | 10 – 15 | – | – | – |
3. | 15 – 20 | – | – | – |
4. | 25 и более | – | – | – |
Аналитическая группировка – используется для выявления влияния одних факторов на другие, позволяет выявлять связи между явлениями
№ п/п | Выпуск продукции, млн. руб. | Количество работников | Объем выпуска | |
на 1 работника | на 1 рабочего | |||
1. | 10-50 | 80 | — | — |
2. | 50-100 | 150 | — | — |
3. | 100-500 | 380 | — | — |
4. | 500 и более | 1100 | — | — |
Типологическая группировка – группируется явление по социальным явлениям или социальным отношениям, принятым в обществе, классы, группы и так далее.
№ п/п | Социальные группы населения | Мужчины | Женщины | ||
1910 | 1920 | 1910 | 1920 | ||
1. | Рабочие | – | – | – | – |
2. | Буржуазия | – | – | – | – |
3. | Аристократия | – | – | – | – |
Ряды распределения
В результате сводки образуются ряды величин, характеризующие явление по одному признаку, такие ряды называют рядами распределения.
Ряды распределения бывают двух видов
— атрибутивные – это ряды, образованные по качественному признаку – в основу группировки положен качественный признак, например пол, профессия территория.
Варианта Пол (х) |
Частота Численность, человек (f)
|
мужской | 12 |
женский | 18 |
Итого | 30 |
— вариационные – ряды, образованные по количественному признаку, в основу группировки таких рядов положен количественный признак, причем изучаться он может как в отдельных данных, так и в интервалах.
Вариационные ряды бывают
— дискретные – в таких рядах признак носит прерывный характер, указывается одним числом
Варианта Возраст, лет (х) |
Частота Число студентов, человек (f) |
15 | 3 |
16 | 7 |
17 | 20 |
Итого | 30 |
— интервальные – в таких рядах признак расположен в интервале от и до, не прерывается.
Варианта Средняя зарплата за месяц, рублей (х) |
Частота Число работников, человек (f) |
10000-15000 | 16 |
15000-20000 | 44 |
20000-30000 | 40 |
Итого | 100 |
Как видно из примеров каждый ряд распределения имеет два элемента или две колонки. Элементы ряда, в не зависимости интервальный ряд или дискретный, всегда имеют одно и тоже название:
— варианта – это определенные значения варьирующегося признака, в атрибутивных рядах качественный признак, в вариационных количественный. Обозначается варианта буквой х. Варианта всегда первая колонка (подлежащее таблицы).
— частота – показывает как часто (или сколько раз) встречается данная варианта — обозначается буквой (f). Частота как правило вторая колонка, она характеризует число появлений изучаемых вариант.
Может еще поучимся? Загляни сюда!