Сводка и группировка статистических данных

Svodka_kartinka

Статистическая наука предполагает ряд последовательных действий, с целью изучения своего предметна. Ночная все с наблюдения продолжается процесс исследования обработкой собранных данных, а уже после этого данные анализируются при помощи различных обобщающих показателях. Понятие статистического наблюдение было рассмотрено ранее. Теперь же поговорим о сводке и группировке статистических данных.

Сводка – это научно организованная обработка результатов наблюдения, включающая в себя контроль, систематизацию, группировку, составление таблиц и подведение итогов. По сути, сводка это общий процесс обработки данных. Данные СВОДЯТСЯ, отсюда и название сводка!

Составным процессом сводки является группировка данных.
Группировка это разбиение совокупности на группы, однородные по какому-либо признаку, например мужчины и женщины – группируем по полу а групп получается две.

Процесс группировок основывается на двух основополагающих элементах:
— группировочный признак – это признак, по которому происходит объединение отдельных единиц в группы.
— интервал (для количественных признаков) – очерчивает количественные границы групп.

Интервалы бывают
— равные – расстояние между верхней и нижней границей во всех интервалах одинаковое – например интервалы 3-6, 6-9, 9-12 будут равными, потому что во всех расстояние 3.
— неравные – в таких интервалах расстояние между границами может быть различным – 1-10, 10- 100, 100-500.
— закрытые – такие интервалы имеют две границы нижнюю и верхнюю – например интервал 5-10 закрытый, нижняя граница у него 5 а 10 это уже верхняя граница.
— открытые – интервалы не имеют либо нижней, либо верхней границы, в статистике открытые интервалы выглядят так – до 100 в этом интервале нет нижнего предела но есть верхний 100, или 50 и более в этом интервале нижний предел есть 50, а вот верхнего нет, поэтому он является открытым.

Виды группировок.

В статистике при обработке данных могут использоваться разные виды и способы группировки данных, в зависимости от конечных целей исследования.

Структурная группировка – используется для изучения структуры или долей явления, путем объединения элементов в близкие по смыслу группы

№ п/п Количество обучающихся в группе, человек Число явившихся Число не явившихся Доля неявок
1. до 10
2. 10 – 15
3. 15 – 20
4. 25 и более

Аналитическая группировка – используется для выявления влияния одних факторов на другие, позволяет выявлять связи между явлениями

№ п/п Выпуск продукции, млн. руб. Количество работников Объем выпуска
на 1 работника на 1 рабочего
1. 10-50 80
2. 50-100 150
3. 100-500 380
4. 500 и более 1100

Типологическая группировка – группируется явление по социальным явлениям или социальным отношениям, принятым в обществе, классы, группы и так далее.

№ п/п Социальные группы населения Мужчины Женщины
1910 1920 1910 1920
1. Рабочие
2. Буржуазия
3. Аристократия

Ряды распределения

В результате сводки образуются ряды величин, характеризующие явление по одному признаку, такие ряды называют рядами распределения.

Ряды распределения бывают двух видов

атрибутивные – это ряды, образованные по качественному признаку – в основу группировки положен качественный признак, например пол, профессия территория.

Варианта

Пол (х)

Частота

Численность, человек (f)

мужской 12
женский 18
Итого 30

вариационные – ряды, образованные по количественному признаку, в основу группировки таких рядов положен количественный признак, причем изучаться он может как в отдельных данных, так и в интервалах.

Вариационные ряды бывают

дискретные – в таких рядах признак носит прерывный характер, указывается одним числом

Варианта

Возраст, лет (х)

Частота

Число студентов, человек (f)

15 3
16 7
17 20
Итого 30

интервальные – в таких рядах признак расположен в интервале от и до, не прерывается.

Варианта

Средняя зарплата за месяц, рублей (х)

Частота

Число работников, человек (f)

10000-15000 16
15000-20000 44
20000-30000 40
Итого 100

Как видно из примеров каждый ряд распределения имеет два элемента или две колонки. Элементы ряда, в не зависимости интервальный ряд или дискретный, всегда имеют одно и тоже название:

варианта – это определенные значения варьирующегося признака, в атрибутивных рядах качественный признак, в вариационных количественный. Обозначается варианта буквой х. Варианта всегда первая колонка (подлежащее таблицы).

частота – показывает как часто (или сколько раз) встречается данная варианта — обозначается буквой (f). Частота как правило вторая колонка, она характеризует число появлений изучаемых вариант.

Может еще поучимся? Загляни сюда!

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий