Статистические характеристики и исследования. Формы представления статистических данных




Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существует 3 основных формы представления статистических данных :

  1. Текстовая – включение данных в текст;
  2. Табличная – представление данных в таблицах;
  3. Графическая – выражение данных в виде графиков.

Текстовая форма применяется при малом количестве цифровых данных.

Табличная форма применяется чаще всего, так как является более эффективной формой представления статистических данных. В отличие от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат, статистические таблицы рассказывают языком цифр об изучаемых объектах.

Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.

Например, в следующей таблице представлена информация о внешней торговле России, выражать которую в текстовой форме было бы неэффективным.

1995 2000 2001 2002 2003 2004 2005 2006 2007
Миллиардов долларов США
Внешнеторговый оборот 145,0 149,9 155,6 168,3 212,0 280,6 369,2 468,6 578,2
Экспорт 82,4 105,0 101,9 107,3 135,9 183,2 243,8 303,9 355,2
Импорт 62,6 44,9 53,8 61,0 76,1 97,4 125,4 164,7 223,1
Сальдо торгового баланса 19,8 60,1 48,1 46,3 59,9 85,8 118,4 139,2 132,1
со странами дальнего зарубежья
экспорт 65,4 90,8 86,6 90,9 114,6 153,0 210,2 260,6 301,5
импорт 44,3 31,4 40,7 48,8 61,0 77,5 103,5 140,1 191,2
сальдо торгового баланса 21,2 59,3 45,9 42,1 53,6 75,5 106,7 120,4 110,3
со странами СНГ
экспорт 17,0 14,3 15,3 16,4 21,4 30,2 33,5 43,4 53,7
импорт 18,3 13,4 13,0 12,2 15,1 19,9 21,9 24,6 31,9
сальдо торгового баланса -1,4 0,8 2,2 4,2 6,3 10,3 11,7 18,8 21,9

Различают подлежащее и сказуемое статистической таблицы. В подлежащем указывается характеризуемый объект – либо единицы совокупности, либо группы единиц, либо совокупность в целом. В сказуемом дается характеристика подлежащего, обычно в числовой форме. Обязателен заголовок таблицы, в котором указывается к какой категории и к какому времени относятся данные таблицы.

По характеру подлежащего статистические таблицы подразделяются на простые, групповые и комбинационные. В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом. В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам. В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам.

При построении таблиц необходимо руководствоваться следующими общими правилами.

  1. Подлежащее таблицы располагается в левой (реже – верхней) части, а сказуемое – в правой (реже – нижней).
  2. Заголовки столбцов содержат названия показателей и их единицы измерения.
  3. Итоговая строка завершает таблицу и располагается в ее конце, но иногда бывает первой: в этом случае во второй строке делается запись «в том числе», и последующие строки содержат составляющие итоговой строки.
  4. Цифровые данные записываются с одной и той же степенью точности в пределах каждого столбца, при этом разряды чисел располагаются под разрядами, а целая часть отделяется от дробной запятой.
  5. В таблице не должно быть пустых клеток: если данные равны нулю, то ставится знак «–» (прочерк); если данные не известны, то делается запись «сведений нет» или ставится знак «…» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1).

Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения.

Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel).

Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существует 3 основных формы представления статистических данных:

1) текстовая – включение данных в текст;

2) табличная – представление данных в таблицах;

3) графическая – выражение данных в виде графиков.

Текстовая форма применяется при малом количестве цифровых данных.

Табличная форма применяется чаще всего, так как является более эффективной формой представления статистических данных. В отличие от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат, статистические таблицы рассказывают языком цифр об изучаемых объектах.

Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.

Таблица 2. Внешняя торговля РФ за 2000 – 2006 годы, млрд.долл.

Показатель 2000 2001 2002 2003 2004 2005 2006
Внешнеторговый оборот 149,9 155,6 168,3 280,6 368,9 468,4
Экспорт 101,9 107,3 135,9 183,2 243,6 304,5
Импорт 44,9 53,8 76,1 97,4 125,3 163,9
Сальдо торгового баланса 60,1 48,1 46,3 59,9 85,8 118,3 140,7
в том числе:
со странами дальнего зарубежья
экспорт 90,8 86,6 90,9 114,6 210,1 261,1
импорт 31,4 40,7 48,8 77,5 103,5 138,6
сальдо торгового баланса 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Например, в табл. 2 представлена информация о внешней торговле России, выражать которую в текстовой форме было бы неэффективным.

Различают подлежащее и сказуемое статистической таблицы. В подлежащем указывается характеризуемый объект – либо единицы совокупности, либо группы единиц, либо совокупность в целом. В сказуемом дается характеристика подлежащего, обычно в числовой форме. Обязателен заголовок таблицы, в котором указывается к какой категории и к какому времени относятся данные таблицы.

По характеру подлежащего статистические таблицы подразделяются на простые , групповые и комбинационные . В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом (например, табл. 11). В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам (например, табл. 4). В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам (например, табл. 2).

При построении таблиц необходимо руководствоваться следующими общими правилами .

1. Подлежащее таблицы располагается в левой (реже – верхней) части, а сказуемое – в правой (реже – нижней).

2. Заголовки столбцов содержат названия показателей и их единицы измерения.

3. Итоговая строка завершает таблицу и располагается в ее конце, но иногда бывает первой: в этом случае во второй строке делается запись «в том числе», и последующие строки содержат составляющие итоговой строки.

4. Цифровые данные записываются с одной и той же степенью точности в пределах каждого столбца, при этом разряды чисел располагаются под разрядами, а целая часть отделяется от дробной запятой.

5. В таблице не должно быть пустых клеток: если данные равны нулю, то ставится знак «–» (прочерк); если данные не известны, то делается запись «сведений нет» или ставится знак «…» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1).

Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения.

Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel ).

По способу построения графики делятся на диаграммы , картограммы и картодиаграммы .

Наиболее распространенным способом графического изображения данных являются диаграммы, которые бывают следующих видов: линейные, радиальные, точечные, плоскостные, объемные, фигурные. Вид диаграмм зависит от вида представляемых данных и задачи построения. В любом случае график обязательно сопровождается заголовком – над или под полем графика. В заголовке указывается, какой показатель изображен, по какой территории и за какое время.

Линейные графики используются для представления количественных переменных: характеристики вариации их значений, динамики, взаимосвязи между переменными. Вариация данных анализируется с помощью полигона распределения , кумуляты (кривой «меньше, чем») и огивы (кривой «больше, чем»). Полигон распределения рассматривается в теме 4 (напр., рис. 5.). Для построения кумуляты значения варьирующего признака откладываются по оси абсцисс, а на оси ординат помещаются накопленные итоги частот или частостей (от f 1 до ∑f ). Для построения огивы на оси ординат помещаются накопленные итоги частот в обратном порядке (от ∑f до f 1 ). Кумуляту и огиву по данным табл. 4. изобразим на рис. 1.

Рис. 1. Кумулята и огива распределения товаров по величине таможенной стоимости

Применение линейных графиков в анализе динамики рассматривается в теме 5 (напр., рис. 13), а использование их для анализа связей – в теме 6 (напр., рис.21). В теме 6 также рассмотрено использование точечных диаграмм (напр., рис. 20).

Линейные графики подразделяются на одномерные , используемые для представления данных по одной переменной, и двумерные – по двум переменным. Примером одномерного линейного графика является полигон распределения, а двумерного – линия регрессии (напр., рис. 21).

Иногда при больших изменениях показателя прибегают к логарифмической шкале. Например, если значения показателя изменяются от 1 до 1000, то это может вызвать затруднения при построении графика. В таких случаях переходят к логарифмам значений показателя, которые не будут столь сильно различаться: lg 1 = 0, lg 1000 = 3.

Среди плоскостных диаграмм по частоте использования выделяются столбиковые диаграммы (гистограммы), на которых показатель представляется в виде столбика, высота которого соответствует значению показателя (напр., рис. 4).

Пропорциональность площади той или иной геометрической фигуры величине показателя лежит в основе других видов плоскостных диаграмм: треугольных , квадратных , прямоугольных . Можно использовать и сравнение площадей круга – в этом случае задается радиус окружности.

Ленточная диаграмма представляет показатели в виде горизонтально вытянутых прямоугольников, а в остальном не отличается от столбиковой диаграммы.

Из плоскостных диаграмм часто используется секторная диаграмма , которая применяется для иллюстрации структуры изучаемой совокупности. Вся совокупность принимается за 100%, ей соответствует общая площадь круга, площади секторов соответствуют частям совокупности. Построим секторную диаграмму структуры внешней торговли РФ в 2006 году по данным табл. 2 (см. рис. 2). При использовании компьютерных программ секторные диаграммы строятся в объемном виде, то есть не в двух, а в трех плоскостях (см. рис. 3).

Рис. 2. Простая секторная диаграмма Рис. 3. Объемная секторная диаграмма

Фигурные (картинные) диаграммы усиливают наглядность изображения, так как включают рисунок изображаемого показателя, размер которого соответствует размеру показателя.

При построении графика одинаково важно все – правильный выбор графического изображения, пропорций, соблюдение правил оформления графиков. Подробнее эти вопросы освещаются в и .

Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений. Они показывают размещение изучаемого явления, его интенсивность на определенной территории – в республике, области, экономическом или административном округе и т.д.. Построение картограмм и картодиаграмм рассматривается в специальной литературе, например .

Конец работы -

Эта тема принадлежит разделу:

Понятие о статистике. Предмет и метод статистики

Понятие о статистике.. предмет и метод статистики.. статистическое наблюдение..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Предмет и метод статистики
В научный обиход термин «статистика» ввел немецкий ученый Готфрид Ахенваль в 1746 году, предложив заменить название курса «Государствоведение», преподававшегося в университетах Германии, на «Ста

Статистическое наблюдение
Люди по-разному относятся к статистической информации: одни не воспринимают ее, другие безоговорочно верят, а третьи согласны с мнением английского политика Дизраэли: «Существует 3 типа лжи: ложь,

Сводка и группировка статистических данных
Сводка – научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных, систематизацию, группиро

Абсолютные величины
Для характеристики массовых явлений статистика использует статистические величины (показатели), которые характеризуют группы единиц или совокупность (явление) в целом. Статистические величин

Относительные величины
Относительная величина – это результат деления (сравнения) двух абсолютных величин. В числителе дроби стоит величина, которую сравнивают, а в знаменателе – величина, с которой сравнивают (ба

Средние величины
Как уже неоднократно было сказано ранее, статистика изучает массовые явления и процессы. Каждое из таких явлений обладает как общими для всей совокупности, так и особенными, индивидуальными свойств

Построение ряда распределения
Признаки, изучаемые статистикой, варьируются (отличаются друг от друга) у различных единиц совокупности в один и тот же период или момент времени. Например, величина внешнеторгового оборота варьиру

Расчет структурных характеристик ряда распределения
При изучении вариации применяются такие характеристики ряда распределения, которые описывают количественно его структуру, строение. Такова, например, медиана – величина варьирующего признака

Расчет показателей размера и интенсивности вариации
Простейшим показателем является размах вариации – абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений (24):

Расчет моментов распределения и показателей его формы
Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называются

Проверка соответствия ряда распределения нормальному
Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов, другим

Проверка соответствия ряда распределения закону Пуассона
Таможенная инспекция провела проверку после выпуска товаров. В результате получен следующий дискретный ряд распределения числа нарушений, выявленных в каждой проверке (табл. 16). Таблица 1

Абсолютные и относительные показатели изменения структуры
Развитие статистической совокупности проявляется не только в количественном росте или уменьшении элементов системы, но также и в изменении ее структуры. Структура – это строение совокупности

Ранговые показатели изменения структуры
Для измерения различий структуры часто используют менее точные, но более простые по расчету показатели, которые основаны на оценки различий не самих значений долей, а их рангов, то есть порядковых

Понятие выборочного наблюдения
Выборочный метод используется, когда применение сплошного на­блюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно. Физическая невозможность имеет ме­сто, на

Способы формирования выборки
1. Собственно случайный отбор: все единицы ГС нумеруются, а выпавшие в результате жеребьевки номера соответствуют единицам, попавшим в выборку, причем число номеров равно запланированному об

Средняя ошибка выборки
После завершения отбора необходимого числа единиц в выборку и регистрации предусмотренных программой наблюдения изучаемых признаков этих единиц, переходят к расчету обобщающих показателей. К ним от

Предельная ошибка выборки
Учитывая, что на основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. В конкретной выборке разность

Необходимая численность выборки
Разрабатывая программу выборочного наблюдения, задаются конкретным значением предельной ошибки и уровнем вероятности. Не­известной остается минимальная численность выборки, обеспечиваю­щая заданную

Методические указания
Задача. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц (таблица 24): Та

Понятие о рядах динамики
Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика. Эта задача решается при помощи анализа рядов динамики (временных рядов).

Показатели изменения уровней ряда динамики
Анализ рядов динамики начинается с определения того, как именно изменяются уровни ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить

Средние показатели ряда динамики
Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщить в виде средних величин. Такие обобщенные (средние) показатели особенно нео

Методы выявления основной тенденции (тренда) в рядах динамики
Одна из основных задач изучения рядов динамики – выявить основную тенденцию (закономерность) в изменении уровней ряда, именуемую трендом. Закономерность в изменении уровней ряда в одних случ

Оценка адекватности тренда и прогнозирование
Для найденного уравнения тренда необходимо провести оценку его надежности (адекватности), что осуществляется обычно с помощью критерия Фишера, сравнивая его расчетное значение Fр

Анализ сезонных колебаний
В рядах динамики, уровни которых являются месячными или квартальными показателями, наряду со случайными колебаниями часто наблюдаются сезонные колебания, под которыми понимаются периодически

Методические указания
По данным ФСГС сальдо внешней торговли (СВТ) России за период 2000-2006 гг. характеризуется рядом динамики, представленным в табл. 36. Таблица 36. Сальдо внешней торговли (СВТ) России за п

Понятие корреляционной зависимости
Один из наиболее общих законов объективного мира – закон всеобщей связи и зависимости между явлениями. Естественно, что, исследуя явления в самых различных областях, статистика неизбежно сталкивает

Методы выявления и оценки корреляционной связи
Для выявления наличия и характера корреляционной связи между двумя признаками в статистике используется ряд методов. 1. Рассмотрение параллельных данных (зна

Коэффициенты корреляции рангов
Коэффициенты корреляции рангов – это менее точные, но более простые по расчету непараметрические показатели для измерения тесноты связи между двумя коррелируемыми признаками. К ним относятся

Особенности коррелирования рядов динамики
Во многих исследованиях приходится изучать динамику нескольких показателей одновременно, т.е. рассматривать параллельно несколько рядов динамики. В этом случае возникает необходимость измерить зави

Показатели тесноты связи между качественными признаками
Метод корреляционных таблиц применим не только к количественным, но и к описательным (качественным) признакам, взаимосвязи между которыми часто приходится изучать при проведении различных социологи

Множественная корреляция
При решении практических задач исследователи сталкиваются с тем, что корреляционные связи не ограничиваются связями между двумя признаками: результативным y и факторным x. В действите

Назначение и виды индексов
Индекс – относительная величина, показывающая во сколько раз уровень изучаемого явления в данных условиях отличается от уровня того же явления в других условиях. Различие условий может прояв

Индивидуальные индексы
Относительная величина, получаемая при сравнении уровней, называется индивидуальным индексом, если не имеет значения структура изучаемого явления. Индивидуальные индексы обозначаются i

Общие индексы
Если изучаемое явление неоднородно и сравнение уровней можно провести только после приведения их к общей мере, экономический анализ выполняют посредством общих индексов. Индекс становится общим

Индексы средних величин
При изучении качественных показателей часто приходится рассматривать изменение во времени (или пространстве) средней величины индексируемого показателя для определенной однородной совкупност

Территориальные индексы
Территориальные индексы применяются для пространственных, межрегиональных сопоставлений различных показателей. Их расчет более сложен, чем расчет традиционных (динамических) индексов, рассмотренных

Молчанов Сергей

Статистика знает всё»,- утверждали Ильф и Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики... Известно, сколько в стране охотников, балерин... станков, велосипедов, памятников, маяков и швейных машинок... Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..» Зачем нужны эти таблицы, как их составлять и обрабатывать, какие выводы на их основании можно делать – на эти вопросы отвечает статистика (от итальянского stato – государство, латинского status – состояние).Статистика - наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни.

Цели работы:Сформировать представление о статистических исследованиях, обработки данных и интерпретации результатов.

Скачать:

Предварительный просмотр:

«Статистика знает всё»,— утверждали Ильф и Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики... Известно, сколько в стране охотников, балерин... станков, велосипедов, памятников, маяков и швейных машинок... Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..» Зачем нужны эти таблицы, как их составлять и обрабатывать, какие выводы на их основании можно делать - на эти вопросы отвечает статистика (от итальянского stato - государство, латинского status - состояние).

Статистика — наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни.

Цели работы:

Сформировать представление о статистических исследованиях, обработки данных и интерпретации результатов.

Сбор статистической информации, обработка и анализ результатов с точки зрения, что математическое образование- необходимый элемент развития.

Задачи работы:

Составить наглядную картину математического образования в классе.

Сформировать представление о возможности описания и обработки данных с помощью различных статистических характеристик.

Управление и прогнозирование дальнейшего развития математического образования..

Гипотеза. Статистика позволяет выявить проблемы математического образования в нашем классе.

Актуальность: Повышение мотивации при обучении математическим наукам, связь с конкретными жизненными ситуациями. Умение сбора, обработки и анализа статистических данных при приведении исследовательской работы.

План:

I. Введение:

История развития статистики.

Статистические характеристики.

II. Исследовательская работа:

Анкета.

Таблица всех данных.

Диаграммы и выводы (размахи, моды, частоты, полигоны частот, среднее арифметическое).

Общий вывод:.

История статистики .

Статистика имеет многовековую историю. Уже в древний период истории человечества хозяйственные и военные нужды требовали наличия данных о населении, его составе, имущественном положении. С целью налогообложения организовывались переписи населения, производился учет земель.

Первая публикация по статистике - это «Книга Чисел» в Библии, в Ветхом Завете, в которой рассказано о переписи военнообязанных, проведенной под руководством Моисея и Аарона.

Впервые термин «статистика» мы находим в художественной литературе - в «Гамлете» Шекспира (1602 г., акт 5, сцена 2). Смысл этого слова у Шекспира - знать, придворные.

Вначале под статистикой понимали описания экономического и политического состояния государства или его части. Например, к 1792 г. относится определение: «статистика описывая состояния государства в настоящее время или в некоторый известный момент в прошлом». В настоящее время деятельность государственных статистических служб вполне укладывается в это определение.

Однако постепенно термин «статистика» стал использоваться более широко. По Наполеону Бонапарту, «статистика - это бюджет вещей». Согласно формулировке 1833 г. «Цель статистики заключается в представлении фактов в наиболее сжатой форме».

Приведем еще два высказывания.

Статистика состоит в наблюдении явлений, которые смогут быть, подчинены или выражены посредством чисел (1895 г.).

Статистика - это численное представление фактов из любой области исследования в их взаимосвязи.

Со временем собирание данных о массовых общественных явлениях приобрело регулярный характер.

С середины XIX в. благодаря усилиям великого бельгийского ученого-математика, астронома и статистика Адольфа Кетле (1796-1874 гг.) были выработаны правила переписей населения и установлена регулярность их проведения в развитых странах. Для координации развития статистики по инициативе А. Кетле проводились международные статистические конгрессы, а в 1885 г. был основан Международный статистический институт, существующий и сейчас.

Становление государственной статистики в России можно отнести к концу XII - началу XIII в., хотя первые переписи земель и населения с постоянно усложнявшейся программой проводились еще в Киевской Руси (IX - XII вв.). Реформы Петра I (1672-1725), которыми были охвачены все основные направления общественной жизни: экономика страны, административное управление, армия, культура и быт населения, а также войны вызывали потребность в полном и точном учете материальных ресурсов и населения. В этот период высший правительственный орган - Сенат - через систему коллегий не только руководил экономикой страны, но и являлся центром по проведению важнейших статистических работ, там собирались полученные материалы обследований, отчеты подведомственных коллегиям производств и заведений, а также местной администрации.

Петровская реформа налоговой системы связана с появлением новой единицы, ею стала «душа» мужского пола, что потребовало подушной переписи населения - ревизии. Первая ревизия была объявлена 26 ноября 1718 г., ревизию проводила армия.

В начале XIII в. в России зарождался и текущий учет населения. Так, в 1702 г. был издан указ о подаче в Патриарший Духовный приказ приходскими священниками недельных ведомостей о родившихся и умерших. В первой половине XIII в. проводились уже переписи рабочих фабрик и мануфактур.

Первая половина XIX в. связана с новым этапом в развитии отечественной статистики. В сентябре 1802 г. в соответствии с Высочайшим манифестом императора Александра I вводится письменная отчетность министерств. Так началось операционно-структурное оформление государственной статистики в России. Этот год принято считать годом рождения российской государственной статистики.

В 1811 г. впервые был создан официальный центр правительственной статистики - Статистическое отделение при Министерстве внутренних дел; сюда поступала отчетность губерний. Первым руководителем Статистического отделения был К.Ф. Герман.

Российские ученые внесли большой вклад в развитие статистической науки. Большое значение, например, имеет работа Д.П. Журавского «Об источниках и употреблении статистических сведений», изданная в 1846 году. Определив статистику как «счет по категориям», Журавский отмечал, что статистика необходима для «изучения всего, относящегося к человеку». Журавский определил важнейшие разделы социальной статистики:

статистика народонаселения - необходимость его исчисления по классам и занятиям;

изучение народного быта, жилища, питания;

статистика театров, клубов, дворянских собраний, народных увеселений;

статистика учреждений, охраняющих права собственности;

статистика нищеты, бедности, сиротства;

статистика самоубийств с указанием средств, причин, званий, возраста и прочих характеристик лиц, лишивших себя жизни.

Во всех предложениях Д.П. Журавский проводил идею как можно более точного и полного выявления дифференциации людей по условиям их жизни, по состоятельности.

Особое место в истории российской статистики принадлежит земской статистике. При земствах, органах местного самоуправления, с середины 70-х годов XIX века были созданы специальные статистические бюро. Земские статистики собирали и разрабатывали огромный статистический материал, который использовался для глубоких экономических и социальных исследований пореформенной России. Работа земской статистики характеризуется не только сбором и разработкой статистических данных, но и развитием статистической методологии.

Видными земскими статистиками были В.И. Орлов, П.П. Червинский, Ф.А. Щербина, А.П. Шликевич.

В 90-х годах были созданы фабрично-заводские инспекции, которые вели текущую статистику, разрабатывали данные по статистике труда, в том числе о составе рабочей силы, несчастных случаях, стачках и др.

Стала развиваться промышленная статистика. Под руководством В.Е. Варзара в 1900, 1908 и 1912 гг. были проведены первые переписи промышленности.

Начальный этап советской статистики (1917-1930 гг.) отличается исключительной интенсивностью: проводится большое число специально организованных, статистических

переписей и обследований, плодотворно работают различные научные коллективы, строится первый баланс народного хозяйства.

Последующее развитие советской статистики тормозилось созданием в 30-е годы административно-бюрократической системы, массовыми репрессиями, в том числе и лучших экономистов и статистиков (Н.Д. Кондратьева, А.В. Чаянова, В.Г. Громана, О.А. Квитнина и многих других).

В это время формируются отраслевые статистики, складывается система объемных показателей, скрывающая негативные тенденции в развитии народного хозяйства. Активно разрабатываются и качественные статистические показатели (индексы производительности труда, себестоимости и др.). Статистика подчиняется решению оперативных задач, оценке выполнения плана в ущерб ее аналитическим функциям.

В годы Великой Отечественной войны перед советской статистикой стояли задачи по оперативному учету трудовых, материальных ресурсов, перемещение производственных сил страны в восточные районы.

После войны роль и значение статистики возросли: развернулись балансовые работы, углубилась теория индексного метода и расширилась практика его применения, получили распространение экономико-математические модели и методы, развитие прикладной статистики.
Слово «статистика» часто ассоциируется со словом «математика», и это пугает студентов, связывающих это понятие со сложными формулами, требующими высокого уровня абстрагирования.

Однако, как говорит Мак-Коннелл, статистика — это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой. Хотим ли мы спланировать бюджет, рассчитать потребление бензина автомашиной, оценить усилия, которые потребуются для усвоения какого-то курса, с учетом полученных до сих пор отметок, предусмотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее, — нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с другими данными так, чтобы можно было сделать выводы, позволяющие принять верное решение.

Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования и состоят в синтезе данных, полученных на различных группах объектов в том или ином эксперименте, в их сравнении с целью выяснить черты различия между ними, в их сопоставлении с целью выявить показатели, изменяющиеся в одном направлении, и, наконец, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науках вообще, особенно в гуманитарных. В последних нет ничего абсолютно достоверного, и без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях.

Для того чтобы оценить огромные преимущества, которые может дать статистика, мы попробуем проследить за ходом расшифровки и обработки данных, полученных в эксперименте. Тем самым, исходя из конкретных результатов и тех вопросов, которые они ставят перед исследователем, мы сможем разобраться в различных методиках и несложных способах их применения. Однако, перед тем как приступить к этой работе, нам будет полезно рассмотреть в самых общих чертах три главных раздела статистики.

1. Описательная статистика, как следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков

2. Задача индуктивной статистики — проверка того, можно ли распространить результаты, полученные на данной выборке, на всю популяцию, из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции обобщить на большее число объектов ту или иную закономерность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помощи индуктивной статистики делают какие-то выводы и обобщения, исходя из данных, полученных при изучении выборки.

3. Наконец, измерение корреляции позволяет узнать, насколько связаны между собой две переменные, с тем чтобы можно было предсказывать возможные значения одной из них, если мы знаем другую.

Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность — это наиболее широко применяемые параметрические методы, в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность — это непараметрические методы, оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения как расчетов, так и применения. Когда мы познакомимся с различными способами описания данных и перейдем к их статистическому анализу, мы рассмотрим обе эти разновидности.

  1. Модой называют число ряда, которое встречается в этом ряду наиболее часто. Можно сказать, что данное число самое «модное» в этом ряду.
  2. Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. Среднее арифметическое является важной характеристикой ряда чисел но иногда полёзно рассматривать и другие средние
  3. Одним из статистических показателей различия или разброса данных является размах.

Размах — это разность между наибольшим и наименьшим значениями ряда данных.

Медианой ряда, состоящего из нечетного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить. Медианой ряда, состоящего из четного количества чисел, называется среднее арифметическое двух стоящих посередине чисел этого ряда.

Eсть более удобный способ нахождения среднего арифметического, а также других статистических характеристик — составление таблицы частот.

Виды и способы статистического наблюдения .

Статистическое наблюдение различается по видам и по источникам сведений.

Виды статистического наблюдения.

Систематическое наблюдение - текущее: наблюдение проводится на основе первичных документов, содержащих информацию, необходимую для достаточно полной характеристики изучаемого явления.

Статистическое наблюдение - периодическое. Примером может служить перепись населения.

Наблюдение, проводимое время от времени - единовременным.

Виды статистического наблюдения могут быть сплошными и не сплошными.

Сплошным называется наблюдение, учитывающее все без единицы изучаемой совокупности.

Не сплошное наблюдение ориентируется на учет некоторой достаточно массовой части единиц наблюдения.

В статистической практике применяются различные виды не сплошного наблюдения:

выборочное;

способ основного массива;

анкетное;

монографическое.

Качество не сплошного наблюдения уступает результатам сплошного.

Для получения представительной характеристики всей статистической совокупности по некоторой части ее единиц применяют выборочное наблюдение, основанное на научных принципах формирования выборочной совокупности. Случайный характер отбора единиц совокупности гарантирует беспристрастность результатов выборки.

Способы статистического наблюдения .

В зависимости от источников собираемых сведений различают наблюдение:

непосредственное,

документальное

опрос.

Непосредственным называют наблюдение, осуществляемое путем подсчета, измерения значений признаков, снятия показаний приборов специальными лицами, осуществляющими наблюдениями, иначе говоря - регистраторами.

Документальное наблюдение - это такое наблюдение, когда запись ответа на вопросы формуляра наблюдения производится на основании соответствующих документов.

Опрос - это наблюдение, при котором ответы на вопросы формуляра наблюдения записываются со слов опрашиваемого.

Сбор и группировка статистических данных.

Для изучения различных общественных и социально-экономических явлений, а также некоторых процессов, происходящих в природе, проводятся специальные статистические исследования. Всякое статистическое исследование начинается с целенаправленного сбора информации об изучаемом явлении или процессе. Этот этап называется этапом статистического наблюдения.

Для обобщения систематизации данных, полученных в ходе статистического наблюдения, их по какому-либо признаку разбивают на группы, и результаты группировки сводят в таблицы.

Наглядное представление статистической информации.

Для наглядного представления данных, полученных в результате статистического исследования, широко используются различные способы их изображения.

Одним из хорошо известных вам способов наглядного представления ряда данных является построение столбчатой диаграммы.

Столбчатые диаграммы используют тогда, когда хотят проиллюстрировать динамику изменения данных во времени или распределение данных, полученных в результате

Для наглядного изображения соотношения между частями исследуемой совокупности удобно использовать круговые диаграммы.

Для построения круговой диаграммы круг разбивается на секторы, центральные углы которых пропорциональны относительным частотам, определенным для каждой группы данных.

Динамику изменения статистических данных во времени часто иллюстрируют с помощью полигона. Для построения полигона отмечают в координатной плоскости точки, абсциссами которых служат моменты времени, а ординатами - соответствующие им статистические данные. Соединив последовательно эти точки отрезками, получают ломанную, которую называют полигоном.

Одна из основных задач статистики как раз и состоит в надлежащей обработке информации. Конечно, у статистики есть много других задач: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т. д. Ни одна из этих целей не достижима без обработки данных. Поэтому, первое, чем стоит заняться — это статистическими методами обработки информации.

В нашем классе решили выяснить, каков уровень знаний по теме «Решение систем линейных уравнений с двумя переменными», для чего составили специальную контрольную работу из шести заданий

В алфавитном списке учеников возле каждой фамилии проставили число верно решенных задач. Получился следующий ряд чисел:

Ф.И.

Кол-во задач

Агафонова Л

Башаров а

Гуселетов Д

Дармаева К

Коневин В

Коротков В

Криволапова М

Мисюркеев А

Мисюркеев В

Минеева Д

Михайлов А

Молчанова О

Молчанов С

Наумов С

Попов с

Постникова М

Реховская Ю

Сатаева Н

Тереньтьева Т

Ушакова Л

Чагдурова Н

ТОлстихин С

Разуваев А

Ангельский м

На основании этого ряда трудно сделать какие-либо определенные выводы о том, как справились с работой. Чтобы удобнее было анализировать информацию, в подобных случаях числовые данные ранжируют, располагая их в порядке возрастания. В результате ранжирования ряд примет такой вид:

2; 2;

3; 3; 3; 3;

4; 4; 4; 4; 4; 4

5; 5; 5;5;5;5

6; 6; 6; 6;

Мы видим, что ряд разбился на 6 групп. Каждая группа представляет определенный результат эксперимента: решена одна задача, решены две задачи и т. д.

В нашей выборке частота появления события «семиклассник решил одну задачу» равна 1. Относительная частота этого события равна отношению его частоты к объему выборки, т. е. 1:23, или4,3 %. Для события «девятиклассник решил все задачи» частота равна 4, а относительная частота равна 4:23—, или 17,4%, и т. д.

Чтобы результаты легче воспринимались, их представляют в табличном и графическом виде.

………

Составив таблицу, полезно себя проверить: сложив все частоты, мы должны получить объем выборки, т. е. число 50, а сложив все относительные частоты, мы должны получить 100%.

Для графического представления данных на основе этой таблицы построим диаграмму частот.

С помощью ранжирования ряда, таблицы и графических иллюстраций мы уже получили первоначальные сведения о закономерностях интересующего нас ряда данных. Но вам известны такие статистические характеристики ряда данных, которые позволяют сделать более качественный статистический анализ.

Так, например, интересно знать наиболее типичный результат выполнения предложенной работы. Используя представленные в таблице данные, легко видеть, что наиболее часто встречающийся результат — «решены три задачи». Как вы знаете, на языке статистики это означает, что число 4 является модой данного числового ряда.

Также полезно найти среднее арифметическое этого ряда:

(1+2*2+3*4+4*6+5*6+6*4+:23=4.2Значит, можно сказать, что в среднем девятиклассник решает четыре задачи. (В данном случае среднее арифметическое ряда данных совпало с его модой, но, конечно, это происходит совсем не всегда.)

Этапы статистического исследования

К этапам статистического исследования относятся:

Статистическое наблюдение - массовый научно организованный сбор первичной информации об отдельных единицах изучаемого явления.

Группировка и сводка материала - обобщение данных наблюдения для получения абсолютных величин (учетно-оценочных показателей) явления.

Обработка статистических данных и анализ результатов для получения обоснованных выводов о состоянии изучаемого явления и закономерностях его развития.

Все этапы статистического исследования тесно связаны друг с другом и одинаково важны. Недостатки и ошибки, возникающие на каждой стадии, сказываются на все исследовании в целом. Поэтому правильное использование специальных методов статистической науки на каждом этапе позволяет получить достоверную информацию в результате статистического исследования.Методы статистического исследования:

Статистическое наблюдение;

Сводка и группировка данных;

Расчет обобщающих показателей (абсолютные, относительные и средние величины);

Статистические распределения (вариационные ряды);

Выборочный метод;

Корреляционно-регрессионный анализ;

Ряды динамики;

Индексы.

Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности. Можно выделить две основные задачи математической статистики:

Указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате поставленных экспериментов.

Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

М Этапы выполнения исследовательской работы:

I. Сбор данных.

Включает в себя:

Изучение поставленной задачи.

Определение значимых понятий.

Подбор источников информации.

Сбор информации.

II. Группировка данных.

Включает в себя:

Разделение данных в группы по признаку.

Построение таблицы данных.

III. Анализ данных.

Включает в себя:

Нахождение статистических характеристик.

Обобщение полученных результатов.

IV. Отчет.

Мы провели исследование в 7»а»и «б» классах о необходимости изучения математики.

Сбор данных: учащимся школы была предложена для заполнения анкета. /Приложение 1/

Группировка данных: по данным анкетирования была составлена таблица. /Приложение 2/

Анализ данных: результаты приведенные в таблице были представлены в виде диаграмм. /Приложение 3/

……

Обработанные данные можно использовать:

Для работы классных руководителей с семьей.

Для практического применения на уроках математики..

Для руководителей школы.

Литература:

Экономическая статистика. «Учебник», 2-е издание дополненное. Рекомендовано Министерством общего и профессионального образования РФ. Москва. ИНФРА-М. 2006 г. Авторы: Ю. Н. Иванов; С. Е. Казаринова и др. Под редакцией Ю. Н. Иванова, Доктора экономических наук.

Б.С.Э. Компьютерное издание 2006 г.

Республика Коми в России. Госкомстат России. Госкомстат Р.К. 2007 г.

Сыктывкар в цифрах. Госкомстат Р. К. 2007 г.

Типичная оценка (мода): 4 Позиция 2. Досуг учащихся

(Что чаще всего делают дети в свободное от уроков время)

Таблица социологического опроса

Занятия

Английский яз.

Компьютерные игры

Читают книги

Смотрят телевизор

Дзюдо (секция)

Волейбол (секция)

гуляют на улице

Кол-во учащихся

https://accounts.google.com


Подписи к слайдам:

в ыполнил:Молчанов Сергей 7»Б» Руководитель: Телешева Л.А.-учитель математики МОУ «Баргузинская сош» Статистические характеристики и исследования

Статистика знает все « Stato »-государство « Status »-состояние Статистика - наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни.

Сформировать представление о статистических исследованиях, обработки данных и интерпретации результатов. Сбор статистической информации, обработка и анализ результатов с точки зрения математического образования- необходимый элемент развития. цель исследования:

Составить наглядную картину математического образования в классе. Сформировать представление о возможности описания и обработки данных с помощью различных статистических характеристик. Управление и прогнозирование дальнейшего развития математического образования.. Задачи:

Статистика позволяет выявить проблемы математического образования в нашем классе. Гипотеза

: Повышение мотивации при обучении математическим наукам; связь с конкретными жизненными ситуациями: умение сбора, обработки и анализа статистических данных при приведении исследовательской работы. Актуальность

План: История статистики. Статистические характеристики. Исследование на тему: «Необходимость предметов математического цикла». Исследование на тему: «Любимое занятие в свободное время».

Первая публикация по статистике – это «Книга Чисел» в Библии, в Ветхом Завете, в которой рассказано о переписи военнообязанных, проведенной под руководством Моисея и Аарона.

Впервые термин «статистика» мы находим в художественной литературе – в «Гамлете» Шекспира (1602 г., акт 5, сцена 2). Смысл этого слова у Шекспира – знать, придворные.

статистика - это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. Мак-Коннелл

Разделы статистики описательная индуктивная корреляция

Основные статистические характеристики Среднее арифметическое Мода Размах Медиана

Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. Модой обычно называется число ряда, которое встречается в этом ряду наиболее часто.

Размах – это разность наибольшего и наименьшего значений ряда данных. Медианой – ряда, состоящего из нечётного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить.

Виды статестического наблюдения Систематическое Статестическое(периодическое) Единовременное Сплошное Несплошное

№ Ф.И. Количество верно выполненных заданий 1 Агафонова Люда 3 2 Башаров Анлрей 6 3 Гуселетов Дима 4 4 Дармаева Ксения 4 5 Коневин Виталий 6 6 Коротков Володя 2 7 Криволапова Маша 5 8 Мисюркеев Алеша 3 9 Мисюркеев Володя 3 10 Минеева Даша 5 11 Михайлов А 5 12 Молчанова Оля 5 13 Молчанов С 6 14 Наумов П 6 15 Попов С 4 16 Постникова М 4 17 Реховская Юля 3 18 Сатаева Настя 5 19 Терентьева Таня 5 20 Ушакова Лена 5 21 Чагдурова Наташа 4 22 Толстихин Андрей 1 23 Разуваев Алеша 2 24 Ангельский Миша 4 Результат контрольной работы по теме "Решение систем линейных уравнений с двумя переменными"

Рассмотрим ряд чисел 3 6 4 4 6 2 5 3 3 5 5 5 6 6 4 4 3 5 5 5 4 1 2 4

В результате ранжирования ряд примет вид: 1; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4 5; 5; 5;5;5;5 6; 6; 6; 6;

Относительная частота события Мода 4 Медиана 4 Размах от 1 до 6 Среднее арифметическое (1+2*2+3*4+4*6+5*4+6*4):23=4,3

I. Сбор данных.: Изучение поставленной задачи. Определение значимых понятий. Подбор источников информации. Сбор информации. Анализ данных: результаты приведенные в таблице были представлены в виде диаграмм. II. Группировка данных. Разделение данных в группы по признаку. Построение таблицы данных. III. Анализ данных. Нахождение статистических характеристик. Обобщение полученных результатов. IV. Отчет.

Необходимость изучения математики исследование №1

Какой школьный предмет нравится больше всего? _________________- Какой школьный предмет лёгок в изучении? ______________________ Какой предмет труднее всего дается в изучении? __________________ Сколько часов в день вы тратите на приготовление домашнего задания?_____________________________________________________ Нравится ли вам математика?___________________________________ Нужна ли вам математика в будущем? ____________________________ Нужна ли Вам помощь при выполнении домашних заданий по предметам математического цикла?_______________________________________________________ Как Вы оцениваете свои знания по математике? Имею отметку___________________… Знаю на_______________________….. Могу на…________________________ Что является, на Ваш взгляд, причиной неуспехов или неудач, если они случаются?________________________________________ __________________________________________________________Хотите ли Вы улучшить свои результаты по предметам математического цикла?____________________________________ _________________________________________________________

Вопрос 1 Какой школьный предмет нравится более всего?

Вопрос 2 Какой школьный предмет самый трудный в изучении?

Вопрос 3 Сколько всего времени тратите на выполнение домашнего задания по математике?

Вопрос 4 Нравится ли тебе заниматься изучением математики?

Нужна ли математика в будущей вашей профессии? Да -100%

Нужна ли тебе помощь при выполнении домашнего задания по математике

Кто тебе помогает разобрать трудную тему по математике? Мама -45% Учитель-35 % Учебник -20% Папа-15% Бабушк10% Сестра-10% Друзья-5% Никто-5%

Как ты оцениваешь свои знания по математике?

Хочешь ли заниматься по математике еще лучше

Мотивация учебной деятельности исследование №3

Вид деятельности Ежедневно Несколько раз в неделю В воскресенье 1 Читаю газеты и журналы 2 Читаю художественную литературу 5 Хожу на вечера отдыха 6 Смотрю кино передачи 7 Играю в спортивные игры 8 Занимаюсь общественной работой 9 Занимаюсь охотой, рыбалкой

11 Занимаюсь художественной самодеятельностью 12 Хожу в походы 13 Занимаюсь радиоделом 14 Занимаюсь шитьём, рукоделием 15 Учусь играть на музыкальном инструменте 16 Слушаю музыку, делаю записи 17 Увлекаюсь коллекционированием 18 Увлекаюсь танцами, хожу на дискотеки 19 Люблю что-нибудь изготовить своими руками 20 Вожусь с животными

21 В свободное время помогаю родителям 22 Провожу время безо всякой цели 23 В свободное время работаю 24 (Если занят в свободное время ещё чем-то, допиши здесь!)

Ежедневно

Несколько раз в неделю

В воскресенье

Вывод: Таким образом, ученики нашего класса ежедневно чаще всего слушают музыку, помогают родителям, смотрят телевизор,; несколько раз в неделю - занимаются спортом и делают что-нибудь своими руками,; в воскресенье – читают и играют на компютере, смотрят телевизор

Заключение: И так, на примере моей исследовательской работы вы убедились, что статистические характеристики и исследования играют значительную роль в нашей жизни и используются не только в математике, но и в других отраслях науки.

Спасибо за внимание

Экономическая журналистика Шевчук Денис Александрович

1.5. Положение о порядке представления статистической информации, необходимой для проведения государственных статистических наблюдений

1.5. Положение о порядке представления

статистической информации, необходимой для проведения

государственных статистических наблюдений

I. Общие положения

1. Настоящее положение разработано в соответствии с Федеральным законом от 30 декабря 2001 года № 195-ФЗ «Кодекс Российской Федерации об административных правонарушениях» (Собрание законодательства Российской Федерации, 2002, № 1, ч.1, ст.1), Федеральным законом от 20 февраля 1995 года № 24-ФЗ «Об информации, информатизации и защите информации» (Собрание законодательства Российской Федерации, 1995, № 8, ст. 609), статьей 3 Закона Российской Федерации от 13 мая 1992 года № 2761-1 «Об ответственности за нарушение порядка представления государственной статистической информации» (Ведомости Съезда народных депутатов Российской Федерации и Верховного Совета Российской Федерации, 1992, № 27, ст.1556), Положением о Государственном комитете Российской Федерации по статистике, утвержденным постановлением Правительства Российской Федерации от 2 февраля 2001 года № 85 (Собрание законодательства Российской Федерации, 2001, № 7, ст.652).

2. Положение регламентирует порядок представления статистической информации, необходимой для проведения государственных статистических наблюдений, юридическими лицами, их филиалами и представительствами, гражданами, занимающимися предпринимательской деятельностью без образования юридического лица (отчитывающимися субъектами).

3. Государственное статистическое наблюдение осуществляется путем сбора от отчитывающихся субъектов статистической информации (первичных статистических данных по формам государственного статистического наблюдения (государственной статистической отчетности) в виде документированной информации) в целях формирования сводной официальной статистической информации о социально-экономическом и демографическом положении страны.

4. Официальная статистическая информация, являющаяся частью государственных информационных ресурсов о социально-экономическом и демографическом положении страны, формируется в соответствии с федеральной программой статистических работ, ежегодно разрабатываемой Госкомстатом России на основе предложений федеральных органов исполнительной власти, органов исполнительной власти субъектов Российской Федерации и других пользователей статистической информации и вносимой в Правительство Российской Федерации.

5. Статистическая информация, необходимая для проведения государственных статистических наблюдений, формируется в соответствии с официальной статистической методологией.

Официальная статистическая методология, утверждаемая Госкомстатом России, является обязательной для федеральных органов исполнительной власти, органов государственной власти субъектов Российской Федерации и местного самоуправления, юридических лиц, их филиалов и представительств, граждан, занимающихся предпринимательской деятельностью без образования юридического лица, при проведении государственных статистических наблюдений.

6. В целях реализации федеральной программы статистических работ Госкомстат России утверждает формы государственных статистических наблюдений (государственной статистической отчетности), порядок их заполнения и представления.

Формы государственного статистического наблюдения утверждаются Госкомстатом России для сбора и обработки статистической информации в системе Госкомстата России (централизованные), а также для сбора и обработки статистической информации в системе других федеральных органов исполнительной власти в соответствии с предметом их ведения (нецентрализованные).

7. Единые требования к оформлению и построению форм государственного статистического наблюдения устанавливаются Госкомстатом России в отраслевом (ведомственном) стандарте на формуляр-образец государственного статистического наблюдения.

8. Госкомстат России и другие федеральные органы исполнительной власти, осуществляющие сбор и обработку статистической информации, обеспечивают отчитывающиеся субъекты бланками форм государственного статистического наблюдения и инструкциями по их заполнению.

II. Порядок представления статистической информации, необходимой для проведения государственных статистических

наблюдений

9. Юридические лица, их филиалы и представительства, граждане, занимающиеся предпринимательской деятельностью без образования юридического лица, обязаны представлять в Госкомстат России, его территориальные органы и находящиеся в его ведении организации, а также другие федеральные органы исполнительной власти, ответственные за выполнение федеральной программы статистических работ, их территориальные органы и подведомственные организации статистическую информацию, необходимую для проведения государственных статистических наблюдений, по формам государственного статистического наблюдения на безвозмездной основе.

10. Основными требованиями при представлении статистической информации, необходимой для проведения государственных статистических наблюдений, являются полнота, достоверность, своевременность.

11. Состав и методология исчисления показателей, круг субъектов, представляющих статистическую информацию, адреса, сроки и способы ее представления, которые указываются на бланках форм государственного статистического наблюдения и в инструкциях по их заполнению, являются обязательными для всех отчитывающихся субъектов.

12. Ответственным за представление статистической информации, необходимой для проведения государственных статистических наблюдений (соблюдение порядка ее представления, а равно представление достоверной статистической информации), является руководитель организации, ее филиала и представительства, а также лицо, занимающееся предпринимательской деятельностью без образования юридического лица.

13. Формы государственного статистического наблюдения подписываются руководителем организации, ее филиала и представительства (в случае его отсутствия – лицом, его замещающим), лицом, занимающимся предпринимательской деятельностью без образования юридического лица.

14. Статистическая информация по формам государственного статистического наблюдения может быть представлена отчитывающимися субъектами непосредственно или передана через их представителей, направлена в виде почтового отправления с описью вложения или передана по телекоммуникационным каналам связи.

15. Статистическая информация составляется, хранится и представляется отчитывающимися субъектами по установленным формам государственного статистического наблюдения на бумажных носителях. В электронном виде статистическая информация может представляться отчитывающимся субъектом, при наличии у него соответствующих технических возможностей и по согласованию с территориальным органом (организацией) Госкомстата России.

16. Статистическая информация, представленная в Госкомстат России, его территориальные органы и находящиеся в его ведении организации в электронном виде, в обязательном порядке подтверждается копией на бланке формы в течение месяца с момента передачи статистической информации. При этом должны быть обеспечены следующие требования: идентичность статистической информации, представляемой отчитывающимися субъектами в электронном виде, с бумажным носителем; соблюдение структуры файлов, установленной отчитывающимся субъектам территориальным органом или находящейся в ведении Госкомстата России организацией. При невыполнении указанных требований статистическая информация считается непредставленной.

17. Датой представления статистической информации по формам государственного статистического наблюдения считается дата отправки почтового отправления с описью вложения или дата ее отправки по телекоммуникационным каналам связи либо дата фактической передачи по принадлежности.

18. В случае, если последний день срока представления статистической информации отчитывающимися субъектами по формам государственного статистического наблюдения приходится на нерабочий день, днем окончания срока представления отчетности отчитывающимися субъектами считается ближайший следующий за ним рабочий день.

19. Территориальные органы и находящиеся в ведении Госкомстата России организации обязаны по просьбе отчитывающегося субъекта проставить отметку на копии полученной ими формы государственного статистического наблюдения о принятии и дату ее представления, или при получении статистической информации по телекоммуникационным каналам связи передать отчитывающемуся субъекту квитанцию о приемке в электронном виде.

20. Представлением недостоверной статистической информации считается неправильное отражение отчетных статистических данных в формах государственного статистического наблюдения вследствие нарушения действующих инструкций по заполнению форм государственного статистического наблюдения, арифметических или логических ошибок.

21. Отчитывающиеся субъекты, допустившие факты представления недостоверной статистической информации, не позднее трехдневного срока после обнаружения этих фактов представляют исправленную статистическую информацию территориальным органам и находящимся в ведении Госкомстата России организациям и другим органам и организациям, указанным в адресной части форм, с копиями документов, содержащих обоснования для внесения исправлений.

22. При выявлении федеральными органами исполнительной власти, ответственными за выполнение федеральной программы статистических работ, и их территориальными органами фактов нарушения порядка представления статистической информации, необходимой для проведения государственных статистических наблюдений, представления недостоверной статистической информации, они могут при необходимости вносить в Госкомстат России и его территориальные органы предложения о привлечении нарушителей к административной ответственности.

23. При реорганизации или ликвидации юридического лица, его филиалов или представительств, прекращении деятельности индивидуального предпринимателя в территориальные органы и находящиеся в ведении Госкомстата России организации представляется статистическая информация по формам государственного статистического наблюдения: годовым – за период деятельности в отчетном году до момента ликвидации (прекращения деятельности); текущим (месячным, квартальным, полугодовым и пр.) – за период деятельности в отчетном периоде до момента ликвидации (прекращения деятельности).

III. Защита статистической информации, необходимой для проведения государственных статистических наблюдений

24. Статистическая информация, представляемая юридическими лицами, их филиалами и представительствами, гражданами, занимающимися предпринимательской деятельностью без образования юридического лица, для проведения государственных статистических наблюдений в зависимости от характера содержащихся в ней сведений может быть открытой и общедоступной или отнесенной в соответствии с законодательством к категории ограниченного доступа.

25. Госкомстат России обеспечивает в пределах своей компетенции защиту статистической информации, в том числе сведений, составляющих государственную или иную охраняемую законом тайну, и сведений конфиденциального характера, разрабатывает перечень сведений конфиденциального характера, получаемых при проведении государственных статистических наблюдений, и порядок их предоставления пользователям.

26. Госкомстат России гарантирует отчитывающимся субъектам конфиденциальность полученной от них статистической информации по формам государственного статистического наблюдения (первичных статистических данных) и предусматривает соответствующую запись об обеспечении гарантии на бланках форм.

Предоставление статистической информации, содержащейся в формах государственного статистического наблюдения (первичных статистических данных), кроме отнесенной к государственной тайне, Госкомстатом России, его территориальными органами и находящимися в его ведении организациями третьим лицам осуществляется при наличии письменного согласия представивших эти данные отчитывающихся субъектов, за исключением случаев, предусмотренных законодательством.

Предоставление статистической информации, содержащейся в формах государственного статистического наблюдения (первичных статистических данных), которая отнесена к государственной

тайне, осуществляется Госкомстатом России, его территориальными органами и находящимися в его ведении организациями в порядке, установленном Законом Российской Федерации от 21 июля 1993 года № 5485-1 «О государственной тайне» (Собрание законодательства Российской Федерации, 1997, № 41, ст.4673).

IV. Ответственность за нарушение порядка представления статистической информации, необходимой для проведения государственных статистических наблюдений

27. Нарушение должностным лицом, ответственным за представление статистической информации, необходимой для проведения государственных статистических наблюдений, порядка ее представления, а равно представление недостоверной статистической информации влечет наложение административного штрафа в соответствии со статьей 13.19 Кодекса Российской Федерации об административных правонарушениях.

28. Производство дел об административных правонарушениях порядка представления статистической информации, необходимой для проведения государственных статистических наблюдений, и исполнение назначенных административных наказаний осуществляется в порядке, установленном Кодексом Российской Федерации об административных правонарушениях.

29. Отчитывающиеся организации возмещают в установленном порядке Госкомстату России, его территориальным органам и находящимся в его ведении организациям ущерб, возникший в связи с необходимостью исправления итогов сводной отчетности при представлении искаженных данных или нарушении сроков представления отчетности, в соответствии со статьей 3 Закона Российской Федерации от 13 мая 1992 года № 2761-1 «Об ответственности за нарушение порядка представления государственной статистической отчетности».

Из книги Экономическая журналистика автора Шевчук Денис Александрович

1.3. О доступе к информации, находящейся в распоряжении государственных ведомств Рекомендация № R (81) 19 Комитета министров государств-членов(Принято Комитетом министров 25 ноября 1981 г. на 340-й сессии заместителей министров)Комитет министров, исходя из положений статьи 15.b

Из книги Большая Советская Энциклопедия (НА) автора БСЭ

1.6. Доступ к статистической информации расширяется. Но существующее законодательство не позволяет повысить ее качество Статистическая информация давно уже стала значимым ресурсом, необходимым для решения экономических и социальных задач, формирования государственной

Из книги Большая Советская Энциклопедия (СТ) автора БСЭ

Из книги Маркетинг услуг. Настольная книга российского маркетолога практика автора Разумовская Анна

Из книги Ответы на экзаменационные билеты по эконометрике автора Яковлева Ангелина Витальевна

Из книги Наградная медаль. В 2-х томах. Том 2 (1917-1988) автора Кузнецов Александр

Из книги Оперативно-розыскная деятельность: Шпаргалка автора Автор неизвестен

19. Понятие статистической гипотезы. Общая постановка задачи проверки статистической гипотезы Проверка статистических гипотез – это один из основных методов математической статистики, который используется в эконометрике.С помощью методов математической статистики

Из книги Гражданский кодекс РФ автора ГАРАНТ

Из книги Борьба с вертолетами автора Белов Михаил Ипатович

Из книги Энциклопедия юриста автора

Из книги Главные спортивные события – 2012 автора Яременко Николай Николаевич

5. Развитие необходимой учебно-материальной базы Для выполнения задач подготовки подразделений к противовертолетной борьбе, а также в целях интенсификации обучения и поддержания постоянной боевой готовности возникает необходимость в соответствующем дополнении

Из книги История государства и права России автора Пашкевич Дмитрий

Превышение пределов необходимой обороны ПРЕВЫШЕНИЕ ПРЕДЕЛОВ НЕОБХОДИМОЙ ОБОРОНЫ - согласно ч. 3 ст. 37 УК умышленные действия, явно не соответствующие характеру и степени общественной опасности посягательства. Это не означает равенства по интенсивности посягательства

Из книги МСФО. Шпаргалка автора Шредер Наталия Г.

Десять любопытных статистических фактов Хуже не будет, если вооружиться парочкой статистических фактов, перед стартовым свистком 8 июня.Топ 10 бомбардиров Чемпионатов Европы Евро 2012. Лучшие бомбардиры квалификации Евро 2012. Лучшие ассистенты квалификации Последние

Из книги автора

4. Государственный строй Древнерусского государства. Система государственных органов власти Древней Руси. Правовое положение населения Киевской Руси Древнерусское государство было монархией, во главе которой стоял великий князь. Ему принадлежала верховная

§1.Понятия статистики, статистическая закономерность и совокупность..... 2

§2. Признаки единиц статистической совокупности, их классификация...... 2

§1. Понятие статистического наблюдения, его подготовка...................... 4

§2. Виды статистического наблюдения................................................. 5

§3. Ошибки наблюдения................................................................... 6

§4. Сводка и группировка................................................................ 6

§5. Виды статистических группировок............................................... 6

§6. Статистические таблицы............................................................ 7

§7. Статистические графики............................................................ 8

§1. Фактическое и теоретическое распределение............................ 21

§2. Кривая нормального распределения......................................... 21

§3. Проверка гипотезы о нормальном распределении....................... 21

§4. Критерии согласия: Пирсона, Романовского, Колмогорова........... 21

§5. Практическое значение моделирования рядов распределения..... 22

§1. Понятие выборочного наблюдения. Причины его применения...... 23

§3. Ошибки выборочного наблюдения........................................... 24

§4. Задачи выборочного наблюдения.......................................... 25

§5. Распространение данных выборочного наблюдения на генеральную совокупность... 26

§6. Малая выборка................................................................ 26

§1. Понятие корреляционной связи и КРА.................................. 27

§2. Условия применения и ограничения КРА.............................. 27

§3. Парная регрессия на основе метода наименьших квадратов.. 28

§4. Применение парного линейного уравнения регрессии.......... 29

§6. Множественная корреляция........................................... 32


Тема 1.: Введение в статистику.

  1. понятия статистики, статистическая закономерность и совокупность.
  2. признаки единиц статистической совокупности, их классификация.
  3. предмет и метод статистики.

§1.Понятия статистики, статистическая закономерность и совокупность.

Слово статистика происходит от латинского “status ” в переводе – состояние, положение вещей.

Термин статистика возник во 2 ой половине 18 века. В связи с познанием государств, изучением их особенности. К этому же времени относится начало преподавания статистики в университете. В зависимости от отрасли статистического исследования различают: статистику населения, промышленности, с/х и т.д. - прикладная статистика.

Общая теория статистики – совокупность методов и приемов по сбору, обработке, представлению и анализу числовых данных. Термин статистика в наши дни употребляется в 3 х значениях:

  1. как синоним слова «данные»
  2. отрасль значений объединяющая принципы и методы работы с числовыми данными характеризующими массовые явления (продолжительность жизни мужчин ниже чем женщин)
  3. отрасль практической деятельности направленной на обработку и анализ числовых данных.

Статистика позволяет выявить и измерить закономерность развития социально-экономических процессов и явлений, а также взаимосвязи между ними в конкретных условиях места и времени.

Под закономерностью понимается повторяемость, последовательность и порядок изменений в явлениях.

Статистическая закономерность – закономерность в которой необходимость неразрывно связанном в каждом отдельном явлении со случайностью и лишь во множестве явлений проявляет себя как закон. Понятию статистической закономерности противостоит понятие динамической закономерности проявляющейся в каждом явлении. (пример: S круга =pr 2 чем > r тем > S круга). Объектом статистического исследования является статистическая совокупность – множество единиц обладающих массовостью, однородностью, определяемой целостностью и наличием вариации. Каждый отдельно взятый элемент называется – единицей статистической совокупности (ЕСС)

§2. Признаки единиц статистической совокупности, их классификация.

ЕСС обладают определенными свойствами которые называются признаками. Статистика изучает явления через их признаки, чем более однородна совокупность тем больше общих признаков имеют ее единицы и тем меньше варьируют значения этих признаков.

Описательный признак – признак, который может быть выражен только словесно.

  1. Количественный признак – признак, который может быть выражен численно.
  2. Прямой признак – свойство непосредственно присуще характерному объекту.
  3. Косвенный признак – свойства не самого характеризуемого объекта, а объекта связанного с ним либо входящих в него.
  4. первичный признак – абсолютная величина, может быть измерен.
  5. вторичный признак – результат сопоставления первичных признаков, он измеряется непосредственно.
  6. натуральный признак – измеряется в штуках, кг, тоннах, литрах и т.д.
  7. трудовой признак – измеряется в человеко-днях, человеко-часах.
  8. стоимостной признак - измеряется в рублях, $, €, ₤.
  9. безразмерный признак – измерение в долях, %
  10. альтернативный признак – признак, который принимает только одно значение из нескольких возможных.
  11. дискретный признак – принимает только целое значение, без промежуточного.
  12. непрерывный признак – признак, принимающий любые значения в определенном диапазоне.
  13. факторный признак – признак, под действием которого изменяется другой признак.
  14. результативный признак – признак, который изменяется под признаком другого
  15. моментный признак – признак, измеренный на определенный момент времени.
  16. интервальный признак – признак за определенный интервал времени.

Один и тот же признак может быть классифицирован одновременно по разным классификациям.

§3. Предмет и метод статистики .

Предметом статистического исследования являются статистические совокупности – множество одно-качественных варьирующих предметов.

Специфика предмета статистики обуславливает специфику метода, они включают в себя:

  1. сбор данных (статистическое наблюдение, публикация)
  2. обобщение данных (сводка, группировка)
  3. представление данных (таблицы и графики)
  4. анализ и интерпретация числовых данных (расчет средних, вариационных анализ, КРА, ряды динамики, индексы)

тема 2: Организация статистического наблюдения.

Сводка и группировка данных.

§1. Понятие статистического наблюдения, его подготовка.

§2. Виды статистического наблюдения.

§3 Ошибки наблюдения.

§4 Сводка и группировка

§5 Виды статистических группировок.

§6 Статистические таблицы.

§7 Статистические графики.

§1. Понятие статистического наблюдения, его подготовка.

Любое статистическое исследование начинается со сбора данных.

Источники информации:

  1. различные публикации (газеты, журналы, и т.д.)
  2. главный источник опубликованной статистической информации – издания органов государственной статистики («РФ в 2001 году» издательство ГОСКОМСТАТ).
  3. проведение статистического наблюдения, т.е. научно организованного сбора данных.

Статистическое наблюдение – массовое, плановое, научно организованное наблюдение за явлением социальной и экономической жизни, которая заключается в регистрации признаков у каждой единицы изучаемой совокупности.

Процесс проведения наблюдения:

  1. Подготовка к наблюдению
  2. Проведение массового сбора данных
  3. Подготовка данных к обработке
  4. Разработка предложений по совершенствованию статистического наблюдения.

Подготовка наблюдения:

  1. Определение цели и объекта наблюдения
  2. Определение состава признаков подлежащих регистрации
  3. Разработка документов для сбора данных
  4. Выбор отчетной единицы и единицы относительно которой будет проводится наблюдение.
  5. Необходимо определить методы и средства получения данных.

Необходимо решить организационные проблемы:

  1. необходимо определить состав служб проводящих исследование
  2. проинструктировать персонал
  3. составить календарный план работы
  4. провести тиражирование документов для сбора данных

Объектом наблюдения являются социально-экономические явления и процессы.

Необходимо четко выделить признаки для регистрации.

Программа наблюдения – перечень признаков подлежащих регистрации признаков в процессе наблюдения.

Требования к программе наблюдения:

  1. Программа должна содержать существенные признаки, непосредственно характеризующие изучаемое явление, не следует включать в программу признаки, имеющие второстепенные явления или признаки, значения которых будут заведомо недостоверны или будут вообще отсутствовать.
  2. Вопросы программы наблюдения должны быть точными и не двусмысленными, а также легкими для понимания во избежании трудностей при получении ответов.
  3. Следует определить последовательность вопросов.
  4. В программу наблюдения следует включать вопросы непосредственного характера для проведения и уточнения собираемых данных.
  5. для обеспечения единообразия получаемых сведений программа оформляется в виде документа – называемый статистическим формуляром.

Статистический формуляр - это документ единого образца содержащий программу и результаты наблюдений.

Различают индивидуальный формуляр (ответы на вопросы по одной единице наблюдения) и списанный (сведения по нескольким единицам статистической совокупности).

Формуляр и инструкция по его заполнению являются инструментарием статистического наблюдения.

Выбор времени наблюдения заключается в решении 2 х вопросов: установлении критической даты либо интервала, определением периода наблюдения.

Критическая дата – конкретный день года, час дня по состоянию на который должны быть зарегистрированы признаки по каждой единице изучаемой совокупности.

Период наблюдения – время в течении которого происходит заполнение статистических формуляров т.е. время необходимое для сбора данных.

Следует учитывать, что отдаление периода наблюдения от критической даты или интервала может привести к снижению достоверности получаемых сведений.

§2. Виды статистического наблюдения.

В отечественной статистике используются три формы статистических наблюдений.

  1. статистическая отчетность предприятий, организаций, учреждений.
  2. специально организованное статистическое наблюдение (перепись и т.д.)
  3. регистр – форма непрерывного статистического наблюдения за долговременными процессами

Статистическое наблюдение классифицируется:

По времени наблюдения:

  • текущее наблюдение – производится непрерывная регистрация признаков (загс, преступление, и т.д.).
  • периодическое наблюдение – производится через определенные интервалы времени (уровень жизни в городе Челябинске, стоимость потребительской корзины, перепись населения).
  • Единовременный – наблюдение, производимое один раз под конкретную цель.

По охвату единиц совокупности:

  • Сплошное наблюдение – должна быть получена информация обо всех ЕСС
  • Не сплошное наблюдение:
    • Способ основного массива – обследованию подвергаются самые существенные единицы изучаемой совокупности (изучить предприятие машиностроения Челябинской области).
    • Выборочное наблюдение – случайный отбор ЕСС подлежащих наблюдению.
    • Монографическое наблюдение – когда наблюдению подвергается одна ЕСС, часто используются для составления программы массового наблюдения.

По способу сбора данных:

  • Непосредственное наблюдение – сами регистраторы путем непосредственного замера, взвешивания устанавливают факт подлежащей регистрации (ребенок в возрасте до 1 года в поликлинике).
  • Документальное наблюдение – используются различные документы (составление декларации)

Опрос – необходимые сведения получают со слов респондента.

  • Экспедиционный опрос – осуществляется специально подготовленными работниками которые получают необходимую информацию на основе опроса соответствующих лиц и сами фиксируют ответы в формуляре. Экспедиционный опрос может быть прямым (лицом к лицу) и опосредованным (опрос по телефону)
  • Корреспондентский опрос – сведения сообщает штат добровольных корреспондентов, данный способ требует малых финансовых затрат, но не дает точного значения проводимого наблюдения.
  • Саморегистрация – формуляры заполняются самими респондентами, а регистраторы лишь раздают им бланки опросных листов и объясняют заполнение их.

§3. Ошибки наблюдения

Основное требование, применяемое к статистическому наблюдению - это точность.

Точность – степень соответствия какого-либо показателя признака определенным по материалам статистического наблюдения действительной величине.

Расхождение между расчетным и действительным значением называется ошибкой наблюдения в зависимости от причин возникновения различают: ошибки регистрации и ошибки репрезентативности. Ошибки регистрации делятся на случайные и систематические.

Случайные ошибки – результат действий случайных факторов (перепутаны строки, столбцы)

Систематические ошибки – всегда имеют тенденцию либо к завышению либо к занижению показателя. (возраст)

Ошибки репрезентативности – характер для не сплошного наблюдения и возникают в результате неточного воспроизведения выборной всей исходной совокупности.

После получения статистических формуляров необходимо:

  1. провести проверку полноты собранных данных.
  2. провести арифметический контроль, основанный на связи различных признаков между собой.
  3. провести логический контроль основанный на знании логических связей между признаками.

§4. Сводка и группировка

На основе собранных данных нельзя произвести расчет и сделать выводы, для начала их нужно обобщить и свести в единую таблицу. Для этих целей служат сводка и группировка.

Сводка – комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность и выявление типичных черт и закономерностей присущих изучаемому явлению в целом.

Простая водка – подсчет общих итогов по совокупности.

Сложная сводка – комплекс операций по группировке единичных наблюдений, подсчет итогов по каждой группе и по всему объекту в целом и представлении результатов в виде статистических таблиц.

По форме обработки материала сводка бывает децентрализованная, централизованная – такая сводка проводится при единовременном статистическом наблюдении.

Группировка – расчленение множества единиц изучаемой совокупности на группы по определенным признакам.

§5. Виды статистических группировок

Группировки могут быть классифицированы по структуре и по содержанию.

Аналитическая группировка характеризует взаимосвязь между признаками один из которых является факторным другой результативным.

образование

Незаконченное высшее

§6. Статистические таблицы

Результаты сводки и группировки должны быть представлены так, чтобы ими можно было пользоваться.

Существует 3 способа представления данных:

  1. данные могут быть включены в текст.
  2. представление в таблицах.
  3. графический способ

Статистическая таблица – система строк и столбцов, в которой в определенной последовательности излагается статистическая информация о социально-экономических явлениях.

Различают подлежащее и сказуемое таблицы.

Подлежащим называется объект характеризующийся числами, обычно подлежащее дается в левой части таблицы.

Сказуемое – система показателей с помощью которых характеризуется объект.

Статистическая таблица содержит 3 вида заголовков: общее, боковое

Общий заголовок должен отражать содержание всей таблицы, располагается над таблицей по центру.

Правило составления таблиц.

  1. обязательны все три вида заголовков без сокращений слов, общие единицы измерения можно вынести в заголовок.
  2. в таблице не должно быть лишних линий, вертикальная разметка может отсутствовать.
  3. Итоговая строка обязательна. Она может быть как в начале так и в конце документа. Если в начале документа то если в конце то ИТОГО:
  1. цифровые данные в пределах одной графы записываются с одной степенью точности. Разряды записываются строго под разрядами, целая часть отделяется запятой.
  2. в таблице не должно быть пустых клеток, если данные отсутствуют, то пишут «Сведений нет» или «…», если данные равны нулю, то «–». Если значение не равно нулю но первая значащая цифра появляется после заданной точности 0,01®0,0 – если принятая точность до десятых.
  3. если в таблице много граф, то графы подлежащего обозначаются заглавными буквами, а графы сказуемого цифрами.
  4. если таблица основана на заимствованных данных, то под таблицей указывается источник данных, в случае необходимости таблица может сопровождаться примечаниями.

§7. Статистические графики

Статистические таблицы могут дополняться графиками.

Статистические графики – условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков.

Плюсы графического изображения

  1. наглядно, обозримо, выразительно.
  2. сразу видны пределы изменения показателя, сравнительная скорость изменения и колеблемость

Минусы графического изображения

  1. Включают меньшее количество данных чем в таблице.
  2. на графике показываются округленные данные, общая ситуация, но не детали.

Статистические графики

Диаграммы

Фигурные

Тема 3: Статистические показатели.

§1. Сущность и значение статистического показателя, его атрибуты.

§2. Классификация статистических показателей.

§3. Виды относительных показателей. Принципы построения.

§4. Системы статистических показателей.

Статистический признак – свойство присущее ЕСС, он существует объективно от того изучает его как наука или нет

Статистический показатель – обобщающая характеристика какого-либо свойства совокупности.

Структура статистического показателя (его атрибуты):

  • Средние величины
  • Показатели вариации
  • Показатели связи признаков
  • Показатели структуры и характера распределения
  • Показатели динамики
  • Показатели колебимости
  • Показатели точности и надежности выборочных оценок
  • Показатели точности и надежности прогнозов

По виду : суммарное количество единиц либо суммарное свойство объекта. Это сумма первичных признаков, измеряется в шт., кг, м, $, и т.д.

Относительный показатель – получаемый путем сопоставления абсолютных или относительных показателей в пространстве, во времени или в сравнении показателей разных свойств изучаемого объекта.

Относительный показатель 1 го порядка получается путем сопоставления 2 х абсолютных показателей. Относительный показатель 2 го порядка получается путем сопоставления относительных показателей 1 го порядка и т.д.

Относительный показатель 3 го порядка и выше встречаются очень редко.

Прямые показатели – такие показатели величина которых увеличивается с увеличением исследуемого явления.

Обратные показатели – показатели величина которых уменьшается с увеличением исследуемого явления.

…структуры

…динамики

…взаимосвязи

…интенсивности

…отношение к нормативу

…сравнения

Показатели структуры получаются путем отношения части к целому.

Относительные показатели динамики

ü Показатели динамики (темпы роста, прироста)

ü Индексы

Показатели взаимосвязи характеризуют связи между признаками:

ü Коэффициент корреляции

ü Аналитические индексы

Показатели интенсивности характеризуют отношение двух объектов по разным признакам.

ü Трудоемкость – количество времени используемое для изготовления одной единицы изделия

ü Выработка – количество продукции произведенное в единицу времени

ВЫРАБОТКА = 1/трудоемкость

Показатели отношения к нормативу – соотношение фактических величин признака показателя к нормативным, плановым, оптимальным.

Показатели сравнения – сравнение разных объектов по одному признаку.

Общие принципы построения статистических показателей:

  1. статистические показатели объективно связаны.
  2. сравниваемые показатели могут отличаться только одни атрибутом, нельзя сопоставлять показатель по двум и более атрибутам.
  3. необходимо знать и учитывать границы показателя.

Для каждой характеристики объекта необходима система статистических показателей.

  1. функция позновательская – основывается на анализе данных
  2. пропагандистская
  3. стимулирующая функция

тема 4: Средние величины

§1. понятие средней величины

§2. виды средних величин

§3. средняя арифметическая и ее свойства

§4. среднее гармоническое, геометрическое, квадратическое.

§5. многомерная средняя

Наиболее распространенной формой статистических показателей является средняя величина.

Важнейшее свойство средней заключается в том, что она отражает то общее, что присуще каждой единице изучаемой совокупности, хотя значение признака отдельных единиц совокупности могут колебаться в ту или иную сторону.

Типичность средней непосредственно связана с однородностью изучаемой совокупности. В случае не однородной совокупности необходимо провести разбивку ее на качественно однородные группы и рассчитать среднюю по каждой по каждой из однородных групп.

Определить среднюю можно через исходное соотношение средней (ИСС) ее логическую формулу.

Структурные средние

Мода – Мо

Медиана – Ме

В рядах динамики рассчитывается средняя арифметическая, средняя хронологическая.

Средней арифметической называется такое среднее значение признака при вычислении которого общий объем признака не изменяется.

Пример: вес.

Ср. арифметическое простое

x i – индивидуальное значение признака

n – общее число изучаемой совокупности

ср. арифметическое взвешенное

Свойства ср. арифметической.

Сумма отклонений индивидуальных значений признака от его средней величины равно нулю

если каждое индивидуальное значение признака умножить или разделить на одно и тоже постоянное число, то среднее увеличится или уменьшится во столько же раз.

если к каждому индивидуальному значению признака прибавить одно и тоже постоянное число, то средняя величина изменится соответственно на тоже самое число.

Доказательство

если веса f средней взвешенной умножить или разделить на одно и тоже число, то средняя не изменится.

сумма квадратов отклонений признака меньше чем от любого другого числа.

Другие виды средних

Вид средней

Простая средняя

Взвешенная средняя

гармоническая

геометрическое

Квадратическая

Очень трудно охарактеризовать группировку по одному признаку и мало остается информации в памяти.

Многомерная средняя – средняя величина для нескольких признаков Е.С.С.

Из отношений значений признака для Е.С. к средним значениям этих признаков.

Многомерная средняя для i единицы

x ij – значение признака j для i единицы

Среднее значение признака j

k – число признаков

j – номер признака и номер его совокупности

тема 5: Вариационный анализ

§1. Вариация признаков и ее причины

§2. Ряды распределения

§3. Структурные характеристики вариационного ряда.

§4. Показатели силы вариации.

§5. Показатели интенсивности вариации

§6. виды дисперсии. Правило сложения дисперсии.

Вариацией значения какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени.

Причина вариации: разные условия существования ЕСС именно вариация порождает необходимость в такой науке как статистика.

Проведение вариационного анализа начинается с построения вариационного ряда – упорядоченное распределение единиц совокупности по возрастающим или по убывающим признакам и подсчет соответствующих частот.

Ряды распределения

ü ранжированные

ü дискретные

ü интервальные

Ранжированный вариационный ряд – перечень отдельных ед. совокупности в порядке возрастания убывания ранжированного признака

Дискретный вариационный ряд – таблица состоящая из 2 х строк – полимерных значений варьирующего признака и кол-во единиц с данным значением признака.

Интервальный вариационный ряд строится в случаях:

  1. признак принимает дискретные значения, но кол-во их слишком велико
  2. признака принимает любые значения в определенном диапазоне

При построении интервального вариационного ряда необходимо выбрать оптимальное количество групп, самый распространенный способ по формуле Стерджесса

k – количество интервалов

n – объем совокупности

При расчетах почти всегда получают дробные значения, округления производить до целого числа.

Длина интервала – l

Виды интервалов

нижняя граница последующего интервала повторяет верхнюю границу последующего интервала

открытый интервал, интервал с одной границей

При расчетах по интервальному вариационному ряду за x i принимается середина интервала.

N ME =60 медиана = 1

Кумулята – распределение меньше чем

Огива – распределение больше чем

Медиана – значение признака делящее всю совокупность на две равные части.

Для дискретного вариационного ряда расчет медианы: если n-четное, то № Ме медианой единицы

Интервальный вариационный ряд:

k – количество интервалов

х 0 – нижняя граница медианного интервала

l – длина медианного интервала

Сумма частот

Накопленная частота интервала предшествующая медианному.

Частота медианного интервала

Медианный интервал – первый интервал накопленная частота которого превышает половину от общей суммы частот.

Графически медиана находится по кумуляте.

  1. Квартили – значение признака делящее совокупность на 4 равные части.

1 ый квартиль

3 ий квартиль

2 ой квартиль – медиана.

x Q 1 x Q 3 – нижняя граница интервала содержащего 1 го и 3 го квартили.

l – длина интервала

и - накопленные частоты интервалов предшествующих интервалов содержащих 1 и 3 квартили.

Частоты квартильных интервалов.

Для характеристики вариационного ряда используются:

Децили – делят совокупность на 10 равных частей, Перцитили – делят совокупность на 100 равных частей.

  1. Мода – часто встречающаяся характеристика признака. Для дискретного вариационного ряда – наибольшая частота. Для интервального вариационного ряда мода рассчитывается по следующей формуле:

Нижняя граница модального интервала

l – длина модального интервала

f Mo – частота модального интервала

f Mo +1 – частота интервала следующего за модальным

Модальный интервал – интервал с наибольшей частотой. Графически мода находится по гистограмме.

  1. Размах вариации
  2. Среднее линейное отклонение

Взвешенная

  1. Дисперсия:

Взвешенная

  1. Средне квадратическое отклонение

Свойство дисперсии.

  1. уменьшение всех значений признака на одну и ту же величину не меняет величину дисперсии.
  2. Уменьшение всех значений признаков в к раз уменьшает величину дисперсии в к 2 раз, а СКО в к раз
  3. если исчислить средний квадрат отклонений от любой величины А отличающийся от средней арифметической, то он всегда будет больше среднего квадрата отклонений исчисленного из средней арифметической. Таким образом от средней всегда меньше исчисленной от любой другой величины т.е. она имеет свойство минимальности. СКО=1,25 -при распределениях близких к нормальному.

В условиях нормального распределения существует следующая зависимость между и количеством наблюдений в пределах находится 68,3% наблюдений.

В пределах находится 95,4% наблюдений

В пределах находится 99,7% наблюдений

Для сравнения вариации признаков в разных совокупностях или для сравнения вариации разных признаков в одной совокупности используются относительные показатели, базой служит средняя арифметическая.

  1. Относительный размах вариации.
  2. Относительное линейное отклонение
  3. Коэффициент вариации

данные показатели дают не только сравнительную оценку но и образуют однородность совокупности. Совокупность считается однородной если коэффициент вариации не превышает 33%.

На ряду с изучением вариации признака по всей совокупности в целом, часто бывает необходимо проследить количественные изменения признака, но группам, на которые делится совокупность и между ними. Эта достигается путем вычисления разных видов.

Виды дисперсии:

  1. Общая дисперсия
  2. Межгрупповая дисперсия
  3. Внутригрупповая дисперсия (остаточная)

1. измеряет вариацию признака во всей совокупности под влиянием все факторов обусловивших данную вариацию

Пример: потребление йогурта: при выборке 100 человек

Социальное положение

x i –индивидуальное значение признака

Среднее значение признака по всей совокупности

Частота этого признака.

  1. 2. характеризует вариацию признака под влиянием признака фактора положенного в основу группировки.

Средняя по группе

Общая средняя по группе

Частота по группе

  1. 3. характеризует вариацию признака под влиянием факторов не включенных в группировку

x ij i значение признака в j группе

Среднее значение признака в j группе

f ij – частота i-го признака в j группе

Существует правило которое связывает 3 вида дисперсии, оно называется правило сложения дисперсии.

Остаточная дисперсия по j группе

Сумма частот по j группе

n общая сумма частот

основная задача анализа вариационных рядов – выявление закономерности распределения частот.

Кривая распределения – графическое изображение в виде непрерывной линии изменения частот в вариационном ряду в функционально связанным изменением значения признака.

Кривую распределения можно построить с помощью полигона и гистограммы. Целесообразно свести эмпирическое распределение к теоретическому, к одному из хорошо изученных виду.

Кривая нормального распределения.

Различают следующие разновидности кривых распределения:

  1. одновершинные
  2. много вершинные

Для однородных совокупностей характерны одновершинные кривые, много вершинная кривая говорит о неоднородности совокупности и необходимости перегруппировки.

Выяснение общего характера распределения предполагает оценку его однородности, и расчет асимметрии и эксцесса. Для симметричных распределений

Для сравнительного изучения асимметрии различных распределений вычисляется коэффициент асимметрии As.

Центральный момент третьего порядка; - СКО в кубе;

Если, то асимметрия значительная

Если As<0, то As – левосторонняя, если As>0, то As – правосторонняя.

Если, то As незначительная. Для симметричных и умеренно асимметричных рассчитывается показатель эксцесса: , если Е к >0, то распределение островершинное, если E k <0, то распределение плосковершинное.

Вариация альтернативного признака количественно проявляется следующим образом.

0 – единицы не обладающие данным признаком;

1 – единицы обладающие данным признаком;

р – доля единиц обладающих данным признаком;

q – доля единиц не обладающих данным признаком;

тогда p+ q=1.

Альтернативный признак принимает 2 значения 0 и 1 с весами p и q.

Прямые признаки – это такие признаки, величина которых увеличивается с увеличением исследуемого явления.

Обратные признаки – признаки, величина которых уменьшается с увеличением исследуемого явления.

Выработка (прямой)

Трудоемкость (обратный)

Максимальная дисперсия доли равна 0,25.

Тема 6: Моделирование рядов распределения.

§1. Фактическое и теоретическое распределение

§2. Кривая нормального распределения.

§3. Проверка гипотезы о нормальном распределении.

§4. Критерии согласия: Пирсона, Романовского, Колмогорова.

§5. Практическое значение моделирования рядов распределения.

§1. Фактическое и теоретическое распределение

Одна из важнейших целей изучения рядов распределения состоит в том, чтобы выявить закономерность распределения и определить ее характер. Закономерности распределения наиболее отчетливо проявляются только при большом количестве наблюдений.

Фактическое распределение может быть изображено графически с помощью кривой распределения – графически изображается в виде непрерывной линии изменения частот в вариационном ряду функционально связанного с изменением варианта.

Под теоретической кривой распределения понимается кривая данного типа распределения в общем виде исключающего влияние случайных для закономерности факторов.

Теоретическое распределение может быть выражено аналитической формулой которая называется аналитической формулой. Наиболее распространенным является нормальное распространение.

§2. Кривая нормального распределения.

Закон нормального распределения:

у – ордината нормального распределения

t – нормированное отклонение.

; е=2,7218; x i – варианты вариационного ряда; - среднее;

Свойства:

Функция нормального распределения – четная, т.е. f(t)=f(-t), . Функция нормального распределения полностью определяется и СКО.

§3. Проверка гипотезы о нормальном распределении.

Причиной частого обращения к закону распределения является то, что зависимость возникающая в результате действия множества случайных причин ни одна из которых не является преобладающей. Если в вариационном ряду рассчитали Мо=Ме, то это может указывать на близость к нормальному распределению. Наиболее точная проверка соответствия нормальному закону производится с помощью специальных критериев.

§4. Критерии согласия: Пирсона, Романовского, Колмогорова.

Критерий Пирсона.

Теоретическая частота

Эмпирическая частота

Методика расчета теоретических частот.

  1. Определяется среднее арифметическое и по интервальному вариационному ряду, считается t по каждому интервалу.
  2. Находим значение плотности вероятности для нормированного закона распределения. СТР.49
  3. Находим теоретическую частоту.

l – длина интервала

- сумма эмпирических частот

- плотность вероятности

округлить значение до целых

  1. Расчет коэффициента Пирсона
  2. табличное значение

d.f. – количество интервалов – 3

d.f. – количество степеней свободы.

  1. если > , то распределение не является нормальным, т.е. гипотеза о нормальном распределении отменяется. Если < , то распределение является нормальным.

Критерий Романовского.

Критерий Пирсона расчетный;

Число степеней.

Если С<3, то распределение близко к нормальному.

Критерий Колмогорова

, D – максимальное значение между накопленными эмпирическими и теоретическими частотами. Необходимое условие для использования Колмогорова: Число наблюдений более 100. По специальной таблице вероятностей с которой можно утверждать, что данное распределение является нормальным.

§5. Практическое значение моделирования рядов распределения.

  1. возможность применить к эмпирическому распределению законов нормального распределения.
  2. возможность использования правила 3 х сигм.
  3. Возможность избежать дополнительных трудоемких и затратных расчетов, по исследованию совокупности зная, что распределение нормальное.

Тема 7: Выборочное наблюдение.

§1. Понятие выборочного наблюдения. Причины его применения.

§2. Виды выборочного наблюдения.

§3. Ошибки выборочного наблюдения.

§4. Задачи выборочного наблюдения

§5. Распространение данных выборочного наблюдения на генеральную совокупность.

§6. Малая выборка.

§1. Понятие выборочного наблюдения. Причины его применения.

Выборочное наблюдение – такое не сплошное наблюдение, при котором статистическому обследованию подвергаются единицы изучаемой совокупности, отобранные определенным образом.

Цель (задача) выборочного наблюдения: по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов статистического наблюдения.

Причины применения выборочного наблюдения:

  1. экономия материальных, трудовых затрат и времени;
  2. возможность более детально и подробно изучит отдельные единицы статистической совокупности и их группы.
  3. некоторые специфические задачи можно решить только с применением выборочного наблюдения.
  4. грамотное и хорошо организованное выборочное наблюдение дает высокую точность результатов.

Генеральная совокупность – совокупность единиц, из которых производится отбор.

Выборочная совокупность – совокупность отобранных для обследования единиц. В статистике принято различать параметры генеральной совокупности и выборочной совокупности.

Виды выборочного наблюдения

По методу отбора:

Повторное

Попавшая в выборку единица после регистрации наблюдаемых признаков возвращаются в генеральную совокупность для участия в дальнейшей процедуре отбора.

Объем генеральной совокупности остается неизменным, что обуславливает постоянное попадание в выборку какой-либо единицы.

Бесповторное

Попавшая в выборку единица не возвращается в совокупность, из которой происходит отбор.

По способу отбора:

Собственно-случайная заключается в отношении единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Однако прежде чем проводить такую выборку, нужно убедиться, что все единицы генеральной совокупности имеют равные шансы попасть в выборку, т.е. в полном перечне единиц статистической совокупности отсутствуют пропуски или игнорирования отдельных единиц. Следует, также, четко установить границы генеральной совокупности. Технически сложившейся отбор осуществляется методом жеребьевки или с помощью таблицы случайных чисел.

Механическая выборка (каждый 5 по списку) применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определенная последовательность в распределении единиц. При проведении механической выборки устанавливается пропорция отбора, которая устанавливается соотношением генеральной совокупности и выборочной совокупности.

Опасность ошибки при механической выборке может появляться вследствие: случайного совпадения выбранного интервала и циклических закономерностей в расположении единиц генеральной совокупности.

Районированная выборка используется когда все единицы генеральной совокупности можно разбить на группы (районы, страны) по какому-либо признаку.

Комбинированная выборка.

Отбор единиц может быть произведен:

  1. либо пропорционально объему группы
  2. либо пропорционально внутригрупповой дифференциации признака
  3. , где n – объем выборочной совокупности, N – объем генеральной совокупности, n i объем выборки i -группы, N i объем i выборки.
  4. - этот способ является более точным, но в ходе проведения выборочного наблюдения очень трудно определить заранее о вариации. (до проявления наблюдения).

Серийный отбор.

Используется когда ЕСС объединены в небольшие группы (серии), например упаковка с готовой продукцией, студенческие группы. Сущность серийной выборки – серии отбираются собственно случайным, либо механическим способом, а затем осуществляется сплошное обследование внутри отобранной серии.

Комбинированный отбор.

Это комбинация рассмотренных выше способов отбора чаще применяется комбинация типичных и серийных серии, т.е. отбор серий из нескольких типических групп.

Отбор моет быть еще многоступенчатым и одноступенчатым, многофразным и однофразным.

Многоступенчатый отбор: из генеральной совокупности сначала извлекаются укрупненные группы, затем более мелкие, и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.

Многофразная выборка: предполагает сохранение одной и той же единицы отбора на всех этапах его проведения. При этом отобранные на каждой последующей стадии единицы отбора подвергаются обследованию, программа которого расширяется (Пример: студенты всего института, затем студенты каких-то факультетов).

§3. Ошибки выборочного наблюдения.

Систематические

Ошибки репрезентативности возникают только при выборочном наблюдении. Возникают в силу того, что выборочная совокупность не может в точности воспроизвести генеральную совокупность. Избежать их нельзя, но они легко поддаются прогнозированию и при необходимости их можно свести к минимуму.

Ошибка выборочного наблюдения – это разности между величиной параметра в генеральной совокупности и его величиной вычисленной по результатам выборочного наблюдения. Dх=-m+ , Dх – предельная ошибка в выборке, m - генеральная средняя; - выборочная средняя.

Предельная ошибка выборки – величина случайная исследованию закономерностей случайны ошибок выборки посвящены работы Чебышева. В теореме Чебышева доказано, что Dх не превышает: - средняя ошибка выборки.t-коэффициент доверия указывает на вероятность данной ошибки. Стр 42-43.

В случае, когда нужно определить t по известной F(t) берем F(t) ближайшую большую и по ней определяем t.

Предельная ошибка доль

Р – доля.

Если отбор был осуществлен бесповторным способом, то в формулы предельных ошибок добавляется

Поправка на бес повторность.

Для каждого вида выборочного наблюдения представленная ошибка, рассчитываются по разному:

  1. собственно случайное и механическое наблюдение;
  2. Районированное наблюдение
  3. Серийная выборка

r – количество серий в выборке;

R – количество серий в генеральной совокупности;

Меж групповая дисперсия доли.

§4. Задачи выборочного наблюдения

Применяется для следующих задач:

  1. n - ? для определения объема выборки по известной F(t), Dx.
  2. определение Dx выборки по известной F(t), n
  3. определение F(t) по известным Dx и n

1 задача n - ? Сначала n определяется по формуле повторного отбора, для бесповторного отбора:

Способы для определения дисперсии:

  1. ее берут из предыдущих аналогичных исследований.
  2. СКО при нормальном распределении » 1/6 размаха вариации.
  3. если распределение заведомо асимметричное, то СКО » 1/5 размаха вариации
  4. Для доли применяется дисперсия максимально возможная р(1-р)=0,25
  5. при n³100, то s 2 =S 2 – выборочная дисперсия

30£ n £100, то s 2 =S 2 (n/n-1), s 2 – генеральная дисперсия

n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

При расчете n не следует гнаться за большим значением t и за малыми предельными ошибками, т.к. это ведет к увеличению n следовательно, к увеличению затрат. По следующему закону аналогично.

§5. Распространение данных выборочного наблюдения на генеральную совокупность.

Конечной целью любого ВН является характеристика генеральной совокупности.

Величины, рассчитанные по результатам ВН распространяются на генеральную совокупность с учетом предела их предельной ошибки.

Предположим, что потребление йогурта в месяц одним человеком.

250-20£m£250+20; 230£m£270

А всего 1000 человек

230000£m£270000

48%-5%£p£48%+5%

§6. Малая выборка.

В практике статистического исследования в современных условиях все чаще приходится сталкиваться с небольшими по объему выборками.

Малая выборка – выборка наблюдения численность единиц которого не превышает 30, n£30/

Разработка теории малой выборки была проделана английским статистом Госсет, писавшим под псевдонимом student в 1908 году.

Он доказал, что оценка расхождения между средствами малой выборки и генеральной выборки имеет особый закон распределения. При расчетах по малой выборке величина s 2 не рассчитывается. t ст для возможных пределов ошибки пользуются критерием student. Стр.44-45. - вероятность обратного события.

Количество степеней свободы

предельная ошибка малой выборки

предельная ошибка доли

Тема 8: Корреляционно-регрессионный анализ и моделирование.

§1. Понятие корреляционной связи и КРА.

§2. Условия применения и ограничения КРА.

§3. Парная регрессия на основе метода наименьших квадратов.

§4. Применение парного линейного уравнения регрессии.

§5. Показатели тесноты связи и силы связи.

§6. Множественная корреляция.

§1. Понятие корреляционной связи и КРА.

Функциональная связь y=5x

Корреляционная связь

Различают 2 типа связей меду различными явлениями и их признаком функциональную и статистическую.

Функциональной называется такая связь когда с изменением значения одной из переменных вторая изменяется строго определенным образом, т.е., значению одной переменной соответствует одно или несколько точно заданных значений другой переменной. Функциональная связь возможна лишь в том случае, когда переменная у зависит от переменной х и не от каких других факторов не зависит, но в реальной жизни такое невозможно.

Статистическая связь существует в том случае, когда с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения, но ее статистические характеристики изменяются по определенному закону.

Важнейший частный случай статистической связи – корреляционная связь. При корреляционной связи разным значениям одной переменной соответствуют различные средние значения другой переменной, т.е. с изменением значения признака х закономерным образом изменяется среднее значение признака у.

Слово корреляция ввел английский биолог и статист Френсис Галь (correlation)

Корреляционная связь может возникнуть разными путями:

  • причинная зависимость вариации результативного признака от вариации факторного признака.
  • Корреляционная связь может возникнуть между 2 следствиями одной причины (пожары, кол-во пожарников, размер пожара)
  • Взаимосвязь признаков каждый из которых и причина и следствие одновременно (производительность труда и з/плата)

В статистике принято различать следующие виды зависимости:

  1. парная корреляция – связь между 2 мя признаками результативным и факторным, либо между двумя факторными.
  2. частная корреляция – зависимость между результативным и одним факторным признаком при фиксированном значении другого факторного признака.
  3. множественная корреляция – зависимость результативного признака от двух и более факторных признаков включенных в исследование.

Задачей корреляционного анализа является количественная оценка тесноты связи между признаками. В конце 19 века Гальтон и Пирсон исследовали зависимость между ростом отцов и детей.

Регрессия исследует форму связи. Задача регрессионного анализа – определение аналитического выражения связи.

Корреляционно-регрессионный анализ как общее понятие включает в себя изменение тесноты связи и установления аналитического выражения связи.

§2. Условия применения и ограничения КРА.

  1. наличие массовых данных, т.к. корреляционная связь является статистической
  2. необходима качественная однородность совокупности.
  3. подчинение распределения совокупности по результативному и факторному признаку, нормальному закону распределения, что связано с применением метода наименьших квадратов.

§3. Парная регрессия на основе метода наименьших квадратов.

Регрессионный анализ заключается в определении аналитического выражения связи. По форме различают линейную регрессию, которая выражается уравнением прямой, и не линейную регрессию или.

По направлению связи различают на прямую т.е. с увеличением признака х увеличивается признак у.

обратная

Обратная т.е. с увеличением х уменьшается у.

  1. способ графический – нанеся эмпирические данные на поле корреляции, но более точная оценка производится с помощью метода наименьших квадратов.

Х – признак фактический

У - признак результативный

Разница между фактическим значением и значением рассчитанным по уравнению связи возведенное в квадрат должна стремиться к минимуму.

При МНК min сумма квадратов отклонений эмпирических значений у от теоретических полученных по выбранному уравнению регрессии.

Для линейной зависимости

Þ а, b

для параболы

Для гиперболы

параметры a,b,c записываются в уравнение, затем подставляем полученное уравнение эмпирическое значение x i и находим теоретическое значение y i . Затем сравниваем y i теоретическое и y i эмпирическое. Сумма квадратов разности между ними должна быть минимальна. Выбираем тот вид зависимости при котором выполняется данная зависимость.

В уравнении парной линейной регрессии:

b – коэффициент парной линейной регрессии, он измеряет силу связи, т.е. характеризует среднее по совокупности отклонение у от его средней величины на принятую единицу измерения.

b =20 при изменении х на 1 признак у отклониться от своего среднего значения на 20 в среднем по совокупности.

Положительный знак при коэффициенте регрессии говорит о прямой связи между признаками, знак «-» говорит об обратной связи между признаками.

§4. Применение парного линейного уравнения регрессии.

Основное применение – прогнозирование по уравнению регрессии. Ограничением при прогнозировании служат условия стабильности других факторов и условий процесса. Если резко измениться в нем среда протекающего процесса, то данное уравнение регрессии не будет иметь места.

Точечный прогноз получается подстановкой в уравнение регрессии ожидаемого значения фактора. Вероятность точной реализации такого прогноза крайне мала.

Если точечный прогноз сопровождается значением средней ошибки прогноза, то такой прогноз называется интервальным.

Средняя ошибка прогноза образуется из двух видов ошибок:

  1. ошибок 1 рода – ошибка линии регрессии
  2. ошибка 2 рода – ошибка связанная с ошибкой вариации.

Средняя ошибка прогноза.

Ошибка положения линии регрессии в генеральной совокупности

n - объем выборки

x k – ошибочное значение фактора

СКО результативного признака от линии регрессии в генеральной совокупности

Корреляционный анализ предполагает оценку тесноты связи. Показатели:

  1. линейные коэффициент корреляции – характеризует тесноту и направление связи между двумя признаками в случае наличия между ними линейной зависимости

при =-1 связь функциональная обратная, =1 связь функциональная прямая, при =0 связь отсутствует.

Применяется только для линейных связей, используется для оценки связей между количественными признаками. Рассчитываются только по индивидуальным значениям.

Корреляционное отношение:

Эмпирическое: оба вида дисперсии рассчитываются по результативному признаку.

Теоретическое:

Дисперсия значений результативного признака рассчитанных по уравнению регрессии

Дисперсия эмпирического значения результативного признака

  • высокая степень точности
  • подходит для оценки тесноты связи между описательным и количественным признаком, но количественный должен быть результативным
  • подходит для любых типов связей

Коэффициент корреляции Спирмена

Ранги – порядковые номера единиц совокупности в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же порядке от меньших к большим или наоборот. Если ранги единиц совокупности обозначить р х и р у, то коэффициент корреляции рангов примет следующий вид:

Преимущества коэффициента корреляционного ряда:

  1. Ранжировать можно и по описательным признакам, которые нельзя выразить численно, следовательно расчет коэффициента Спирмена возможен для следующих пар признаков: кол-во – кол-во; описательный – количественный; Описательный – описательный. (образование – описательный признак)
  2. показывает направление связи

Недостатки коэффициента Спирмена.

  1. одинаковым разностям рангов могут соответствовать совершенно отличные разности значения признака (в случае количественных признаков). Пример: Выработка электроэнергии страны в год

США 2400 кВт/ч 1

РФ 800 кВт/ч 2

Канада 600 кВт/ч 3

Если среди значения Спирмена встречаются несколько одинаковых, то образуются связанные ранги т.е. одинаковые средние номера

В данном случае коэффициент Спирмена рассчитывается следующим образом:

j – номера связок по порядку для признака х

A j – число одинаковых рангов в j связи по х

k – номера связок по порядку признака у

B k – число одинаковых рангов в к-ой связке по у

  1. 4. Коэффициент корреляции ранга Кендалла

Максимальная сумма ранга

S – фактическая сумма рангов

Дает более строгую оценку чем коэффициент Спирмена.

Для расчета все единицы ранжируются по признаку х по признаку у для каждого ранга подсчитывается число последующих рангов превышающих данный их сумму обозначим Р и число последующих рангов ниже данного обозначения Q.

P+Q= 1 / 2 n(n-1)

  1. Коэффициент корреляции ранга Фехнера.

Коэффициент Фехнера – мера тесноты связи в виде отношения разности числа пар совпадающих и не совпадающих знаков к сумме этих чисел.

  1. расчет средних по х и у
  2. сравниваются индивидуальные значения x i y i со средними значениями с обязательным указанием знака «+» или «-». Если знаки совпадают по х и у, то мы относим их числу «С» если, нет, то к «Н».
  3. подсчитываем количество совпадающих и несовпадающих пар.

Задача измерения связи становится перед статисткой по отношению к описательным признакам, важным частным случаем такой задачи, измерения связи между 2 альтернативными признаками один из которых причина другой последствие.

Теснота связи между 2 альтернативными признаками может быть измерена с помощью 2х коэффициентов:

  1. коэффициент ассоциации
  2. коэффициент контингенции

Коэффициент контингенции имеет недостаток: при равных нулю одного из двух гетерогенных сочетаний Ав или Ва коэффициент обращается в единицу. Очень либерально оценивает тесноту связи – завышает ее.

Коэффициент Пирсона

При наличии не двух, а более возможных значений каждого из взаимосвязанных признаков рассчитываются следующие коэффициенты:

  1. Коэффициент Пирсона
  2. Коэффициент Чупрова для описательного признака

Коэффициент Пирсона рассчитывается по квадратным матрицам

Ниже нормы

к 1 и к 2 – число группы по признакам 1 и 2 соответственно. Минус коэффициента Пирсона в том, он не достигает 1 даже при увеличении количества групп.

Коэффициент Чупрова (1874 –1926)

коэффициент Чупрова более строже оценивает тесноту связи.

§6. Множественная корреляция.

Изучение связи между результативным и двумя или более факторными признаками называется множественной регрессией. При исследовании зависимостей методами множественной регрессии ставят 2 задачи.

  1. определение аналитического выражения связи между результативным признаком у и фактическими признаками х 1 , х 2 , х 3 , …х к, т.е. найти функцию у=f(х 1 , х 2 , …х к)
  2. Оценка тесноты связи между результативным и каждым из факторных признаков.

Корреляционно-регрессионная модель (КРМ) – такое уравнение регрессии, которое включает основные факторы, влияющие на вариацию результативного признака.

Построение модели множественной регрессии включает этапы:

  1. выбор формы связи
  2. отбор факторных признаков
  3. обеспечение достаточного объема совокупности для получения верных оценок.

I. все множество связей между переменными, встречающиеся на практике достаточно полно описывается функциями 5-ти видов:

  1. линейная:
  2. степенная:
  3. показательная:
  4. парабола:
  5. гипербола:

хотя все 5 функций присутствуют в практике КРА, наиболее часто используется линейная зависимость, как наиболее простая и легко поддающаяся интерпретации уравнение линейной зависимости: , к – множество факторов включающихся в уравнение, b j

0 – т.к. >0,7 следовательно на них обращаем особое внимание

ЭКО. Шкала тесноты связи:

Если связь 0 – 0,3 – слабая связь

0,3 – 0,5 – заметная

0,3 – 0,5 – тесная

0,7 – 0,9 – высокая

более 0,9 – весьма высокая

затем сравниваем два признака (доход и пол) <0,7, то включаем в уравнение множественной регрессии.

Отбор факторов для включения в уравнение множественной регрессии:

  1. между результативным и фактическим признаками должна быть причинно-следственная зависимость.
  2. результативный и фактический признаки должны быть тесно связаны между собой иначе возникает явление мультиколлинеарности (>06) , т.е. включенные в уравнение факторные признаки влияют не только на результативный, но друг на друга, что влечет к неверной интерпретации числовых данных.

Методы отбора факторов для включения в уравнение множественной регрессии:

1. экспертный метод – основан на интуитивно логическом анализе который выполняется высококвалифицированными экспертами.

2. использование матриц парных коэффициентов корреляции осуществляется параллельно с первым методом, матрица симметрична относительно единичной диагонали.

3. пошаговый регрессионный анализ – последовательное включение факторных признаков в уравнение регрессии и проверки значимости проводится на основании значений двух показателей на каждом шаге. Показатель корреляции, регрессии.

Показатель корреляции: рассчитывают изменение теоретической корреляции отношения или изменение средней остаточной дисперсии. Показатель регрессии – изменение коэффициента условно чистой регрессии.

Итого

31

32

22

85