Анализ статистических данных. Сводка и группировка материалов статистического наблюдения. Сущность и значение средних величин




Топлива устанавливают на основе анализа статистических данных фактических удельных расходов топлива , а также факторов, влияющих на изменение нормальных условий эксплуатации. В качестве математического аппарата используют модели множественной регрессии.  

Анализ публикаций по оценке экономической эффективности новой техники и собственные исследования позволили авторам сделать ряд выводов. Прежде всего, воздействие отдельных факторов на повышение экономической эффективности производства при использовании новой техники на нефтепродуктопроводном транспорте может быть выявлено на основе объемного материала фактических наблюдений и анализа статистических данных. При определении показателей для оценки экономической эффективности следует брать в расчет количественные значения измерителей с учетом условий, действующих в данный период. Применяемые при расчетах нормативы должны в полной мере отражать существующие затраты с индексированием стоимости производства и использования техники в условиях инфляции.  

История развития человечества показала, что без статистических данных невозможно управление государством, развитие отдельных отраслей и секторов экономики , обеспечение оптимальных пропорций между ними. Необходимость сбора и обобщения множества данных о населении страны, предприятиях, банках, фермерских хозяйствах и т. д. приводит к существованию специальных статистических служб - учреждений государственной статистики. В зависимости от того, по какой отрасли организуются сбор, обработка и анализ статистических данных, различают статистику населения , промышленности, сельского хозяйства , капитального строительства , финансов и т. д. Все эти разделы статистики призваны вырабатывать методы сбора и обобщения данных, построения сводных показателей для отражения процессов в соответствующей отрасли. Статистика рассчитывает и общеэкономические показатели - валовой национальный продукт , валовой внутренний продукт , совокупный общественный продукт , национальный доход и т. д.  

Слово статистика используется в нескольких значениях прежде всего как синоним слова данные. Именно в этом смысле можно сказать статистика рождаемости и смертности в России или статистика преступлений. Статистикой называется отрасль знаний, объединяющая принципы и методы работы с числовыми данными, характеризующими массовые явления. Статистикой называют также отрасль практической деятельности, направленной на сбор, обработку, анализ статистических данных.  

Анализ причин возникновения и протекания инфляции в Российской Федерации показывает их уникальность и значительное преобладание инфляции издержек над инфляцией спроса . Поэтому западные антиинфляционные теории мало подходят для условий России. Отечественной же стройной, законченной теории пока не создано, как нет и толстых российских учебников по борьбе с инфляцией. Крупицы столь необходимого знания раскиданы по сотням газет и журналов. Стоит задача, с одной стороны - разгрести тромбы неплатежей, уже приведшие в ряде случаев к параличу производств, с другой стороны - не допустить обвальной инфляции. Сложнейшие задачи, но их надо решать. На основе анализа статистических данных за последние семь лет, изучения публикаций ведущих отечественных экономистов, автор предлагает свои решения проблем.  

Стоит задача, с одной стороны, разгрести тромбы неплатежей, уже приведшие в ряде случаев к параличу, с другой стороны - не допустить обвальной инфляции. Пора начинать подавлять инфляцию нормальным путем - всемерно увеличивая выпуск продукции , пользующейся спросом. Сложнейшие задачи, но их надо решать, если хотим выжить в качестве мировой державы, а не сырьевого придатка. На основе анализа статистических данных и ознакомления с публикациями ведущих отечественных экономистов, автор предлагает свои решения проблем.  

Таким образом, в моделях с переменными параметрами необходим дифференцированный подход к установлению диапазонов варьирования коэффициентов отбора , базирующийся на анализе статистических данных, типа технологических процессов и качественных показателей потоков.  

Прогнозирование поступлений налогов на базе макроэкономических показателей определяет стратегию формирования налоговых доходов на очередной год и среднесрочную перспективу, но не решает всех проблем налогового планирования . Поэтому необходимым компонентом налогового планирования является обработка и анализ статистических данных об аккумуляции налогов в бюджет за истекший период, а также информация о возможных изменениях в налоговом законодательстве.  

Необходимо организовать систематический сбор и анализ статистических данных, характеризующих динамику по годам эксплуатации объемов продукции и работ, производимых с помощью внедряемой техники, а также себестоимости, трудоемкости и материалоемкости.  

Наряду с определением по основному выбранному параметру, расчет потребности в тех или иных видах машин и оборудования корректируется исходя из ряд других факторов изменений баланса потребления машин и оборудования отраслями народного хозяйства изменений структуры выпуска изделий, планируемых в рублях изменений номенклатуры изделий за счет внедрения более прогрессивных, надежных и долговечных конструкций изменений, связанных с развитием специализации и кооперирования, влияющими на общий объем выпуска и др. Влияние тех или иных факторов на изменение показателей для определения потребности в различных видах оборудования выявляется на основе анализа статистических данных за предплановый период с прогнозированием их на планируемый период.  

Имеется очень тесная связь индикаторов занятости с другими важными показателями экономического развития. Так, связь безработицы с изменением ВВП характеризуется законом Оукена, эмпирически открытым на основе анализа статистических данных по США (за период 50-80-х г.г.), а затем обоснованным и теоретически в макроэкономических исследованиях . В исходной форме, применительно к США, закон Оукена гласит  

При всех положительных значениях х функция возрастает при х = Ь/2 кривая имеет точку перегиба - ускоренный рост при х замедленный рост при х > Ь/2. Подобного типа функции используются при анализе статистических данных о бюджетах потребителей, где выдвигается гипотеза о существовании асимптотического уровня расходов, об изменении предельной склонности к потреблению товара , о существовании порогового уровня дохода 1. В этом случае при х -> да у - е" (рис. 2.5).  

Данная формула была применена для анализа статистических данных,  

Все прогнозы объема продаж строятся на использовании трех видов информации , полученной на основе изучения что люди говорят, что люди делают и что люди сделали. Получение первого вида информации основывается на изучении мнения потребителей и покупателей, торговых агентов и посредников. Здесь используются методы социологических исследований и экспертные методы . Изучение того, что люди делают, предполагает проведение тестирования рынка . Изучение того, что люди сделали, предполагает анализ статистических данных о сделанных ими покупках.  

Рассмотрим распределение НГДУ по характеру изменения объемов добычи на НГДУ с растущей, стабильной и падающей добычей. На 1/1 1972 г. из 104 НГДУ отрасли 43 (или 41,4%) являлись растущими и 61 стабильными ли падающими. Анализ статистических данных за 1970 г., проведенный авторами по 76 НГДУ, позволил выявить некоторые общие характеристики различных подгрупп НГДУ, которые приведены в табл. 15.  

Вопрос 2.

Статистические данные показывают, что ежегодно около 70% чрезвычайных ситуаций возникающих в РФ носят техногенный характер. Более 72-х миллионов человек в РФ проживают в зонах, где возможно возникновение ЧС. В России риск смертности от возникновения ЧС в 100 раз выше чем для для развитых стран.

В настоящее время на территории РФ функционируют более 3000 химически опасных объектов. Суммарный запас СДЯВ в этих объектах составляет 1 млн.тонн и 10 12 смертельных токсодоз. Количество аварий в год доходит до 1000, а последствия аварий ощущают более 200 000 человек.

Район химического заражения делят следующим образом:

1. Зона чрезвычайно опасного заражения, т.е. со смертельной концентрацией АХОВ.

2. Опасная зона, т.е. зона с поражающей концентрацией.

Степень поражения АХОВ характеризуется поражающей токсодозой, которая определяется как произведение поражающей концентрации на время экспозиции, в течение которого человек получает смертельную дозу находясь на зараженной территории.

Д=С*Т, (мг*мин)/м 3

При прогнозировании учитывают самый худший вариант развития событий.

Оценка химической обстановки включает определение возможности попадания объекта в зону заражения и времени подхода зараженного облака к объекту.

Мероприятия по уменьшению факторов аварии:

· Создание и поддержание в постоянной готовности системы оповещения.

· Обеспечение работающих СИЗ.

· Оборудование специальных технических средств для постановки водяных завес.

В настоящее время на территории РФ функционируют следующие РОО:

2. 29 ядерных энергоблоков

3. 235 атомных ледоколов и крейсеров.

4. В Ленинградской области 250 объектов используют в производстве радиоактивные изотопы.

Тема: «Инфекционные заболевания» .

Биологически вредные факторы - микроорганизмы, содержащиеся в препаратах и патогенные микроорганизмы, присутствующие в окружающей среде, продуктах.

Микроорганизм проникает через:

1. Желудочно-кишечный тракт (интерально)

2. Верхние дыхательные пути при контакте через кожу.

3. Половой способ.

В зависимости от местонахождения микроорганизма все инфекционные болезни делятся на:

1. Инфекции дыхательных путей

2. Кровельные

3. Кишечные

4. Наружных покровов

К инфекциям дыхательных путей относят: ОРВИ, оспа, дифтерия, туберкулез и д.р.

К кровяным относят: сыпной тиф, малярия, ВИЧ-инфекция, чума.

Кишечные : дизентирия, брюшной тиф, холера, бруцеллез, ботулизм, сальманеллёз.



Бруцеллез вызывается заражением человека через мясо, шерсть, пух, молоко. Инкубационный период острой формы составляет от 7 до 60 дней, после чего температура тела повышается до 39-40°C, появляется озноб, потоотделение, боль в мышцах и суставах, головная боль, увеличение лимфоузлов, у мужчин появляются воспалительные процессы в половой системе.

Хроническая форма развивается через 5-6 месяцев. Если не лечить, то заболевание длится очень долго.

Туберкулез передается не только от людей, но и от больных животных. Характерные симптомы на ранних стадиях: повышенная утомляемость, общая слабость, похудение, субфебрильная температура, потливость, сухой или с мокротой, кашель.

ВИЧ-инфекция (СПИД).

Источником заболевания являются больные люди. Вирус обнаружен в крови, в грудном молоке, в слюне. Передача инфекции может происходить через пораженную кожу при медицинских мероприятиях. Инкубационный период - 2 нед.-3 мес. Симптомы: увеличение лимфоузлов, сыпь, возможна температура.

2-я стадия наступает через 3-5 лет; больной замечает сильное увеличение лимфатических узлов.

3-я стадия: похудение, лихорадка, инфекционные заболевания ушей, легких, кожи.

4-я стадия: разгар указанных заболеваний или летальный исход.

Оспа - острое высоко заразное заболевание вирусной природы, которое характеризуется тяжелой интоксикацией организма, лихорадкой, появлением пузырьковой сыпью на коже и слизистой, оставляющие после себя рубцы. Возбудитель: вирус, обладает значительной устойчивостью к физическим и химическим факторам. Вирус размножается от дыхательной системы и попадает в кровь. Оттуда вновь попадает в кожу и слизистые. Источник инфекции: больной человек. Наибольшая заразительность на 6-10 сутки. Инкубационные период: 15-19 дней. Начало болезни острое, с быстрым подъемом температуры до 40° и выше, появляется боль в пояснице, частая тошнота и рвота.

На 4-е сутки, с появлением сыпи, снижается температуры. Сначала сыпь возникает на лице --> туловище --> конечности. Вначале появляются бледно-розовые пятна, которые превращаются в пузырьки темно-красного цвета. В их центре через три-четыре дня появляются пузырьки, заполненные серозной жидкостью.

На 7-8 день состояние больного вновь ухудшается, температура снова достигает до 40° и происходит нагноение сыпи. Состояние тяжелое, сознание спутанное, а на 10-14 сутки пузырьки подсыхают и оставляют на всю жизнь беловатые рубцы.

Чума - острое инфекционное заболевание, которое характеризуется интоксикацией, лихорадкой, поражением лимфатических узлов и легких.

Возбудителем чумы является бактерия, спор не образуют, чувствительны к факторам окружающей среды, погибают при температуре 50°-55° в течение 15 минут. Основной источник инфекций: грызуны, блохи. Человек заражается при укусе. Возможен путь заражения при обработке охотниками туш убитых животных. Инкубационный период составляет обычно от 3 до 6 суток. Выделяют локализованные и генерализованные формы чумы. Чума обычно начинается внезапно, температура повышается до 39 и выше, быстро нарастают симптомы интоксикации, нарушается сознание, может возникать бред.

Бубонная форма чумы характеризуется появлением чуткого бубона, т.е. это увеличение лимфатических узлов до 10см. У 70% больных они локализуются в паховой области. Кожа над бубоном становится багрово-красной, лоснится.

Лимфатические узлы первичного очага подвергаются размягчению. Затем происходит постепенное заживление.

Бубонная форма может привести к развитию генерализованной формы в результате попадания возбудителя в кровь. Для лечения чумы рекомендован целый ряд антибиотиков: диксоциклин, тетрациклин, гентамицин, стрептомицин.

Ботулизм - острая инфекционная болезнь, возникающая в результате отравления токсинами бактерий батулизма. Характеризуется поражением ЦНС и вегетативной нервной системы. Возбудитель батулизма широко распространен в природе. Бактерии батулизма являются анаэробными и размножаются при отсутствии кислорода. Вегетативные формы погибают через 2-3 минуты после кипячения, споры через 5 часов.

Ботулотоксин - смертельный биологический яд, смертельная доза - 0.003мг/кг. Известны 7 антигенных варианта батулических микробов (A, B, C, 0, E, P, 6).

Для людей наиболее опасны A, B, E. Резервуаром инфекции в природе являются теплокровные животные, реже - хладнокровные. Инкубационный период при ботулизме составляет от нескольких часов до 2-3 суток. Чем тяжелее заболевание, тем инкубационный период короче. Клиники батулизма складывается из 3 симптомов: паралич, общетоксическое действие, гастроинтоксикация.

Причиной смертности больных является острая дыхательная недостаточность. Больных ботулизмом следует немедленно обратиться в больницу. Следует промыть желудок 2-3% раствором соды, немедленно ввести противоботулиническую сыворотку.

Тема: «Оказание первой медицинской помощи при основных видах поражений» .

1. Медицинские средства индивидуальной защиты. Основные мероприятия первой медицинской помощи.

2. Первая медицинская помощь при ранениях и кровотечениях.

3. Первая медицинская помощь при переломах и вывихах.

4. Первая медицинская помощь при ожогах и отравлениях.

Проверка гипотез проводится с помощью статистического анализа. Статистическую значимость находят с помощью Р-значения, которое соответствует вероятности данного события при предположении, что некоторое утверждение (нулевая гипотеза) истинно. Если Р-значение меньше заданного уровня статистической значимости (обычно это 0,05), экспериментатор может смело заключить, что нулевая гипотеза неверна, и перейти к рассмотрению альтернативной гипотезы. С помощью t-критерия Стьюдента можно вычислить Р-значение и определить значимость для двух наборов данных.

Шаги

Часть 1

Постановка эксперимента

    Определите свою гипотезу. Первый шаг при оценке статистической значимости состоит в том, чтобы выбрать вопрос, ответ на который вы хотите получить, и сформулировать гипотезу. Гипотеза - это утверждение об экспериментальных данных, их распределении и свойствах. Для любого эксперимента существует как нулевая, так и альтернативная гипотеза. Вообще говоря, вам придется сравнивать два набора данных, чтобы определить, схожи они или различны.

    • Нулевая гипотеза (H 0) обычно утверждает, что между двумя наборами данных нет разницы. Например: те ученики, которые читают материал перед занятиями, не получают более высокие оценки.
    • Альтернативная гипотеза (H a) противоположна нулевой гипотезе и представляет собой утверждение, которое нужно подтвердить с помощью экспериментальных данных. Например: те ученики, которые читают материал перед занятиями, получают более высокие оценки.
  1. Установите уровень значимости, чтобы определить, насколько распределение данных должно отличаться от обычного, чтобы это можно было считать значимым результатом. Уровень значимости (его называют также α {\displaystyle \alpha } -уровнем) - это порог, который вы определяете для статистической значимости. Если Р-значение меньше уровня значимости или равно ему, данные считаются статистически значимыми.

    • Как правило, уровень значимости (значение α {\displaystyle \alpha } ) принимается равным 0,05, и в этом случае вероятность обнаружения случайной разницы между разными наборами данных составляет всего лишь 5%.
    • Чем выше уровень значимости (и, соответственно, меньше Р-значение), тем достовернее результаты.
    • Если вы хотите получить более достоверные результаты, понизьте Р-значение до 0,01. Как правило, более низкие Р-значения используются в производстве, когда необходимо выявить брак в продукции. В этом случае требуется высокая достоверность, чтобы быть уверенным, что все детали работают так, как положено.
    • Для большинства экспериментов с гипотезами достаточно принять уровень значимости равным 0,05.
  2. Решите, какой критерий вы будете использовать: односторонний или двусторонний. Одно из предположений в t-критерии Стьюдента гласит, что данные распределены нормальным образом. Нормальное распределение представляет собой колоколообразную кривую с максимальным количеством результатов посередине кривой. t-критерий Стьюдента - это математический метод проверки данных, который позволяет установить, выпадают ли данные за пределы нормального распределения (больше, меньше, либо в “хвостах” кривой).

    • Если вы не уверены, находятся ли данные выше или ниже контрольной группы значений, используйте двусторонний критерий. Это позволит вам определить значимость в обоих направлениях.
    • Если вы знаете, в каком направлении данные могут выйти за пределы нормального распределения, используйте односторонний критерий. В приведенном выше примере мы ожидаем, что оценки студентов повысятся, поэтому можно использовать односторонний критерий.
  3. Определите объем выборки с помощью статистической мощности. Статистическая мощность исследования - это вероятность того, что при данном объеме выборки получится ожидаемый результат. Распространенный порог мощности (или β) составляет 80%. Анализ статистической мощности без каких-либо предварительных данных может представлять определенные сложности, поскольку требуется некоторая информация об ожидаемых средних значениях в каждой группе данных и об их стандартных отклонениях. Используйте для анализа статистической мощности онлайн-калькулятор, чтобы определить оптимальный объем выборки для ваших данных.

    • Обычно ученые проводят небольшое пробное исследование, которое позволяет получить данные для анализа статистической мощности и определить объем выборки, необходимый для более расширенного и полного исследования.
    • Если у вас нет возможности провести пробное исследование, постарайтесь на основании литературных данных и результатов других людей оценить возможные средние значения. Возможно, это поможет вам определить оптимальный объем выборки.

    Часть 2

    Вычислите стандартное отклонение
    1. Запишите формулу для стандартного отклонения. Стандартное отклонение показывает, насколько велик разброс данных. Оно позволяет заключить, насколько близки данные, полученные на определенной выборке. На первый взгляд формула кажется довольно сложной, но приведенные ниже объяснения помогут понять ее. Формула имеет следующий вид: s = √∑((x i – µ) 2 /(N – 1)).

      • s - стандартное отклонение;
      • знак ∑ указывает на то, что следует сложить все полученные на выборке данные;
      • x i соответствует i-му значению, то есть отдельному полученному результату;
      • µ - это среднее значение для данной группы;
      • N - общее число данных в выборке.
    2. Найдите среднее значение в каждой группе. Чтобы вычислить стандартное отклонение, необходимо сначала найти среднее значение для каждой исследуемой группы. Среднее значение обозначается греческой буквой µ (мю). Чтобы найти среднее, просто сложите все полученные значения и поделите их на количество данных (объем выборки).

      • Например, чтобы найти среднюю оценку в группе тех учеников, которые изучают материал перед занятиями, рассмотрим небольшой набор данных. Для простоты используем набор из пяти точек: 90, 91, 85, 83 и 94.
      • Сложим вместе все значения: 90 + 91 + 85 + 83 + 94 = 443.
      • Поделим сумму на число значений, N = 5: 443/5 = 88,6.
      • Таким образом, среднее значение для данной группы составляет 88,6.
    3. Вычтите из среднего каждое полученное значение. Следующий шаг заключается в вычислении разницы (x i – µ). Для этого следует вычесть из найденной средней величины каждое полученное значение. В нашем примере необходимо найти пять разностей:

      • (90 – 88,6), (91- 88,6), (85 – 88,6), (83 – 88,6) и (94 – 88,6).
      • В результате получаем следующие значения: 1,4, 2,4, -3,6, -5,6 и 5,4.
    4. Возведите в квадрат каждую полученную величину и сложите их вместе. Каждую из только что найденных величин следует возвести в квадрат. На этом шаге исчезнут все отрицательные значения. Если после данного шага у вас останутся отрицательные числа, значит, вы забыли возвести их в квадрат.

      • Для нашего примера получаем 1,96, 5,76, 12,96, 31,36 и 29,16.
      • Складываем полученные значения: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Поделите на объем выборки минус 1. В формуле сумма делится на N – 1 из-за того, что мы не учитываем генеральную совокупность, а берем для оценки выборку из числа всех студентов.

      • Вычитаем: N – 1 = 5 – 1 = 4
      • Делим: 81,2/4 = 20,3
    6. Извлеките квадратный корень. После того как вы поделите сумму на объем выборки минус один, извлеките из найденного значения квадратный корень. Это последний шаг в вычислении стандартного отклонения. Есть статистические программы, которые после введения начальных данных производят все необходимые вычисления.

      • В нашем примере стандартное отклонение оценок тех учеников, которые читают материал перед занятиями, составляет s =√20,3 = 4,51.

    Часть 3

    Определите значимость
    1. Рассчитайте дисперсию между двумя группами данных. До этого шага мы рассматривали пример лишь для одной группы данных. Если вы хотите сравнить две группы, очевидно, следует взять данные для обеих групп. Вычислите стандартное отклонение для второй группы данных, а затем найдите дисперсию между двумя экспериментальными группами. Дисперсия вычисляется по следующей формуле: s d = √((s 1 /N 1) + (s 2 /N 2)).

Деятельность людей во множестве случаев предполагает работу с данными, а она в свою очередь может подразумевать не только оперирование ими, но и их изучение, обработку и анализ. Например, когда нужно уплотнить информацию, найти какие-то взаимосвязи или определить структуры. И как раз для аналитики в этом случае очень удобно пользоваться не только , но и применять статистические методы.

Особенностью методов статистического анализа является их комплексность, обусловленная многообразием форм статистических закономерностей, а также сложностью процесса статистических исследований. Однако мы хотим поговорить именно о таких методах, которые может применять каждый, причем делать это эффективно и с удовольствием.

Статистическое исследование может проводиться посредством следующих методик:

  • Статистическое наблюдение;
  • Сводка и группировка материалов статистического наблюдения;
  • Абсолютные и относительные статистические величины;
  • Вариационные ряды;
  • Выборка;
  • Корреляционный и регрессионный анализ;
  • Ряды динамики.

Статистическое наблюдение

Статистическое наблюдение является планомерным, организованным и в большинстве случаев систематическим сбором информации, направленным, главным образом, на явления социальной жизни. Реализуется данный метод через регистрацию предварительно определенных наиболее ярких признаков, цель которой состоит в последующем получении характеристик изучаемых явлений.

Статистическое наблюдение должно выполняться с учетом некоторых важных требований:

  • Оно должно полностью охватывать изучаемые явления;
  • Получаемые данные должны быть точными и достоверными;
  • Получаемые данные должны быть однообразными и легкосопоставимыми.

Также статистическое наблюдение может иметь две формы:

  • Отчетность – это такая форма статистического наблюдения, где информация поступает в конкретные статистические подразделения организаций, учреждений или предприятий. В этом случае данные вносятся в специальные отчеты.
  • Специально организованное наблюдение – наблюдение, которое организуется с определенной целью, чтобы получить сведения, которых не имеется в отчетах, или же для уточнения и установления достоверности информации отчетов. К этой форме относятся опросы (например, опросы мнений людей), перепись населения и т.п.

Кроме того, статистическое наблюдение может быть категоризировано на основе двух признаков: либо на основе характера регистрации данных, либо на основе охвата единиц наблюдения. К первой категории относятся опросы, документирование и прямое наблюдение, а ко второй – наблюдение сплошное и несплошное, т.е. выборочное.

Для получения данных при помощи статистического наблюдения можно применять такие способы как анкетирование, корреспондентская деятельность, самоисчисление (когда наблюдаемые, например, сами заполняют соответствующие документы), экспедиции и составление отчетов.

Сводка и группировка материалов статистического наблюдения

Говоря о втором методе, в первую очередь следует сказать о сводке. Сводка представляет собой процесс обработки определенных единичных фактов, которые образуют общую совокупность данных, собранных при наблюдении. Если сводка проводится грамотно, огромное количество единичных данных об отдельных объектах наблюдения может превратиться в целый комплекс статистических таблиц и результатов. Также такое исследование способствует определению общих черт и закономерностей исследуемых явлений.

С учетом показателей точности и глубины изучения можно выделить простую и сложную сводку, но любая из них должна основываться на конкретных этапах:

  • Выбирается группировочный признак;
  • Определяется порядок формирования групп;
  • Разрабатывается система показателей, позволяющих охарактеризовать группу и объект или явление в целом;
  • Разрабатываются макеты таблиц, где будут представлены результаты сводки.

Важно заметить, что есть и разные формы сводки:

  • Централизованная сводка, требующая передачи полученного первичного материала в вышестоящий центр для последующей обработки;
  • Децентрализованная сводка, где изучение данных происходит на нескольких ступенях по восходящей.

Выполняться же сводка может при помощи специализированного оборудования, например, с использованием компьютерного ПО или вручную.

Что же касается группировки, то этот процесс отличается разделением исследуемых данных на группы по признакам. Особенности поставленных статистическим анализом задач влияют на то, какой именно будет группировка: типологической, структурной или аналитической. Именно поэтому для сводки и группировки либо прибегают к услугам узкопрофильных специалистов, либо применяют .

Абсолютные и относительные статистические величины

Абсолютные величина считаются самой первой формой представления статистических данных. С ее помощью удается придать явлениям размерные характеристики, например, по времени, по протяженности, по объему, по площади, по массе и т.д.

Если требуется узнать об индивидуальных абсолютных статистических величинах, можно прибегнуть к замерам, оценке, подсчету или взвешиванию. А если нужно получить итоговые объемные показатели, следует использовать сводку и группировку. Нужно иметь в виду, что абсолютные статистические величины отличаются наличием единиц измерения. К таким единицам относят стоимостные, трудовые и натуральные.

А относительные величины выражают количественные соотношения, касающиеся явлений социальной жизни. Чтобы их получить, одни величины всегда делятся на другие. Показатель, с которым сравнивают (это знаменатель), называют основанием сравнения, а показатель, которой сравнивают (это числитель), называют отчетной величиной.

Относительные величины могут быть разными, что зависит от их содержательной части. Например, существуют величины сравнения, величины уровня развития, величины интенсивности конкретного процесса, величины координации, структуры, динамики и т.д. и т.п.

Чтобы изучить какую-то совокупность по дифференцирующимся признакам, в статистическом анализе применяются средние величины – обобщающие качественные характеристики совокупности однородных явлений по какому-либо дифференцирующемуся признаку.

Крайне важным свойством средних величин является то, что они говорят о значениях конкретных признаков во всем их комплексе единым числом. Невзирая на то, что у отдельных единиц может наблюдаться количественная разница, средние величины выражают общие значения, свойственные всем единицам исследуемого комплекса. Получается, что при помощи характеристики чего-то одного можно получить характеристику целого.

Следует иметь в виду, что одним из самых важных условий применения средних величин, если проводится статистический анализ социальных явлений, считается однородность их комплекса, для которого и нужно узнать среднюю величину. А от такого, как именно будут представлены начальные данные для исчисления средней величины, будет зависеть и формула ее определения.

Вариационные ряды

В некоторых случаях данных о средних показателях тех или иных изучаемых величин может быть недостаточно, чтобы провести обработку, оценку и глубокий анализ какого-то явления или процесса. Тогда во внимание следует брать вариацию или разброс показателей отдельных единиц, который тоже представляет собой важную характеристику исследуемой совокупности.

На индивидуальные значения величин могут воздействовать многие факторы, а сами изучаемые явления или процессы могут быть очень многообразны, т.е. обладать вариацией (это многообразие и есть вариационные ряды), причины которой следует искать в сущности того, что изучается.

Вышеназванные абсолютные величины находятся в непосредственной зависимости от единиц измерения признаков, а значит, делают процесс изучения, оценки и сравнения двух и более вариационных рядов более сложным. А относительные показатели нужно вычислять в качестве соотношения абсолютных и средних показателей.

Выборка

Смысл выборочного метода (или проще – выборки) состоит в том, что по свойствам одной части определяются численные характеристики целого (это называется генеральной совокупностью). Основной выборочного метода является внутренняя связь, объединяющая части и целое, единичное и общее.

Метод выборки отличается рядом существенных преимуществ перед остальными, т.к. благодаря уменьшению количества наблюдений позволяет сократить объемы работы, затрачиваемые средства и усилия, а также успешно получать данные о таких процессах и явлениях, где либо нецелесообразно, либо просто невозможно исследовать их полностью.

Соответствие характеристик выборки характеристикам изучаемого явления или процесса будет зависеть от комплекса условий, и в первую очередь от того, как вообще будет реализовываться выборочный метод на практике. Это может быть как планомерный отбор, идущий по подготовленной схеме, так и непланомерный, когда выборка производится из генеральной совокупности.

Но во всех случаях выборочный метод должен быть типичным и соответствовать критериям объективности. Данные требования нужно выполнять всегда, т.к. именно от них будет зависеть соответствие характеристик метода и характеристик того, что подвергается статистическому анализу.

Таким образом, перед обработкой выборочного материала необходимо провести его тщательную проверку, избавившись тем самым от всего ненужного и второстепенного. Одновременно с этим, составляя выборку, в обязательном порядке нужно обходить стороной любую самодеятельность. Это означает, что ни в коем случае не следует делать выборку только из вариантов, кажущихся типичными, а все другие – отбрасывать.

Эффективная и качественная выборка должна составляться объективно, т.е. производить ее нужно так, чтобы были исключены любые субъективные влияния и предвзятые побуждения. И чтобы это условие было соблюдено должным образом, требуется прибегнуть к принципу рандомизации или, проще говоря, к принципу случайного отбора вариантов из всей их генеральной совокупности.

Представленный принцип служит основой теории выборочного метода, и следовать ему нужно всегда, когда требуется создать эффективную выборочную совокупность, причем случаи планомерного отбора исключением здесь не являются.

Корреляционный и регрессионный анализ

Корреляционный анализ и регрессионный анализ – это два высокоэффективных метода, позволяющие проводить анализ больших объемов данных для изучения возможной взаимосвязи двух или большего количества показателей.

В случае с корреляционным анализом задачами являются:

  • Измерить тесноту имеющейся связи дифференцирующихся признаков;
  • Определить неизвестные причинные связи;
  • Оценить факторы, в наибольшей степени воздействующие на окончательный признак.

А в случае с регрессионным анализом задачи следующие:

  • Определить форму связи;
  • Установить степень воздействия независимых показателей на зависимый;
  • Определить расчетные значения зависимого показателя.

Чтобы решить все вышеназванные задачи, практически всегда нужно применять и корреляционный и регрессионный анализ в комплексе.

Ряды динамики

Посредством этого метода статистического анализа очень удобно определять интенсивность или скорость, с которой развиваются явления, находить тенденцию их развития, выделять колебания, сравнивать динамику развития, находить взаимосвязь развивающихся во времени явлений.

Ряд динамики – это такой ряд, в котором во времени последовательно расположены статистические показатели, изменения которых характеризуют процесс развития исследуемого объекта или явления.

Ряд динамики включает в себя два компонента:

  • Период или момент времени, связанный с имеющимися данными;
  • Уровень или статистический показатель.

В совокупности эти компоненты представляют собой два члена ряда динамики, где первый член (временной период) обозначается буквой «t», а второй (уровень) – буквой «y».

Исходя из длительности временных промежутков, с которыми взаимосвязаны уровни, ряды динамики могут быть моментными и интервальными. Интервальные ряды позволяют складывать уровни для получения общей величины периодов, следующих один за другим, а в моментных такой возможности нет, но этого там и не требуется.

Ряды динамики также существуют с равными и разными интервалами. Суть же интервалов в моментных и интервальных рядах всегда разная. В первом случае интервалом является временной промежуток между датами, к которым привязаны данные для анализа (удобно использовать такой ряд, например, для определения количества действий за месяц, год и т.д.). А во втором случае – временной промежуток, к которому привязана совокупность обобщенных данных (такой ряд можно использовать для определения качества тех же самых действий за месяц, год и т.п.). Интервалы могут быть равными и разными, независимо от типа ряда.

Естественно, чтобы научиться грамотно применять каждый из методов статистического анализа, недостаточно просто знать о них, ведь, по сути, статистика – это целая наука, требующая еще и определенных навыков и умений. Но чтобы она давалась проще, можно и нужно тренировать свое мышление и .

В остальном же исследование, оценка, обработка и анализ информации – очень интересные процессы. И даже в тех случаях, когда это не приводит к какому-то конкретному результату, за время исследования можно узнать множество интересных вещей. Статистический анализ нашел свое применение в огромном количестве сфер деятельности человека, а вы можете использовать его в учебе, работе, бизнесе и других областях, включая развитие детей и самообразование.

1. Общее понятие статистики. Предмет статистики.

Статистикой называют планомерный и систематический учет осуществляемый в масштабах страны органами государственной статистики во главе с государственным комитетом РФ по статистике.

Статистика - цифровые данные публикуемые в специальных справочниках и средствах массовой информации.

Статистика - специальная научная дисциплина.

Предмет и содержание статистической науки долгое время были дискуссионными. С целью решения этих вопросов в 1954 и 1968 гг. проводились специальные совещания с привлечением широкого круга ученых и практиков не только статистиков, но и специалистов связанных с ней науки. Кроме того, до середины 70-х гг. шла дискуссия о предмете статистики в специальной литературе. В ходе дискуссий выявились 3 основные точки зрения на предмет статистики:

1. Статистика - универсальная наука, изучающая массовое явление природы и общества.

2. Статистика - методологическая наука не имеющая своего предмета познания, а представляющая собой учение о методе, применяемым общественными науками.

3. Статистика - общественная наука, имеющая свой предмет, методологию и исследующая количественные закономерности общественного развития.

В результате проводившихся совещаний и дискуссий в статистической науке первые две точки зрения были большинством ученых и практиков отвергнуты, а третья в основном принята, дополнена и уточнена.

Предметом статистики является количественная сторона массовых социально-экономических явлений, неразрывные связи с их качественной стороной, конкретных условий, места и времени. Из данного определения следуют основные черты предмета статистической науки:

1. Статистика - наука общественная.

2. В отличие от других общественных наук статистика изучает количественную сторону общественных явлений.

3. Статистика изучает массовое явление.

4. Статистика изучает количественную сторону явлений в неразрывной связи с количественной стороной и это находит свое воплощение в существовании системы статистических показателей.

5. Статистика изучает количественную сторону явлений в конкретных условиях места и времени.

2. Метод статистики и статистическая методология.

Под статистической методологией понимается система принципов и методов их реализации направленных на изучение количественных закономерностей, проявляющихся в структуре взаимосвязей и динамике социально-экономических явлений. Важнейшими составными элементами метода статистики и статистической методологии являются массовое статистическое наблюдение, сводка и группировка, а также применение обобщающих статистических показателей и их анализ.

Сущность первого элемента статистической методологии составляет сбор первичных данных об изучаемом объекте. Например: в процессе переписи населения страны собираются данные о каждом человеке, проживающем на ее территории, которая заносится в специальный формуляр.

Второй элемент: сводка и группировка представляет собой разделение совокупности данных, полученных на этапе наблюдения на однородные группы по одному или несколько признаков. Например в результате группировки материалов переписи населения делится на группы (по полу, возрасту, населению, образованию и т.д.).

Сущность третьего элемента статистической методологии заключается в вычислении и социально-экономической интерпретации обобщающих статистических показателей:

1. Абсолютных

2. Относительных

3. Средних

4. Показателей вариации

5. Динамики

Три основных элемента статистической методологии составляют также три стадии любого статистического исследования.

3. Закон больших чисел и статистическая закономерность.

Важное значение для статистической методологии играет закон больших чисел. В наиболее общем виде он может быть сформулирован следующим образом:

Закон больших чисел - общий принцип в силу которого совокупные действия большого числа случайных факторов приводит при некоторых общих условиях к результату почти независящему от случая.

Закон больших чисел порожден особыми свойствами массовых явлений. Массовые явления последние в свою очередь с одной стороны в силу своей индивидуальности отличаются друг от друга, а с другой имеет нечто общее определяющее их принадлежность к определенному классу.

Единичное явление в большей степени подвержено влиянию случайных и несущественных факторов, чем масса явлений в целом. При определенных условиях значение признака у отдельной единицы можно рассматривать как случайную величину, учитывая, что она подчиняется не только общей закономерности, но и формируется под воздействием условий не зависящих от этой закономерности. Именно по этой причине статистика широко использует средние показатели, одним числом характеризующие всю совокупность. Только при большом числе наблюдений случайные отклонения от основного направления развития уравновешиваются, взаимопогашаются и статистическая закономерность проявляется более отчетливо. Таким образом, сущность закона больших чисел заключается в том, что в числах обобщающих результат массового статистического наблюдения закономерность развития социально-экономических явлений выявляется более отчетливо чем при небольшом по объему статистическому исследованию.

4. Отрасли статистики.

В процессе исторического развития в составе статистики как единой науки выделились и получили известную самостоятельность следующие отрасли:

1. Общая теория статистики, которая разрабатывает понятие категорий и методы измерения количественных закономерностей общественной жизни.

2. Экономическая статистика изучающая количественные закономерности процессов воспроизводства на различных уровнях.

3. Социальная статистика, изучающая количественную сторону развития социальной инфраструктуры общества (статистика здравоохранения, образования, культуры, моральная, судебная и др.).

4. Отраслевые статистики (статистика промышленности, агропромышленного комплекса, транспорта, связи и т.д.).

Все отрасли статистики, развивая и совершенствую свою методологию способствуют развитию статистической науки в целом.

5. Основные понятия и категории статистической науки в целом.

Статистическая совокупность - множество элементов одного и того же вида сходных между собой по одним признакам и различающимся по другим. Например: это совокупность отраслей экономики, совокупность ВУЗ, совокупность сотрудничества КБ и т.п.

Отдельные элементы статистической совокупности называются ее единицами. В рассмотренных выше примерах единицами совокупности являются соответственно отрасли, ВУЗ (один) и сотрудник.

Единицы совокупности обладают как правило многими признаками.

Признак - свойство единиц совокупности, выражающее их сущность и имеющее способность варьировать, т.е. изменяться. Признаки, принимающие единичное значение у отдельных единиц совокупности называются варьирующими, а сами значения вариантами.

Варьирующие признаки подразделяются на атрибутивные или качественные. Признак называется атрибутивным или качественным, если его отдельное значение (варианты) выражаются в виде состояния или свойств присущих явлению. Варианты атрибутивных признаков выражаются в словесной форме. Примерами таких признаков могут служить - хозяйственный.

Признак называется количественным, если его отдельное значение выражается в виде чисел. Например: заработная плата, стипендия, возраст, размер ОФ.

По характеру варьирования количественные признаки делятся на дискретные и непрерывные.

Дискретные - такие количественные признаки, которые могут принимать только вполне определенное, как правило целое значение.

Непрерывными - являются такие признаки, которые в определенных пределах могут принимать значение как целое, так и дробное. Например: ВНП страны и т.д.

Различаются также признаки основные и второстепенные.

Основные признаки характеризуют главное содержание и сущность изучаемого явления или процесса.

Второстепенные признаки дают дополнительную информацию и непосредственно связаны с внутренним содержанием явления.

В зависимости от целей конкретного исследования одни и те же признаки в одних и тех же случаях могут быть основными, а в других второстепенными.

Статистический показатель - это категория отображающая размеры и количественные соотношения признаков социально-экономических явлений и их качественной определенности в конкретных условиях места и времени. Следует различать содержание статистического показателя и его конкретное числовое выражение. Содержание, т.е. качественная определенность состоит в том, что показатели всегда характеризуют социально-экономические категории (население, экономика, финансовые институты и т.д.). Количественные размеры статистических показателей, т.е. их числовые значения зависят прежде всего от времени и места объекта, который подвергается статистическому исследованию.

Социально-экономические явления как правило не могут быть охарактеризованы каким-либо одним показателем, Например: уровнем жизни населения. Для комплексной всесторонней характеристики исследуемых явлений необходима научно обоснованная система статистических показателей. Такая система не является постоянной. Она постоянно совершенствуется исходя из потребностей общественного развития.

6. Задачи статистической науки и практики в условиях развития рыночной экономики.

Основными задачами статистики в условиях развития в России рыночных отношений являются следующие:

1. Совершенствование учета и отчетности и сокращение на этой основе документооборота.

2. Усиление работы по контролю за достоверностью статистической информации, предоставляемой предприятиям, учреждениям и организациям всех отраслей экономики и форм собственности.

3. Повышение своевременности статистической информации как в поступающий статистический орган, так и предоставляемые ими структуры государственной власти и управления.

4. Углубление аналитических функций, разрабатываемых статистических данных, формирование тематики проводимых статистических в соответствии с текущими задачами социально-экономическом развитии страны.

5. Дальнейшее развитие и совершенствование статистической методологии на основе все более широкого внедрения ПЭВМ практика и... статистического анализа не прогнозировалась.

Статистическая сводка - метод научной обработки статистических данных собранных в процессе наблюдения, при котором информация относящаяся к отдельной единице обобщается, а затем характеризуется аналитическими показателями и системой таблиц. При сводке получаются статистические данные характеризующие всю совокупность. На данном этапе осуществляется переход от индивидуальных характеристике единиц совокупности и обобщающим показателем, характеризующим всю совокупность.

Различают сводку в узком и широком смысле слова. В узком смысле слова под сводкой понимается техническая операция по подсчету итогов. В широком смысле слова сводка состоит из группировки полученной в процессе наблюдения информации составления систем показателей для характеристики типических групп изложения этих показателей в таблицах, а также подсчета общих и групповых итогов.

2.1. Общее понятие группировок.

Группировки являются таки методом исследований социально-экономических явлений, при котором статистическая совокупность делится на однородные группы, которые раскрывают состояние и развитие всей совокупности.

Группировка является важнейшим этапом статистического исследования, соединяющим сбор первичной информации об объеме исследования и анализ этой информации на основе обобщающих статистических показателей.

Методы группировок разнообразны. Это разнообразие обусловлено с одной стороны огромным множеством признаков, подвергаемых статистическому исследованию, а с другой стороны разнообразными задачами, которые решаются на основе группировок.

2.2. Важнейшая проблема возникающая при группировке.

Важнейшая проблема при построении группировки, является выбор группированного признака или основание группировки.

Группировочный признак - варьирующий признак по которому производится объединение единиц совокупности в группы.

По характеру варьирования, признаки разделяются, как известно, на: атрибутивные и количественные. Это деление определяет особенности решения второй проблемы группировок, а именно - определение числа выделяемых групп. При выборе в качестве группировочных некоторых атрибутивных признаков, может быть выделено только строго определенное количество групп. В частности при группировке населения по полу может быть выделено...

При группировке предприятий по прибыли может быть выделено 3 группы.

Для многих атрибутивных признаков разрабатываются устойчивые группировки, называемые классификацией. Например: классификация отраслей экономики, классификация занятий населения и др.

При группировке по количественному признаку, вопрос о количестве границы групп следует решать исходя из сущности изучаемого социально-экономического явления. При этом следует принимать во внимание такой показатель, как размах вариаций. Чем больше размах варьирования, тем больше образуется групп и наоборот. Необходимо также принимать во внимание численность единиц совокупности по которой строится группировка. При небольшом объеме совокупности, нецелесообразно образовывать большое число групп, т.к. в этом случае в группах не будет достаточного числа единиц для выявления статистических закономерностей.

Существенным вопросом при группировке по количественному признаку является определение интервалов. Показатели числа групп и величины интервалов находятся в обратной зависимости. Чем больше величина интервалов - тем меньше требуется групп и наоборот.

Интервалом называется разность между его верхней и нижней границей.

По величине группировочного признака интервалы подразделяются на равные и неравные. Равные интервалы применяются в тех случаях, когда изменение группировочного признака внутри совокупности происходит равномерно. Расчет величины равного интервала производится по формуле:

k - число групп

Xmax, Xmin - соответственно наибольшее и наименьшее значение признака к качеству групп.

Если распределение группировочного признака внутри совокупности неравномерное, то используются неравные интервалы. Неравные интервалы могут быть прогрессивно возрастающими и прогрессивно убывающими. часто при группировке применяются так называемые специализированные интервалы, т.е. такие, которые определяются исходя из цели исследования и сущности явления. Например: при группировке имеющей целью охарактеризовать трудоспособное население страны используются пятилетние интервалы возраста людей.

Третьей проблемой построения группировок является обозначение границ интервалов. При выделении интервалов по дискретным количественным признакам следует обозначать их границы т.о., чтобы нижняя граница последующего интервала отличалась от верхней границы предыдущего на единицу.

При группировке по непрерывному количественному признаку границы обозначаются так, чтобы группы были четко отделены одна от другой. Это достигается добавлением числовым границам интервалов указаниям о том, куда следует относить единицу обладающей группировочным признаком в размерах точно совпадающих с границами интервалов. Обычно дополнительные разъяснения к числовым границам интервалов образуемым по непрерывным количественным принципам выражаются словами: «более», «менее», «свыше» и т.д.

2.3. Виды группировок.

В зависимости от задач, решаемых с помощью группировок выделяют следующие их виды:

Типологические

Структурные

Аналитические

Главная задача типологической состоит в классификации социально-экономических явлений путем выделения однородных к качественным отношениям групп.

Качественная однородность при этом понимается в том смысле, что в отношении изучаемого свойства все единицы совокупности подчиняются одному закону развития. Например: группировка предприятиям отраслей экономики.

Абсолютные и относительные величины.

Абсолютной величиной называется показатель, выражающий размеры социально-экономического явления.

Относительной величиной в статистике называется показатель, выражающий количественное соотношение между явлениями. Он получается в результате деления одной абсолютной величины на другую абсолютную величину. Величина с которой мы производим сравнения называется основанием или базой сравнения .

Абсолютные величины - всегда величины именованные.

Относительные величины выражаются в коэффициентах, процентах, промили и т.д.

Относительная величина показывает, во сколько раз, или на сколько процентов сравниваемая величина больше или меньше базы сравнения.

В статистике различают 8 видов относительных величин:

1. Сущность и значение средних величин.

Средние величины являются одними из наиболее распространенных обобщающих статистических показателей. Они имеют своей целью одним числом охарактеризовать статистическую совокупность состоящую из меньшинства единиц. Средние величины тесно связаны с законом больших чисел. Сущность этой зависимости заключается в том, что при большом числе наблюдений случайные отклонения от общей статистики взаимопогашаются и в среднем более отчетливо проявляется статистическая закономерность.

С помощью метода средних решаются следующие основные задачи:

1. Характеристика уровня развития явлений.

2. Сравнение двух или нескольких уровней.

3. Изучение взаимосвязей социально-экономических явлений.

  1. 4. Анализ размещения социально-экономических явлений в пространстве.

Для решения этих задач статистическая методология разработала различные виды средних.

2. Среднее арифметическое.

Для выяснения методики расчета средней арифметической используем следующие обозначения:

X - арифметический признак

X (X1, X2, ... X3) - варианты определенного признака

n - число единиц совокупности

Средняя величина признака

В зависимости от исходных данных средняя арифметическая может быть рассчитана двумя способами:

1. Если данные статистического наблюдения на сгруппированы, или сгруппированные варианты имеют одинаковые частоты, то рассчитывается средняя арифметическая простая:

2. Если частоты сгруппированы в данных разные, то рассчитывается среднее арифметическое взвешанное:

Численность (частоты) вариантов

Сумма частот

Среднее арифметическое рассчитывается по разному в дискретных и интервальных вариационных рядах.

В дискретных рядах варианты признака умножаются на частоты, эти произведения суммируются и полученная сумма произведений делится на сумму частот.

Рассмотрим пример вычисления средней арифметической в дискретном ряду:

Заработная плата, руб. Xi

Число сотрудников, чел. fi

Произведение вариант на веса (частоты) Xi*fi

В интервальных рядах значение признака задано, как известно, в виде интервалов, поэтому, прежде чем рассчитывать среднюю арифметическую, нужно перейти от интервального ряда к дискретному.

В качестве вариантов Xi используется середина соответствующих интервалов. Они определяются как полусумма нижней и верхней границ.

Если у интервала отсутствует нижняя граница, то его середина определяется как разность между верхней границей и половиной величины следующих интервалов. При отсутствии верхних границ, середина интервала определяется как сумма нижней границы и половины величины предыдущего интервала. После перехода к дискретному ряду дальнейшие вычисления происходят по методике рассмотренной выше.

Если веса fi заданы не в абсолютных показателях, а в относительных, то формула расчета средней арифметической будет следующей:

pi - относительные величины структуры, показывающие, какой процент составляют частоты вариантов в сумме всех частот.

Если относительные величины структуры заданы не в процентах, а в долях, то среднее арифметическое будет рассчитываться по формуле:

3. Средняя гармоническая.

Средняя гармоническая является первообразной формой средней арифметической. Она рассчитывается в тех случаях, когда веса fi не заданы непосредственно, а входят как сомножитель в один из имеющихся показателей. Также как и арифметическая, средняя гармоническая может быть простой и взвешанной.

Средняя гармоническая невзвешанная:

Средняя гармоническая смешанная:

Wi - произведение вариантов на частоты

При расчете средних величин необходимо помнить о том, что всякие промежуточные вычисления должны приводить как в числителе, так и в знаменателе и имеющим экономический смысл показателям.

4. Структурное среднее.

Структурное среднее характеризует состав статистической совокупности по одному из варьирующих признаков. К этим средним относятся мода и медиана .

Мода - такое значение варьирующего признака, которое в данном ряду распределения имеет наибольшую частоту.

В дискретных рядах распределений мода определяется визуально. Сначала определяется наибольшая частота, а по ней модальное значение признака. В интервальных рядах для вычисления моды используется следующая формула:

Xmo - нижняя граница модальности (интервал ряда с наибольшей частотой)

Mo - величина интервала

fMo - частота модального интервала

fMo-1 - частота интервала предшествующего модальному

fMo+1 - частота интервала следующего за модальным

Медианой называется такое значение варьирующего признака, которое делит ряд распределения на две равные части по объему частот. Медиана рассчитывается по разному в дискретных и интервальных рядах.

1. Если ряд распределения дискретный и состоит из четного числа членов, то медиана определяется как средняя величина из двух серединных значений рангированного ряда признаков.

2. Если в дискретном ряду распределения нечетное число уровней, то медианой будет серединное значение рангированного ряда признаков.

В интервальных рядах медиана определяется по формуле:

Нижняя граница медианного интервала (интервала для которого накопленная частота впервые превысит полусумму частот)

Me - величина интервала

Сумма частот ряда

Сумма накопленных частот предшествующих медианному интервалу

Частота медианного интервала

1. Общее понятие о вариации.

Вариацией называется различие значений признака у отдельных единиц совокупности.

Вариация возникает в силу того, что отдельные значения признака формируются по влияние большого числа взаимосвязанных факторов. Эти факторы часто действуют в противоположных направлениях и их совместное действие формирует значение признаков у конкретной единицы совокупности. Необходимость изучения вариаций связана с тем, что средняя величина, обобщающая данные статистического наблюдения, на показывает как колеблется вокруг нее индивидуальное значение признака. Вариации присущи явлениям природы и общества. При этом революция в обществе происходит быстрее, чем аналогичные изменения в природе. Объективно существуют также вариации в пространстве и во времени.

Вариации в пространстве показывают различие статистических показателей относящихся к различным административно-территориальным единицам.

Вариации во времени показывают различие показателей в зависимости от периода или момента времени к которым они относятся.

2. Меры вариаций.

К примерам вариаций относятся следующие показатели:

1. размах вариаций

2. среднее линейное отклонение

3. среднее квадратическое отклонение

4. дисперсия

5. коэффициент

1. Размах вариаций является ее простейшим показателем. Он определяется как разность между максимальным и минимальным значение признака. Недостаток этого показателя заключается в том, что он зависит только от двух крайних значений признака (min, max) и не характеризует колеблимость внутри совокупности. R=Xmax-Xmin.

2. Среднее линейное отклонение является средней величиной абсолютных значений отклонений от средней арифметической. Оно определяется по формуле:

Простая

Отклонения берутся по модулю, т.к. в противном случае, из-за математических свойств средней величины, они всегда были бы равны нулю.

4. Дисперсия (средний квадрат отклонений) имеет наибольшее применение в статистике как показатель меры колеблимости.

Дисперсия определяется по формулам:

пример: стр. 36

Дисперсия является именованным показателем. Она измеряется в единицах соответствующих квадрату единиц измерения изучаемого признака. В данном случае она показывает, что средний размер отклонения прибыли по 50 предприятиям от средней прибыли составляет 1,48 .

Дисперсия может быть также определена по формуле:

3. Среднее квадратическое отклонение определяется как корень из дисперсии.

По исходным данным приведенным выше, среднее квадратическое отклонение равно:

5. Коэффициент вариаций определяется как отношение среднего квадратического отклонения к средней величине признака, выраженное в процентах:

Он характеризует количественную однородность статистической совокупности. Если данный коэффициент < 50%, то это говорит об однородности статистической совокупности. Если же совокупность не однородна, то любые статистические исследования можно проводить только внутри выделенных однородных групп.

3. Дисперсия альтернативного признака.

Альтернативными называются 2 взаимоисключающих друг друга признака. То признаки, которыми каждая отдельная единица совокупности либо обладает, либо не обладает. Наличие альтернативного признака принято обозначать через единицу, а отсутствие через 0. Долю единиц обладающих данным признаком обозначают через p (п), а долю единиц на обладающих данным признаком обозначают через q. При этом p+q=1.

Дисперсия альтернативного признака определяется по формуле:

4. Виды дисперсий. Привила их сложения.

Если исследуемую статистическую совокупность разделить на группу, то для каждой из них можно определить групповые средние и дисперсии. Эти дисперсии будет характеризовать колеблимость изучаемого признака каждой отдельной группе. На этой основе можно определить среднюю изнутри групповых дисперсий.

ni=fi - численность единиц в отдельных группах

Эта дисперсия характеризует случайную вариацию признака, на зависящую от фактора положенного в основание группировки.

Вычисляется также межгрупповая дисперсия.

и ni=fi соответственно средние и численности по отдельным группам.

Эта дисперсия характеризует вариацию по влиянием группировочного признака. Сумма средней изнутри групповых и межгрупповой дисперсий позволяет определить общую дисперсию.

Данное равенство называют правилом сложения дисперсий.

; , т.е. существует тесная зависимость между изготовлением деталей и другими показателями.

Если значения исследуемого признака выражаются в долях или коэффициентах, то правило сложения дисперсий выражается следующими формулами:

ni - численность единиц в отдельных группах

pi - доля изучаемого признака во всей совокупности

средняя из внутригрупповых дисперсий для долей признаков

1. Виды и формы зависимости между социально-экономическими явлениями.

Многообразие взаимосвязей в которых находятся социально-экономические явления, рождают необходимость в их классификации.

По видам различают функциональную и корреляционную зависимость.

Функциональной называют такую зависимость, при которой одному значению факторного признака X соответствует одно строго определенное значение результативного признака Y.

В отличие от функциональной зависимости, корреляционная выражает такую связь между социально-экономическими явлениями, при которой одному значению факторного признака X могут соответствовать несколько значений результативного признака Y.

По направлению различают прямую и обратную зависимость.

Прямой называют такую зависимость, при которой значение факторного признака X и результативного признака Y изменяются в одном направлении. Т.о. при увеличении значения X, значения Y в среднем увеличиваются, а при уменьшении X - Y уменьшается.

Обратная зависимость между факторным и результативным признаками, если они изменяются в противоположных направлениях.

2. Статистические методы изучения взаимосвязей.

Важное место в статистическом изучении взаимосвязей занимают следующие методы:

1. Метод приведения параллельных данных.

2. Метод аналитических группировок.

3. Графический метод.

4. Балансовый метод.

6. Корреляционно-регрессионный.

1. Сущность метода приведения параллельных данных заключается в следующем:

Исходные данные по признаку X располагаются в порядке возрастания или убывания, а по признаку Y записываются соответствующие им показатели. Путем сопоставления значений X и Y, делается вывод о наличии и направлении зависимости.

3. Сущность графического метода составляет наглядное представление наличия и направления взаимосвязей между признаками. Для этого значение факторного признака X располагается по оси абсцисс, а значение результативного признака по оси ординат. По совместному расположению точек на графике делают вывод о направлении и наличии зависимости. При этом возможны следующие варианты:

а \, б/ (вверх) , в\ (вниз).

Если точки на графике расположены беспорядочно (а), то зависимость между изучаемыми признаками отсутствует .

Если точки на графике концентрируются вокруг прямой (б)/, зависимость между признаками прямая .

Если точки концентрируются вокруг прямой (в)\, то это свидетельствует о наличии обратной зависимости.

На основе метода параллельных данных и графического метода, могут быть рассчитаны показатели, характеризующие степень тесноты корреляционной зависимости.

Наиболее кратным из них является коэффициент знаков Фехнера. Он рассчитывается по формуле:

C - сумма совпадающих знаков отклонений индивидуальных значений признака от средней.

H - сумма несовпадений

Данный коэффициент изменяется в пределах (-1;1).

Значение KF=0 свидетельствует об отсутствии зависимости между изучаемыми признаками.

Если KF=±1, то это говорит о наличии функциональной прямой (+) и обратной (-) зависимости. При значении KF>½0,6½ делается вывод о наличии сильной прямой (обратной) зависимости между признаками. Кроме того на основе исходных данных о факторном и результативном признаках, может быть рассчитан коэффициент корреляции рангов Спирмена , который определяется по формуле:

Квадраты разности рангов

(R2-R1), n - число пар рангов

Данный коэффициент, как и предыдущий, изменяется в тех же пределах и имеет одинаковую с KF экономическую интерпретацию.

В тех случаях, когда значение X или Y выражаются одинаковыми показателями, коэффициент корреляции рангов рассчитывается по следующей формуле:

tj - одинаковое число рангов в j - ряду

Если исследуется зависимость между тремя и более математическими признаками, то для ее исследования применяется коэффициент конкордации определяемый по формуле:

m - количество факторов

n - число наблюдений

S - отклонение суммы квадратов рангов от средней квадратов рангов

3. Изучение зависимости между количественными признаками.

Для исследования взаимосвязи качественных альтернативных признаков, принимающих только 2 взаимоисключающих значения, используется коэффициент ассоциации и контингенции . При расчете этих коэффициентов составляется т.н. таблица 4-х камней, а сами коэффициенты рассчитываются по формуле:

Группы по признаку Y

Группы по признаку X

Если коэффициент ассоциации ³ 0,5, а коэффициент контингенции ³ 0,3, то можно сделать вывод о наличии существенной зависимости между изучаемыми признаками.

Если признаки имеют 3 или более градаций, то для изучения взаимосвязей используются коэффициенты Пирсена и Чупрова. Они рассчитываются по формулам:

С - коэффициент Пирсена

К - коэффициент Чупрова

j - показатель взаимной сопряженности

K - число значений (групп) первого признака

K1 - число значений (групп) второго признака

fij - частоты соответствующих клеток таблицы

mi - столбцы таблицы

nj - строки

Для расчета коэффициентов Пирсена и Чупрова составляется вспомогательная таблица:

Группа признака Y

Группа признака X

При ранжировании качественных признаков с целью изучения их взаимосвязи используется коэффициент корреляции Кэндалла .

n - число наблюдений

S - сумма разностей между числом последовательностей и числом инвервий по второму признаку.

P - сумма значений рангов, следующих за данными и превышающих его величину

Q - сумма значений рангов, следующих за данными и меньших его величины (учитывается со знаком «-»).

При наличии связанных рангов формула коэффициента Кендалла будет следующей:

Vx и Vy определяются отдельно для рангов X и Y по формуле:

5. Методы выявления основной тенденции рядов динамики.

Уровни ряда динамики формируются под вниманием 3-х групп факторов:

1. Факторов определяющих основное направление, т.е. тенденцию развития изучаемого явления.

2. Факторов действующих периодически, т.е. направленных колебаний по неделям месяца, месяцам года и т.д.

3. Факторов действующих в разных, иногда в противоположных направлениях и не оказывающих существенного влияния на уровень данного ряда динамики.

Основной задачей статистического изучения данамики является выявление тенденции.

Основными методами выявления тенденции рядов динамики являются:

Метод укрупнения интервалов

Метод скользящей средней

Метод аналитического выравнивания

1. Сущность метода укрупнения интервалов заключается в следующем:

Исходный ряд динамики преобразуется и заменяется другими состоящими из других уровней, относящихся к укрупненным периодам или моментам времени.

Например: ряд динамики прибыли малого предприятия за 1997 год по кварталам того же года. При этом уровни ряда за укрупненные периоды или моменты времени могут представлять собой либо суммарные, либо средние показатели. Однако в любом случае рассчитанные таким образом уровни ряда более отчетливо выявляют тенденции, поскольку сезонные и случайные колебания при суммировании или определении средних взаимопогашаются и уравновешиваются.

2. Метод скользящей средней , как и предыдущий предполагает преобразование исходного ряда динамики. Для выявления тенденции формируются интервал, состоящий из одинакового числа уровней. При этом каждый последующий интервал получается путем смещения на 1 уровень от начального. По образованным таким образом интервалам определяются в начале сумма, а затем средние. Технически удобнее определять скользящие средние для нечетного интервала. В этом случае рассчитанная средняя величина будет относиться к конкретному уровню ряда динамики, т.е. к середине интервала скольжения.

При определении скользящей средней по четному интервалу, расчетное значение средней величины относится к промежутку между двумя уровнями, и таким образом теряют экономический смысл. Это делает необходимыми дополнительные расчеты связанные с центрированием по формуле арифметической простой из двух соседних не центрированных средних.