Курс лекций за первый семестр

тогда p+q=1.

Альтернативный признак принимает 2 значения 0 и 1 с весами p и q.

[pic]; [pic]

Прямые признаки – это такие признаки, величина которых увеличивается с

увеличением исследуемого явления.

Обратные признаки – признаки, величина которых уменьшается с увеличением

исследуемого явления.

Максимальная дисперсия доли равна 0,25.

Тема 6: Моделирование рядов распределения.

§1. Фактическое и теоретическое распределение

§2. Кривая нормального распределения.

§3. Проверка гипотезы о нормальном распределении.

§4. Критерии согласия: Пирсона, Романовского, Колмогорова.

§5. Практическое значение моделирования рядов распределения.

§1. Фактическое и теоретическое распределение

Одна из важнейших целей изучения рядов распределения состоит в том,

чтобы выявить закономерность распределения и определить ее характер.

Закономерности распределения наиболее отчетливо проявляются только при

большом количестве наблюдений.

Фактическое распределение может быть изображено графически с помощью

кривой распределения – графически изображается в виде непрерывной линии

изменения частот в вариационном ряду функционально связанного с изменением

варианта.

Под теоретической кривой распределения понимается кривая данного типа

распределения в общем виде исключающего влияние случайных для

закономерности факторов.

Теоретическое распределение может быть выражено аналитической формулой

которая называется аналитической формулой. Наиболее распространенным

является нормальное распространение.

§2. Кривая нормального распределения.

Закон нормального распределения:

[pic];

у – ордината нормального распределения

t – нормированное отклонение.

[pic]; е=2,7218; xi – варианты вариационного ряда; [pic] - среднее;

Свойства:

Функция нормального распределения – четная, т.е. f(t)=f(-t), [pic].

Функция нормального распределения полностью определяется [pic] и СКО.

§3. Проверка гипотезы о нормальном распределении.

Причиной частого обращения к закону распределения является то, что

зависимость возникающая в результате действия множества случайных причин

ни одна из которых не является преобладающей. Если в вариационном ряду

рассчитали Мо=Ме, то это может указывать на близость к нормальному

распределению. Наиболее точная проверка соответствия нормальному закону

производится с помощью специальных критериев.

§4. Критерии согласия: Пирсона, Романовского, Колмогорова.

Критерий Пирсона.

[pic]

[pic] - теоретическая частота

[pic] - эмпирическая частота

Методика расчета теоретических частот.

1. Определяется среднее арифметическое и [pic] по интервальному

вариационному ряду, считается t по каждому интервалу.

2. Находим значение плотности вероятности для нормированного закона

распределения.[pic] СТР.49

3. Находим теоретическую частоту. [pic]

l – длина интервала

[pic] - сумма эмпирических частот

[pic] - плотность вероятности

округлить значение до целых

4. Расчет коэффициента Пирсона

[pic]

5. табличное значение [pic]

d.f. – количество интервалов – 3

d.f. – количество степеней свободы.

6. если [pic]>[pic], то распределение не является нормальным, т.е.

гипотеза о нормальном распределении отменяется. Если [pic]<[pic], то

распределение является нормальным.

Критерий Романовского.

[pic]

[pic] - критерий Пирсона расчетный;

[pic] - число степеней.

Если С<3, то распределение близко к нормальному.

Критерий Колмогорова

[pic], D – максимальное значение между накопленными эмпирическими и

теоретическими частотами. Необходимое условие для использования

Колмогорова: Число наблюдений более 100. По специальной таблице

вероятностей [pic] с которой можно утверждать, что данное распределение

является нормальным.

§5. Практическое значение моделирования рядов распределения.

1. возможность применить к эмпирическому распределению законов

нормального распределения.

2. возможность использования правила 3х сигм.

3. Возможность избежать дополнительных трудоемких и затратных расчетов,

по исследованию совокупности зная, что распределение нормальное.

Тема 7: Выборочное наблюдение.

§1. Понятие выборочного наблюдения. Причины его применения.

§2. Виды выборочного наблюдения.

§3. Ошибки выборочного наблюдения.

§4. Задачи выборочного наблюдения

§5. Распространение данных выборочного наблюдения на генеральную

совокупность.

§6. Малая выборка.

§1. Понятие выборочного наблюдения. Причины его применения.

Выборочное наблюдение – такое не сплошное наблюдение, при котором

статистическому обследованию подвергаются единицы изучаемой совокупности,

отобранные определенным образом.

Цель (задача) выборочного наблюдения: по обследуемой части дать

характеристику всей совокупности единиц при условии соблюдения всех правил

и принципов статистического наблюдения.

Причины применения выборочного наблюдения:

1. экономия материальных, трудовых затрат и времени;

2. возможность более детально и подробно изучит отдельные единицы

статистической совокупности и их группы.

3. некоторые специфические задачи можно решить только с применением

выборочного наблюдения.

4. грамотное и хорошо организованное выборочное наблюдение дает высокую

точность результатов.

Генеральная совокупность – совокупность единиц, из которых производится

отбор.

Выборочная совокупность – совокупность отобранных для обследования

единиц. В статистике принято различать параметры генеральной совокупности

и выборочной совокупности.

|Совокупность|Средняя|Дисперсия|Объем |Доля|

|Генеральная |( |(2 |N |( |

|Выборочная |[pic] |S2 |n |p |

Виды выборочного наблюдения

По методу отбора:

Повторное

Попавшая в выборку единица после регистрации наблюдаемых признаков

возвращаются в генеральную совокупность для участия в дальнейшей процедуре

отбора.

Объем генеральной совокупности остается неизменным, что обуславливает

постоянное попадание в выборку какой-либо единицы.

Бесповторное

Попавшая в выборку единица не возвращается в совокупность, из которой

происходит отбор.

По способу отбора:

Собственно-случайная заключается в отношении единиц из генеральной

совокупности наугад или наудачу без каких-либо элементов системности.

Однако прежде чем проводить такую выборку, нужно убедиться, что все

единицы генеральной совокупности имеют равные шансы попасть в выборку, т.е.

в полном перечне единиц статистической совокупности отсутствуют пропуски

или игнорирования отдельных единиц. Следует, также, четко установить

границы генеральной совокупности. Технически сложившейся отбор

осуществляется методом жеребьевки или с помощью таблицы случайных чисел.

Механическая выборка (каждый 5 по списку) применяется в случаях, когда

генеральная совокупность каким-либо образом упорядочена, т.е. имеется

определенная последовательность в распределении единиц. При проведении

механической выборки устанавливается пропорция отбора, которая

устанавливается соотношением генеральной совокупности и выборочной

совокупности.

Опасность ошибки при механической выборке может появляться вследствие:

случайного совпадения выбранного интервала и циклических закономерностей в

расположении единиц генеральной совокупности.

Районированная выборка используется когда все единицы генеральной

совокупности можно разбить на группы (районы, страны) по какому-либо

признаку.

Комбинированная выборка.

Отбор единиц может быть произведен:

1. либо пропорционально объему группы

2. либо пропорционально внутригрупповой дифференциации признака

1. [pic], где n – объем выборочной совокупности, N – объем генеральной

совокупности, ni – объем выборки i-группы, Ni – объем i выборки.

2. [pic] - этот способ является более точным, но в ходе проведения

выборочного наблюдения очень трудно определить заранее о вариации. (до

проявления наблюдения).

Серийный отбор.

Используется когда ЕСС объединены в небольшие группы (серии), например

упаковка с готовой продукцией, студенческие группы. Сущность серийной

выборки – серии отбираются собственно случайным, либо механическим

способом, а затем осуществляется сплошное обследование внутри отобранной

серии.

Комбинированный отбор.

Это комбинация рассмотренных выше способов отбора чаще применяется

комбинация типичных и серийных серии, т.е. отбор серий из нескольких

типических групп.

Отбор моет быть еще многоступенчатым и одноступенчатым, многофразным и

однофразным.

Многоступенчатый отбор: из генеральной совокупности сначала извлекаются

укрупненные группы, затем более мелкие, и так до тех пор, пока не будут

отобраны те единицы, которые подвергаются обследованию.

Многофразная выборка: предполагает сохранение одной и той же единицы отбора

на всех этапах его проведения. При этом отобранные на каждой последующей

стадии единицы отбора подвергаются обследованию, программа которого

расширяется (Пример: студенты всего института, затем студенты каких-то

факультетов).

§3. Ошибки выборочного наблюдения.

Ошибки репрезентативности возникают только при выборочном наблюдении.

Возникают в силу того, что выборочная совокупность не может в точности

воспроизвести генеральную совокупность. Избежать их нельзя, но они легко

поддаются прогнозированию и при необходимости их можно свести к минимуму.

Ошибка выборочного наблюдения – это разности между величиной параметра в

генеральной совокупности и его величиной вычисленной по результатам

выборочного наблюдения. (х=-(+[pic], (х – предельная ошибка в выборке, ( -

генеральная средняя; [pic] - выборочная средняя.

Предельная ошибка выборки – величина случайная исследованию

закономерностей случайны ошибок выборки посвящены работы Чебышева. В

теореме Чебышева доказано, что (х не превышает: [pic] - средняя ошибка

выборки.t-коэффициент доверия указывает на вероятность данной ошибки. Стр

42-43.

В случае, когда нужно определить t по известной F(t) берем F(t) ближайшую

большую и по ней определяем t.

Предельная ошибка доль

[pic], р – доля.

Если отбор был осуществлен бесповторным способом, то в формулы предельных

ошибок добавляется

[pic] - поправка на бес повторность.

Для каждого вида выборочного наблюдения представленная ошибка,

рассчитываются по разному:

1. собственно случайное и механическое наблюдение [pic]; [pic]

2. Районированное наблюдение

[pic]

[pic]

3. Серийная выборка

[pic]

r – количество серий в выборке;

R – количество серий в генеральной совокупности;

[pic];

[pic] - меж групповая дисперсия доли.

§4. Задачи выборочного наблюдения

Применяется для следующих задач:

1. n - ? для определения объема выборки по известной F(t), (x.

2. определение (x выборки по известной F(t), n

3. определение F(t) по известным (x и n

1 задача n - ? Сначала n определяется по формуле повторного отбора [pic],

[pic] для бесповторного отбора: [pic]

Способы для определения дисперсии:

1. ее берут из предыдущих аналогичных исследований.

2. СКО([pic]

3. СКО при нормальном распределении ( 1/6 размаха вариации.

4. если распределение заведомо асимметричное, то СКО ( 1/5 размаха

вариации

5. Для доли применяется дисперсия максимально возможная р(1-р)=0,25

6. при n(100, то (2=S2 – выборочная дисперсия

30( n (100, то (2=S2(n/n-1), (2 – генеральная дисперсия

n<30, то S2 ( малая, т.к. дисперсия выборочная) и все расчеты ведутся по

S2

При расчете n не следует гнаться за большим значением t и за малыми

предельными ошибками, т.к. это ведет к увеличению n следовательно, к

увеличению затрат. По следующему закону аналогично.

§5. Распространение данных выборочного наблюдения на генеральную

совокупность.

Конечной целью любого ВН является характеристика генеральной

совокупности.

Величины, рассчитанные по результатам ВН распространяются на генеральную

совокупность с учетом предела их предельной ошибки.

Предположим, что потребление йогурта в месяц одним человеком.

[pic]

250-20(((250+20; 230(((270

А всего 1000 человек

[pic]

230000(((270000

Для доли

p-(p(((p+(p

48%-5%(((48%+5%

43%(((53%

§6. Малая выборка.

В практике статистического исследования в современных условиях все чаще

приходится сталкиваться с небольшими по объему выборками.

Малая выборка – выборка наблюдения численность единиц которого не

превышает 30, n(30/

Разработка теории малой выборки была проделана английским статистом Госсет,

писавшим под псевдонимом student в 1908 году.

Он доказал, что оценка расхождения между средствами малой выборки и

генеральной выборки имеет особый закон распределения. При расчетах по малой

выборке величина (2 не рассчитывается. tст для возможных пределов ошибки

пользуются критерием student. Стр.44-45. [pic] - вероятность обратного

события.

Количество степеней свободы

d.f=n-1,

предельная ошибка малой выборки

[pic]

предельная ошибка доли

[pic]

Тема 8: Корреляционно-регрессионный анализ и моделирование.

§1. Понятие корреляционной связи и КРА.

§2. Условия применения и ограничения КРА.

§3. Парная регрессия на основе метода наименьших квадратов.

§4. Применение парного линейного уравнения регрессии.

§5. Показатели тесноты связи и силы связи.

§6. Множественная корреляция.

§1. Понятие корреляционной связи и КРА.

Функциональная связь y=5x

Корреляционная связь [pic]

Различают 2 типа связей меду различными явлениями и их признаком

функциональную и статистическую.

Функциональной называется такая связь когда с изменением значения одной из

переменных вторая изменяется строго определенным образом, т.е., значению

одной переменной соответствует одно или несколько точно заданных значений

другой переменной. Функциональная связь возможна лишь в том случае, когда

переменная у зависит от переменной х и не от каких других факторов не

зависит, но в реальной жизни такое невозможно.

Статистическая связь существует в том случае, когда с изменением значения

одной из переменных вторая может в определенных пределах принимать любые

значения, но ее статистические характеристики изменяются по определенному

закону.

Важнейший частный случай статистической связи – корреляционная связь.

При корреляционной связи разным значениям одной переменной соответствуют

различные средние значения другой переменной, т.е. с изменением значения

признака х закономерным образом изменяется среднее значение признака у.

Слово корреляция ввел английский биолог и статист Френсис Галь

(correlation)

Корреляционная связь может возникнуть разными путями:

. причинная зависимость вариации результативного признака от вариации

факторного признака.

. Корреляционная связь может возникнуть между 2 следствиями одной

причины (пожары, кол-во пожарников, размер пожара)

. Взаимосвязь признаков каждый из которых и причина и следствие

одновременно (производительность труда и з/плата)

В статистике принято различать следующие виды зависимости:

1. парная корреляция – связь между 2мя признаками результативным и

факторным, либо между двумя факторными.

2. частная корреляция – зависимость между результативным и одним

факторным признаком при фиксированном значении другого факторного

признака.

3. множественная корреляция – зависимость результативного признака от

двух и более факторных признаков включенных в исследование.

Задачей корреляционного анализа является количественная оценка тесноты

связи между признаками. В конце 19 века Гальтон и Пирсон исследовали

зависимость между ростом отцов и детей.

Регрессия исследует форму связи. Задача регрессионного анализа –

определение аналитического выражения связи.

Корреляционно-регрессионный анализ как общее понятие включает в себя

изменение тесноты связи и установления аналитического выражения связи.

§2. Условия применения и ограничения КРА.

1. наличие массовых данных, т.к. корреляционная связь является

статистической

2. необходима качественная однородность совокупности.

3. подчинение распределения совокупности по результативному и

факторному признаку, нормальному закону распределения, что связано

с применением метода наименьших квадратов.

§3. Парная регрессия на основе метода наименьших квадратов.

Регрессионный анализ заключается в определении аналитического

выражения связи. По форме различают линейную регрессию, которая

выражается уравнением прямой [pic], и не линейную регрессию [pic] или

[pic].

По направлению связи различают на прямую т.е. с увеличением признака х

увеличивается признак у.

Обратная т.е. с увеличением х уменьшается у.

1. способ графический – нанеся эмпирические данные на поле

корреляции, но более точная оценка производится с помощью метода

наименьших квадратов.

2. МНК

Х – признак фактический

У - признак результативный

[pic]

[pic]

Разница между фактическим значением и значением рассчитанным по

уравнению связи возведенное в квадрат должна стремиться к минимуму.

При МНК min сумма квадратов отклонений эмпирических значений у от

теоретических полученных по выбранному уравнению регрессии.

Для линейной зависимости

[pic]

для параболы

[pic]

Для гиперболы

[pic]

параметры a,b,c записываются в уравнение, затем подставляем полученное

уравнение эмпирическое значение xi и находим теоретическое значение yi.

Затем сравниваем yi теоретическое и yi эмпирическое. Сумма квадратов

разности между ними должна быть минимальна. Выбираем тот вид зависимости

при котором выполняется данная зависимость.

В уравнении парной линейной регрессии:

b – коэффициент парной линейной регрессии, он измеряет силу связи, т.е.

характеризует среднее по совокупности отклонение у от его средней величины

на принятую единицу измерения.

b=20 при изменении х на 1 признак у отклониться от своего среднего

значения на 20 в среднем по совокупности.

Положительный знак при коэффициенте регрессии говорит о прямой связи между

признаками, знак «-» говорит об обратной связи между признаками.

§4. Применение парного линейного уравнения регрессии.

Основное применение – прогнозирование по уравнению регрессии.

Ограничением при прогнозировании служат условия стабильности других

факторов и условий процесса. Если резко измениться в нем среда

протекающего процесса, то данное уравнение регрессии не будет иметь места.

Точечный прогноз получается подстановкой в уравнение регрессии

ожидаемого значения фактора. Вероятность точной реализации такого прогноза

крайне мала.

Если точечный прогноз сопровождается значением средней ошибки

прогноза, то такой прогноз называется интервальным.

Средняя ошибка прогноза образуется из двух видов ошибок:

1. ошибок 1 рода – ошибка линии регрессии

2. ошибка 2 рода – ошибка связанная с ошибкой вариации.

Средняя ошибка прогноза.

[pic]

[pic]- ошибка положения линии регрессии в генеральной совокупности

n - объем выборки

xk – ошибочное значение фактора

[pic] - СКО результативного признака от линии регрессии в генеральной

совокупности

Корреляционный анализ предполагает оценку тесноты связи. Показатели:

1. линейные коэффициент корреляции – характеризует тесноту и направление

связи между двумя признаками в случае наличия между ними линейной

зависимости

[pic]

при [pic]=-1 связь функциональная обратная, [pic]=1 связь функциональная

прямая, при [pic]=0 связь отсутствует.

МИНУСЫ

Применяется только для линейных связей, используется для оценки связей

между количественными признаками. Рассчитываются только по индивидуальным

значениям.

Корреляционное отношение:

Эмпирическое: [pic] оба вида дисперсии рассчитываются по результативному

признаку.

Теоретическое: [pic]

[pic] - дисперсия значений результативного признака рассчитанных по

уравнению регрессии

[pic] - дисперсия эмпирического значения результативного признака

[pic]

ПЛЮСЫ

. высокая степень точности

. подходит для оценки тесноты связи между описательным и

количественным признаком, но количественный должен быть

результативным

. подходит для любых типов связей

Коэффициент корреляции Спирмена

|xi|yi|

|10|1 |

|20|7 |

|30|4 |

Ранги – порядковые номера единиц совокупности в ранжированном ряду.

Ранжировать оба признака необходимо в одном и том же порядке от меньших к

большим или наоборот. Если ранги единиц совокупности обозначить рх и ру,

то коэффициент корреляции рангов примет следующий вид:

[pic]

Преимущества коэффициента корреляционного ряда:

1. Ранжировать можно и по описательным признакам, которые нельзя выразить

численно, следовательно расчет коэффициента Спирмена возможен для

следующих пар признаков: кол-во – кол-во; описательный –

количественный; Описательный – описательный. (образование –

описательный признак)

2. показывает направление связи

Недостатки коэффициента Спирмена.

1. одинаковым разностям рангов могут соответствовать совершенно

отличные разности значения признака (в случае количественных

признаков). Пример: Выработка электроэнергии страны в год

США 2400 кВт/ч 1

РФ 800 кВт/ч 2

Канада 600 кВт/ч 3

Если среди значения Спирмена встречаются несколько одинаковых, то

образуются связанные ранги т.е. одинаковые средние номера

800 1

600 2,5

600 2,5

400 4

В данном случае коэффициент Спирмена рассчитывается следующим образом:

[pic]

j – номера связок по порядку для признака х

Aj – число одинаковых рангов в j связи по х

k – номера связок по порядку признака у

Bk – число одинаковых рангов в к-ой связке по у

4. Коэффициент корреляции ранга Кендалла

[pic] - максимальная сумма ранга

S – фактическая сумма рангов

[pic]

Дает более строгую оценку чем коэффициент Спирмена. [pic]

Для расчета [pic] все единицы ранжируются по признаку х по признаку у

для каждого ранга подсчитывается число последующих рангов превышающих

данный их сумму обозначим Р и число последующих рангов ниже данного

обозначения Q.

S=P-Q

P+Q=1/2n(n-1)

[pic]

5. Коэффициент корреляции ранга Фехнера.

|[pic] |х |у |[pic] |[pic] |[pic]|

| |600 |50 | |+ |+ - C|

| |700 |40 | |+ |0 – C|

| |300 |20 | |- |- - C|

| |400 |50 | |- |+ - H|

[pic]

Коэффициент Фехнера – мера тесноты связи в виде отношения разности

числа пар совпадающих и не совпадающих знаков к сумме этих чисел.

1. расчет средних по х и у

2. сравниваются индивидуальные значения xi yi со средними

значениями с обязательным указанием знака «+» или «-». Если знаки

совпадают по х и у, то мы относим их числу «С» если, нет, то к «Н».

3. подсчитываем количество совпадающих и несовпадающих пар.

Коэффициент Фехнера очень грубый коэффициент оценки связи, не

учитывающий величину отклонений от среднего значения, но он может

служить ориентиром для оценки интенсивности связи.

| |Часто |Редко|

| |а |в |

|Есть А |Аа 5 |Ав 10|

|Нет В |Ва 7 |Вв 4 |

Задача измерения связи становится перед статисткой по отношению к

описательным признакам, важным частным случаем такой задачи, измерения

связи между 2 альтернативными признаками один из которых причина другой

последствие.

Теснота связи между 2 альтернативными признаками может быть измерена с

помощью 2х коэффициентов:

1. коэффициент ассоциации

2. коэффициент контингенции

[pic]

Коэффициент контингенции имеет недостаток: при равных нулю одного из

двух гетерогенных сочетаний Ав или Ва коэффициент обращается в единицу.

Очень либерально оценивает тесноту связи – завышает ее.

Коэффициент Пирсона

При наличии не двух, а более возможных значений каждого из взаимосвязанных

признаков рассчитываются следующие коэффициенты:

1. Коэффициент Пирсона

2. Коэффициент Чупрова для описательного признака

Коэффициент Пирсона рассчитывается по квадратным матрицам

|доход |Ниже нормы |Норма |2 нормы |3 нормы |

|1-3 ПМ |2 |4 | - |- |

|3-7 ПМ |5 |3 |5 |- |

|7-12 ПМ |10 |7 |6 |1 |

|Св. 12 ПМ | | | | |

[pic]

к1 и к2 – число группы по признакам 1 и 2 соответственно. Минус

коэффициента Пирсона в том, он не достигает 1 даже при увеличении

количества групп.

Коэффициент Чупрова (1874 –1926)

[pic] коэффициент Чупрова более строже оценивает тесноту связи.

§6. Множественная корреляция.

Изучение связи между результативным и двумя или более факторными признаками

называется множественной регрессией. При исследовании зависимостей методами

множественной регрессии ставят 2 задачи.

1. определение аналитического выражения связи между результативным

признаком у и фактическими признаками х1, х2, х3, …хк, т.е. найти

функцию у=f(х1, х2, …хк)

2. Оценка тесноты связи между результативным и каждым из факторных

признаков.

Корреляционно-регрессионная модель (КРМ) – такое уравнение регрессии,

которое включает основные факторы, влияющие на вариацию результативного

признака.

Построение модели множественной регрессии включает этапы:

1. выбор формы связи

2. отбор факторных признаков

3. обеспечение достаточного объема совокупности для получения верных

оценок.

I. все множество связей между переменными, встречающиеся на практике

достаточно полно описывается функциями 5-ти видов:

1. линейная: [pic]

2. степенная: [pic]

3. показательная: [pic]

4. парабола: [pic]

5. гипербола: [pic]

хотя все 5 функций присутствуют в практике КРА, наиболее часто

используется линейная зависимость, как наиболее простая и легко

поддающаяся интерпретации уравнение линейной зависимости: [pic], к –

множество факторов включающихся в уравнение, bj – коэффициент условно-

чистой регрессии, который показывает среднее по совокупности отклонение

результативного признака от его среднего значения при отклонении фактора

xj от своей средней величины на единицу при условии, что все остальные

факторы, входящие в уравнение сохраняют средние значения.

Параметры уравнения множественной регрессии и определение с помощью

МНК.

[pic]

Пример:

0 – т.к. >0,7 следовательно на них обращаем особое внимание

ЭКО. Шкала тесноты связи:

Если связь 0 – 0,3 – слабая связь

0,3 – 0,5 – заметная

0,3 – 0,5 – тесная

0,7 – 0,9 – высокая

более 0,9 – весьма высокая

затем сравниваем два признака (доход и пол) <0,7, то включаем в уравнение

множественной регрессии.

Отбор факторов для включения в уравнение множественной регрессии:

1. между результативным и фактическим признаками должна быть причинно-

следственная зависимость.

2. результативный и фактический признаки должны быть тесно связаны между

собой иначе возникает явление мультиколлинеарности (>06), т.е.

включенные в уравнение факторные признаки влияют не только на

результативный, но друг на друга, что влечет к неверной интерпретации

числовых данных.

Методы отбора факторов для включения в уравнение множественной регрессии:

1. экспертный метод – основан на интуитивно логическом анализе который

выполняется высококвалифицированными экспертами.

2. использование матриц парных коэффициентов корреляции осуществляется

параллельно с первым методом, матрица симметрична относительно

единичной диагонали.

3. пошаговый регрессионный анализ – последовательное включение

факторных признаков в уравнение регрессии и проверки значимости

проводится на основании значений двух показателей на каждом шаге.

Показатель корреляции, регрессии.

Показатель корреляции: рассчитывают изменение теоретической корреляции

отношения или изменение средней остаточной дисперсии. Показатель

регрессии – изменение коэффициента условно чистой регрессии.

Пример расчета:

| |Ниже |Среднее |Выше |Итого |

| |среднего | |среднего | |

|Ниже |12 |7 |3 |22 |

|среднего | | | | |

|Средний |15 |10 |9 |34 |

|Выше |3 |15 |10 |29 |

|среднего | | | | |

|Итого |31 |32 |22 |85 |

[pic]

-----------------------

Статистические признаки

По форме выражения

По отношению к объекту

По способу измерения

По виду измерителя

По характеру вариации

По содержанию

По отношению ко времени

описательные

количественные

Прямые

Косвенные

Первичные

Вторичные

натуральные

трудовые

стоимостные

безразмерные

альтернативные

дискретные

непрерывные

Факторные

результативные

Моментные

Интервальные

ВИДЫ ГРУППИРОВОК

По структуре

По содержанию

Типологическая

Структурная

Аналитическая

Простая

(монотетическая)

Сложная

(политическая)

Комбинационная

Многомерная

Доход

ИТОГО:

(в том числе:)

Статистические графики

Диаграммы

Картограммы

Картодиаграммы

Фоновые

Точечные

Линейные

Плоскостные

Объемные

Полигон

Кумулята

Огива

Радиальные

Столбиковые

Ленточные

Треугольные

Фигурные

КЛАССИФИКАЦИЯ показателей, использующих в статистике

По содержанию

По виду

По отношению к изучаемому свойству

Показатели свойств конкретных объектов

Статистические показатели

Абсолютные

Относительные

Прямые

Обратные

Производительность труда

Выработка (прямой)

Трудоемкость (обратный)

ОТНОСИТЕЛЬНЫЕ ПОКАЗАТЕЛИ

Как характеристика …

…структуры

…динамики

…взаимосвязи

…интенсивности

…отношение к нормативу

…сравнения

количество единиц обладающих данным признаком

суммарное значение признака

ИСС=

вариация

1

xi

60

40

20

0

0 5 10 15 20 25 30 интервалы

10

8

6

4

2

60

40

20

0

xi

1

кумулята

Медианный интервал

Правило 3 сигм

Влияет на потребление

0 1 2 3 4 5

Потребление

шт, мес.

f

Производительность труда

Выработка (прямой)

Трудоемкость (обратный)

Случайные

Ошибки

репрезентативности

Ошибки

регистрации

Ошибки ВН

Систематические

прямая

обратная

( а,b

образование

Частота посещения театра

Потребление йогурта

доход

Возраст

Пол

Социальное положение

0,72

0,64

0,4

0,93

0

0

доход

потребление

Страницы: 1, 2, 3



Реклама
В соцсетях
бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты