Теоретические функции распределения
Теоретические функции распределения
В ходе работы с выборочной совокупностью иногда возникает необходимость описать вариационную кривую с помощью математической функции. Для характеристики вариационной кривой можно подобрать ряд математических зависимостей. Выбирают ту, которая наиболее реально отражает сущность объекта исследования. Выбор математической зависимости , описывающей распределение, проводится путем подбора подходящей математической модели, которая определяет вид функции распределения. Затем находят параметры функции и проверяют ее соответствие эмпирическому распределению.
В географии большинство закономерно повторяющихся явлений, процессов можно представить в виде нормального и логнормального распределения. Реже встречается биномиальное распределение, распределение Пуассона и другие.
Биномиальное распределение (распределение Бернулли) возникает, когда оценивается сколько раз происходит событие в серии определенного числа независимых, выполняемых в одинаковых условиях наблюдений. Разброс вариант – следствие влияния ряда независимых и случайно сочетающихся факторов (есть событие или его нет). Характерно для альтернативного типа изменчивости признака.
Распределение Пуассона рассматривается как предельный случай биномиального распределения и используется для характеристики редких событий. Отличительная особенность распределения Пуассона – величина дисперсии близка к величине среднего арифметического, например, длительное наводнение. Это проявляется в ситуациях, когда в определенный отрезок времени или на определенном пространстве происходит случайное число каких-либо событий, например, длительно повторяющиеся ураганы в течение одного летнего периода. На графике это распределение представляется в виде резко выраженной асимметрии.
Рассмотрим более детально наиболее характерные типы теоретических распределений в природе и обществе: нормальное и логнормальное распределение.
Нормальное распределение. Нормальное (распределение Гаусса)используется для приближенного описания явлений, которые носят вероятностный, случайный характер. Приоритет в открытии этого закона принадлежит Де Муавру (1733), но его связывают с именем Гаусса, исследовавшего его в начале 19 в.
Распределение Гаусса имеет место среди природных и экономических явлений. В системе признак варьирует под влиянием большого количества взаимно независимых факторов, каждый из которых мало влияет на его общую вариабельность. Причем одни факторы приводят к возрастанию величины признака, другие – к уменьшению. Встречаемость вариантов, занимающих середину совокупности, максимальна. Такое распределение считается нормой для случайных величин, поэтому оно получило название нормального. Графически нормальное распределение выражается плавной симметричной куполообразной кривой с приближающимися к оси абсцисс ветвями (кривая плотности нормального распределения).
Кривая показывает, что большие отклонения от средней встречаются реже, чем малые. С уменьшением среднего квадратического отклонения (σ) кривая нормального распределения становится все более островершинной. Площадь, заключенная под кривой нормального, всегда принимается равной единице.
При нормальном распределении среднее, мода и медиана совпадают. Кривая плотности не пересекает оси абсцисс, что подтверждает вероятность существования неограниченно больших отклонений. Уравнение нормального распределения можно записать в нескольких модификациях.
Подставив необходимые значения по исследуемой статистической совокупности в формулу, рассчитаем теоретические частоты нормального распределения f для каждого класса совокупности. Получим ряды теоретических (f) и эмпирических (f) данных:
f |
8 |
17 |
34 |
70 |
141 |
165 |
253 |
187 |
145 |
85 |
51 |
25 |
19 |
f |
7 |
16 |
39 |
79 |
131 |
180 |
206 |
196 |
154 |
101 |
55 |
24 |
13 |
Были приняты следующие исходные данные для расчета: N = 1200, М = 10,22, σ = 2,31, i = 13.
Произведем проверку соответствия эмпирических частот вычисленным частотам нормального распределения. Для этого, используя критерий хи-квадрат, составляем таблицу по форме:
f |
f |
f – f |
(f – f )2 |
(f – f )2 / f |
Сумма показателей в последнем столбце будет составлять величину χ2, равную 21,184. Полученная величина сравнивается со стандартной величиной χ2 при числе свободы: ν = i – 3 = 13 – 3 = 10 (см. выше ряды по частотам).
Табличные значения χ2 следующие: для Р = 0,95 и 0,99 χ2 = 18,307 и 23,209 соответственно. Рассчитанное значение χ2 = 21,184 находится между указанными табличными значениями. Поскольку расчетное значение χ2 не превышает табличную величину при Р = 0,99, можно считать, что эмпирическое распределение признака удовлетворительно подчиняется нормальному закону распределения.
При нормальном распределении около 68,3 % всех вариант отклоняется от среднего значения не более, чем на величину среднего квадратического отклонения (±σ). Соответственно в пределах от –2σ до +2σ находится 95,5 % вариант, в пределах от –3σ до +3σ – 99,7 %.
Отклонение вариант от нормального закона распределения указывает на влияние какого-либо другого фактора на статистическую совокупность.
Логнормальное распределение. Некоторые распределения при изучении географических объектов имеют выраженную асимметрию, поэтому представляет практический интерес преобразование асимметричного распределения в симметричное (нормальное). Иногда это возможно, если каждую варианту выборки выразить в виде логарифма (lg xi). В тех случаях, когда логарифм случайной величины (xi) подчиняется нормальному распределению, а сами значения случайных величин распределены асимметрично, распределение случайной величины принято называть логарифмически нормальным, или логнормальным. Например, к логнормальному распределению можно отнести распределение микроэлементов в почвах, породах.
НАПИСАТЬ КОММЕНТАРИЙ