Дисперсионный анализ

Дисперсионный анализ  

При планировании эксперимента бывают ситуации, когда исследуемую систему необходимо разбить на группы, отличающиеся между собой в количественном отношении, и установить сходство или различие между ними по влиянию различных факторных величин на признак. Например, определить степень влияния географических условий на ход тех или иных процессов, явлений. Таким условиям лучше всего отвечает дисперсионный анализ, который нашел применение в физической географии.

Дисперсионный анализ позволяет утверждать с определенной долей уверенности наличие влияния на изучаемый объект каждого из условий в отдельности или в их сочетаниях. Обязательным условием применения дисперсионного анализа является разбивка каждого учитываемого фактора не менее чем на две группы. Они могут быть представлены как качественными, так и количественными показателями. Качественные показатели приводятся в виде баллов. Анализу подвергаются лишь определяющие поведение объекта факторы, которые установлены исследователем. По количеству определяющих факторов дается название виду дисперсионного анализа (одно-, двух-, трехфакторный и т. д.).

Обработка данных дисперсионного анализа – весьма трудоемкий процесс; облегчает вычисления правильная организация опыта. Порядок расчета в различных видах дисперсионного анализа будет различным, но логическая схема остается единой. Факторы в дисперсионном анализе должны быть независимыми друг от друга; каждый фактор следует разделить на группы, количество которых зависит от поставленной задачи.

Дисперсионный анализ применяется в случаях нормального или близкого к нему распределения выборочных совокупностей. Выборки должны иметь близкие по значению показатели дисперсии σ2. Количество повторностей в каждой выделенной группе принимается одинаковым.

Основная трудность при использовании дисперсионного анализа – составление комбинационной таблицы для обработки данных (дисперсионный комплекс). Если число наблюдений над результативным признаком по отдельным группам изучаемого фактора одинаково, то дисперсионный комплекс называется равномерным, если разное, то неравномерным. Общее число наблюдений над результативным признаком принято называть объемом дисперсионного комплекса.

Порядок действия по каждому виду дисперсионного анализа определяется его основной задачей, которая состоит в делении суммарного или общего варьирования изучаемого признака на доли: варьирование, вызываемое действием отдельных факторов; варьирование, вызываемое взаимодействием факторов между собой; остаточное варьирование объекта, которое определяется неучитываемыми факторами.

Однофакторный дисперсионный анализ  

Среди различных видов дисперсионного анализа наиболее часто используется однофакторный. Для выполнения однофакторного анализа в опыте должно быть предусмотрено две повторности и более. Исследуемый фактор разбивается на группы с целью выявления его оптимальной величины, влияющей на результативный признак. Для облегчения расчета можно уменьшить все показатели в пределах дисперсионного комплекса на определенную величину, а затем увеличить конечные результаты на ту же величину.

Географы исследуют не только природные, но и сельскохозяйственные ландшафты (агроландшафты), претерпевающие существенные изменения под воздействием агротехногенеза. Использование системного анализа позволяет не только констатировать изменения в агроландшафте, но и активно включаться в его преобразование.

Известно, что оптимальным условиям питания растений соответствует дерновая легкосуглинистая гумусированная нейтральная почва. Ее можно создать путем внесения в пахотный горизонт добавок минерального грунта определенного механического состава и торфа. Формирование искусственной антропогенной почвы требует полевых экспериментов. В связи с этим поставлена следующая задача: определить влияние на урожай зерна ячменя разных доз торфа (200, 300, 400 т абсолютно сухого вещества на гектар) при внесении его на фоне минеральных, органических удобрений и доломитовой муки. Исходная почва – дерново-подзолистая глееватая связносупесчаная осушенная. После получения сведений об урожайности ячменя в названных условиях составляется таблица дисперсионного комплекса (табл. 2.1), куда заносится исходная информация по группам влияющего фактора (вариантам опыта) и некоторые результаты расчетов (для удобства сделано округление по урожайности до целых чисел). Вначале производим расчет данных по вариантам опыта (строкам).

Результаты разносим по столбцам. Суммарный урожай ячменя по повторностям Σxi и по каждому варианту опыта вносим в столбец 6 в числителе. Аналогично поступаем с квадратами этих показателей Σxi2. Затем в столбце 7 приводим квадраты суммарного урожая ячменя по повторностям (Σxi)2. И, наконец, вычисляем среднее арифметическое Мi по каждому варианту опыта, заносим в столбец 8; вычисляем общее среднее Мобщ.

После получения данных по вариантам опыта произ­водим расчет необходимых показателей по повторностям (хk). Сначала суммируем данные урожайности ячменя и приводим в строке под чертой Σxk. Суммы сумм урожайности ячменя по вариантам опыта и повторностям должны совпасть и дать сумму всех вариант (ΣΣxi,k = 495). Аналогично суммируем квадраты этих показателей по повторностям (Σxk2). Суммы сумм квадратов по вариантам и повторностям опыта должны совпасть и дать сумму квадратов всех вариант (Σxi= Σxk2 =15 935). Ниже вписываем результаты возведения в квадрат сумм вариант по каждой повторности (Σxk)2 и суммируем их: Σ(Σxk)= 61 269. Вычисляем средние арифметические по каждой повторности опыта Мk. Общее среднее арифметическое всех вариант опыта составляет Мобщ = (Σxi,k)/N = 495 : 16 = 30,93.

Таблица 2.1 Однофакторный дисперсионный анализ

Варианты

опыта

(фактор)

Урожай ячменя по повторностям, ц/га*

По повторностям (признакам) (i)

( )2

Mi

Контроль (фон)

6889

20,75

Фон+200 т/га торфа

15 625

31,25

Фон+300 т/га торфа

20 164

35,50

Фон+400 т/га торфа

21 025

36,25

По факторам (k)

121

124

126

124

495

15935

63703

Мобщ

30,93

3821

3986

4102

4026

14 641

15 376

15 876

15 376

Mk

30,25

31,00

31,50

31,00

= 61 269

Примечание: * В числителе – опытные данные, в знаменателе – квадраты этих показателей

Следующий этап работы – нахождение сумм квадратов отклонений, т. е. расчленение общего варьирования признака на составные части исходя из равенства:

Θ = Θ1 + Θ2 + Θ3,

где Θ – сумма квадратов отклонений по общему варьированию данных, Θ1 – по группам фактора (варианты опыта), Θ2 – по повторностям опыта, Θ3 – по остаточному варьированию, вызванному неучтенными факторами.

Общая сумма квадратов отклонений вычисляется следующим образом:

Θ = Σ(Σx2i,k) – (ΣΣxi,k)2 / N

Подставив данные из табл. 2.1, получим: Θ =15 935 – 4952: 16 = 621. Затем находим сумму квадратов отклонений по группам фактора (варианты опыта) по формуле:

Θ1 = [Σ(Σxi)2 – (ΣΣxi,k)2/k] / i,                             (2.1)

где k – число групп фактора, т. е. 4; i – число повторностей, т. е. 4. В данном случае должно выдержаться равенство N = ki = 4∙4 = 16. По формуле (2.1) вычислим:

Θ1 = [63703 – 4952 : 4] : 4 = 611,75.

Сумму квадратов отклонений по повторностям опыта находим по формуле

Θ2 = [Σ(Σxk)2 – (ΣΣxi,k)2/i] / k,                             (2.2)

где i – число повторностей, т. е. 4; k — число слагаемых в каждой сумме Σxk, т. е. 4.

Вычисляем Θ2 по формуле (2.2):

Θ2 = [61269 – 4952 : 4] : 4 = 3,25.

Таблица 2.2 Результаты однофакторного дисперсионного анализа

Варьирование данных

Сумма квадратов отклонений Θ

Степень свободы ν

Дисперсия σ2 = Θ

Критерий Фишера

Fф

Fт

Общее по опыту

621,00

15

41,40

По вариантам опыта

611,75

3

203,91

304,31

8,81

По повторностям

3,25

3

1,08

1,61

8,81

Случайное (остаточное)

6,00

9

0,67

 

Сумма квадратов отклонений по остаточному варьированию определяется из равенства

                                                                                                       Θ3 = ΘΘ1Θ2.                                               (2.3)

Подставив значение вычисленных сумм соответствующих квадратов отклонений в формулу (2.3), получим

Θ3 = 621 – 611,75 – 3,25 = 6,00

Проводим дисперсионный анализ данных урожая ячменя (табл. 2.2). Вносим в таблицу рассчитанные суммы квадратов отклонений (Θ, Θ1, Θ2, Θ3). Число степеней свободы получаем следующим образом: по общей сумме квадратов отклонений ν = N – 1 = 16 – 1 = 15; по вариантам опыта ν1 = n1 – 1 = 4 – 1 = 3; по повторностям ν2 = n2 – 1 = 4 – 1 = 3; по остаточной сумме ν3 = ν – ν1 – ν2 = 15 – 3 – 3 = 9.

Дисперсия определяется путем деления сумм квадратов отклонений (Θ, Θ1, Θ2, Θ3) на соответствующие им числа степеней свободы (ν, ν1, ν2, ν3), что можно выразить в общем виде формулой σ2 = Θ/ν, получим σ2= 621 : 15=41,40.

Оценку сходства или различия между вариантами опыта можно проводить по критерию Фишера, критерию Стьюдента или НСР.

Поскольку Fф > Fт (см. табл. 2.2 и прил. 5), то это позволяет сделать вывод, что внесение больших доз торфа положительно влияет на величину урожая ячменя в агроландшафте.

Наиболее распространен в дисперсионном анализе для оценки результатов опыта критерий НСР, алгоритм которого приводим ниже. . Поскольку ошибка среднего для всех сравниваемых вариант одна и та же, формула для расчета ошибки разности может быть преобразована . Наименьшую существенную разность рассчитываем по формуле (1.24).   НСР0,95 = 0,58 ∙ 2,26 = 1,31

НСР0,99 = 0,58 ∙ 3,25 = 1,88

Из полученных результатов дисперсионного анализа вытекает следующий вывод (табл. 2,3). Величина НСР0,95 и НСР0,99 меньше величины прибавки урожая зерна ячменя, поэтому внесение высоких доз торфа положительно влияет на урожай. Лучший результат получен в варианте с дозой внесения торфа 400 т/га, где прибавка зерна ячменя составила 15,5 ц/га.Ошибку общего среднего арифметического используют для вычисления точности опыта. Показатель точности опыта для общего среднего арифметического вычисляется следующим образом:

pМобщ = (mобщ/Mобщ) · 100 = (0,41 : 30,90) · 100 = 1,32 %.

Поскольку р = 1,32%, т. е. < 3 %, то опыт признается достаточно точным

 

Таблица 2.3 Влияние высоких доз торфа на урожай ячменя

Вариант опыта

Урожай ячменя по повторностям

Среднее

Прибавка

Контроль (фон)

20

21

22

20

20,75

Фон+200 т/га

30

32

32

31

31,25

10,50

Фон+300 т/га

35

36

35

36

35,50

14,75

Фон+400 т/га

36

35

37

37

36,25

15,50

НСР0,95, ц/га

1,31

 

 

 

 

 

НСР0,99, ц/га

1,88

 

 

 

 

 

р

1,32 %

 

 

 

 

 

Аналогичным образом вычисляется точность опыта для частных средних арифметических по вариантам опыта и по повторностям:

pв = (mв/Mв) ∙ 100;   pп = (mп/Mп) ∙ 100.

 

07 декабря 2012 /
Похожие новости
Двухфакторный дисперсионный анализ 
Статистические критерии различия
Теоретические функции распределения
Оценка статистических параметров по выборочным данным
Элементы математической статистики
Комментарии

НАПИСАТЬ КОММЕНТАРИЙ

Ваше Имя:
Ваш E-Mail:
Полужирный Наклонный текст Подчеркнутый текст Зачеркнутый текст | Выравнивание по левому краю По центру Выравнивание по правому краю | Вставка смайликов Выбор цвета | Скрытый текст Вставка цитаты Преобразовать выбранный текст из транслитерации в кириллицу Вставка спойлера
Вопрос:
Введите слово "фикус" (без кавычек)
Ответ:*
Введите код: