Оценка статистических параметров по выборочным данным

Оценка статистических параметров по выборочным данным

Оценка в статистике – это правило вычисления оцениваемого параметра. Она указывает приближенное значение показателей выборки относительно этих параметров генеральной совокупности. По мере увеличения числа наблюдений выборочные средние и другие параметры все больше приближаются к этим значениям генеральной совокупности. Степень соответствия показателей оценивается ошибкой (m). Ее запись производится вместе с оцениваемым параметром, например, M ± mM, σ ± mσ , V ± mV . Ошибка указывает интервал, в пределах которого находится этот показатель в генеральной совокупности. Чем меньше ошибка, тем ближе значение выборочного показателя к этому показателю генеральной совокупности. Чем больше число наблюдений и чем однороднее выборка, тем меньшая ошибка среднего и других показателей. Расчеты ошибок параметров в дальнейшем будут приводиться после характеристик самих параметров. Здесь покажем расчеты ошибок важнейших статистических параметров.

Представление средней арифметической выборки приводится обязательно с ее ошибкой.

Ошибка дисперсии вычисляется путем возведения в квадрат ошибки среднеквадратической.

Поскольку параметр m характеризует ошибку утверждения (прогноза) о том, что выборочное среднее равно генеральному среднему, то чем выше требование к вероятности этого вывода, тем шире должен быть обеспечивающий точность такого прогноза интервал, называемый доверительным интервалом. Его величина задается вероятностью безошибочного прогноза, которую принято называть доверительной вероятностью (уровень вероятности, надежность опыта, вероятность безошибочного прогноза). В исследованиях допускается доверительная вероятность (Р) не менее 95 % (0,95 частей от 1). В этих случаях Р для средних арифметических при достаточно большом числе наблюдений (N > 30) равен ± 2 m. Предельная ошибка выборки Δ = М ± 2 m. При доверительной вероятности 99 % (0,99) доверительный интервал составит ± 3 m, Δ = М  ± 3 m. По иному, в отношении доверительного интервала можно сказать так: он показывает какой процент вариант выборки (выборок) подтверждает искомую статистическую закономерность.

Каждому значению доверительной вероятности соответствует свой уровень значимости (α). Он выражает вероятность нулевой гипотезы: вероятность того, что выборочная и генеральная средние не отличаются друг от друга. Иначе говоря, чем выше уровень значимости, тем меньше можно доверять утверждению, что различия существуют, т. е., он показывает, какой процент вариант совокупности (выборок) отвер­гают искомую статистическую закономерность. Уровень значимости 5 % (0,05) дополняет доверительную вероятность 95 % (0,95). В сумме они составляют 100 % (1). Если доказано подобие между выборками при α = 5 % (0,05), то из этого следует, что до 5 % вариант выборки подобие не подтверждают. В таблицах приложения приводятся численные значения для Р или α соответственно 0,95 и 0,99; 0,05 и 0,01. В этих случаях при интерпретации мы можем утверждать нулевую гипотезу (Н0). При более высоких уровне вероятности 0,99 и уровне значимости 0,01 мы получаем сильный довод для утверждения нулевой гипотезы.

Проверка статистических гипотез. Методологической основой любого исследования является формулировка рабочей гипотезы. В ходе исследования рабочая гипотеза либо принимается, либо отвергается. Статистической называют гипотезу о виде неизвестного распределения или о параметре распределения. Примеры гипотез:

·  генеральная совокупность распределяется по закону Пуассона;

·  средние арифметические двух совокупностей не равны между собой;

·  дисперсии двух совокупностей равны между собой.

Выдвинутую гипотезу называют основной или нулевой (Н0). Гипотезу, которая противоречит нулевой, называют конкурирующей или альтернативной (Н1). Если нулевая гипотеза предполагает, что М = 20, то логическим отрицанием будет М ≠ 15. Простая гипотеза содержит одно предположение, сложная – состоит из конечного или бесконечного множества простых гипотез. Выдвинутую гипотезу проверяют на правильность ее статистическими методами, т. е. проводят статистическую проверку. При проверке могут быть допущены ошибки двух родов.

Ошибка первого рода – отвергается правильная гипотеза. Вероятность совершить ошибку первого рода называют уровнем значимости (α). Это значит, что в 5 случаях из 100 мы рискуем допустить ошибку первого рода.

Ошибка второго рода – принимается неправильная гипотеза, значимость ошибки которой допускается 0,95 и обозначается символом Р. Это значит, что в 95 случаях из 100 мы рискуем допустить ошибку второго рода.

Для проверки нулевых гипотез используют статистические критерии. При сравнении дисперсий используют критерий Фишера. В большинстве исследований для статистической проверки гипотез существенности различий средних арифметических используют параметрический критерий Стьюдента. Если нулевая гипотеза принимается, это не означает ее доказательство. Доказать на основании однократной или косвенной проверки гипотезу нельзя, а опровергнуть можно. Для повышения точности статистических данных необходимо уменьшить вероятности ошибок первого и второго рода, увеличить объем выборок. Область применения того или иного критерия задается законом его распределения.

Оценка точности опыта. При исследованиях методического характера необходимо приводить их оценку по показателю точность опыта (р). Его смысл состоит в установлении величины ошибки среднего арифметического (mM) в процентах от величины среднего арифметического (М).

Опыт считается достаточно точным, если р < 3 %, удовлетворительным – при его величине 3–5 % . Если величина точности опыта более 5 %, к полученным выводам следует относиться осторожно и увеличить число повторностей в опыте. Эти градации обязательны для полевых опытов с растениями. Некоторые приборы для анализа могут давать значительно большую погрешность (р до 15 %).

Пример. Среднее арифметическое общей биомассы многолетних трав в луговом ландшафте прирусловой поймы  М = 235 ц/г, ошибка средней арифметической mM = ± 4 ц/га, N = 20. Используя формулу (1.15),  выполним расчет показателей:

                                 р = (4 / 235) · 100 = 1,7 %.

Полученная величина точности опыта достаточно точная.

07 декабря 2012 /
Похожие новости
Дисперсионный анализ  
Статистические критерии различия
Теоретические функции распределения
Обработка вариационного ряда
Элементы математической статистики
Комментарии
Статистические расчёты на http://arhiuch.ru

НАПИСАТЬ КОММЕНТАРИЙ

Ваше Имя:
Ваш E-Mail:
Полужирный Наклонный текст Подчеркнутый текст Зачеркнутый текст | Выравнивание по левому краю По центру Выравнивание по правому краю | Вставка смайликов Выбор цвета | Скрытый текст Вставка цитаты Преобразовать выбранный текст из транслитерации в кириллицу Вставка спойлера
Вопрос:
Столица России?
Ответ:*
Введите код: