Показатели неопределенности объектов
Показатели неопределенности объектов
Многие объекты и процессы в ландшафте характеризуются неоднородностью полученных данных. Для ее оценки лучше всего подходит показатель меры неопределенности, или показатель энтропии. Его можно рассчитывать для системы, которая принимает различные состояния с установленными вероятностями.
Показатель энтропии определяется вероятностями всех элементарных событий данного поля.
Показатель энтропии одиночного события выражается через логарифм его вероятности:
Hi = – log2Рi.
При использовании критерия энтропии можно объективно решать вопрос о наличии полезной информации, заключенной в опыте. Группы, выделяемые в эксперименте, рассматриваются с точки зрения теории вероятности как поле, состоящее из независимых событий. Например, для получения репрезентативных данных при анализе образцов почв с целью оценки обеспеченности растений элементами питания следует провести серию экспериментов в разное время вегетационного периода. Это обусловлено различной степенью их потребления из почвы в разные фазы роста и развития. Соответственно будет меняться и содержание химических элементов в почве. Не учитывая последнего, можно сделать ошибочные выводы.
Пример. Предположим, что лучшим временем для отбора почвенных образцов является период с 21 апреля. В отобранных образцах почв определяется содержание подвижной формы интересующего нас элемента питания (например, бора). Отобрано 431 образец в указанный интервал времени на определенном участке. При распределении образцов по классам были получены частоты (табл. 4.1). Затем по ним рассчитаны частости и натуральные логарифмы частостей. Перемножая показатели и затем суммируя произведения, имеем величину энтропии в нитах (H = 1,6108 нит). Для перевода в биты делим ее на ln 2: H = 1,6108 : 0,69315 = 2,324 бит. Аналогично вычисляется величина энтропии для других ландшафтных условий. Получив ряд показателей энтропии, делаем выводы о наиболее полезной информативности определенного периода. Чем меньше величина энтропии, тем информативнее период, так как снижение энтропии приводит к увеличению упорядоченности. Предположим, что получен ряд показателей энтропии (в битах):
Период |
май |
июнь |
июль |
август |
Энтропия |
2,450 |
2,225 |
2,135 |
2,057 |
Отсюда следует, что наиболее информативен отбор почвенных образцов в случае Н = 2,057 бит (в августе). Этот период характеризуется наименьшим энтропийным показателем.
Показатель энтропии можно использовать при анализе развития явлений – от беспорядка к организованности (например, смена стадий развития речной системы, формирование сквозной речной долины).
Таблица 4.1 Расчет показателя энтропии для установления оптимального времени отбора образцов
Границы класса, дни |
Середина класса, x |
Частота f |
Частость ω = f/N |
ln ω |
– ω ln ω |
1–5 |
3 |
5 |
0,0116 |
–4,46541 |
0,0518 |
6–10 |
8 |
38 |
0,0882 |
–2,42815 |
0,2142 |
11–15 |
13 |
120 |
0,2784 |
–1,27870 |
0,3560 |
16–20 |
18 |
160 |
0,3712 |
–0,99101 |
0,3679 |
21–25 |
23 |
68 |
0,1578 |
–1,84643 |
0,2914 |
26–30 |
28 |
20 |
0,0464 |
–3,07046 |
0,1425 |
31–35 |
33 |
12 |
0,0278 |
–3,58272 |
0,0996 |
36–40 |
38 |
6 |
0,0139 |
–4,27587 |
0,0594 |
41–45 |
43 |
1 |
0,0023 |
–6,07485 |
0,0140 |
46–60 |
48 |
1 |
0,0023 |
–6,07485 |
0,0140 |
|
Σ 431 |
|
0,9999 |
|
1,6108 |
Применение информационного анализа в картографии
При составлении карты необходимо использовать методы оценки объема информации (оценка абсолютного объема содержания карты). Визуальная оценка карты, например «богатое содержание», «малосодержательна», не несет в себе элементов достоверности. Дать объективную оценку нагрузки карты можно с помощью информационного анализа. Для этой цели вводится понятие информационная емкость карты – количественная мера объема содержания карты, выражающая в условных единицах общее количество информации, которое можно получить. Информационная емкость может быть выражена в легенде карты отдельным условным знаком (в битах).
Кроме оценки абсолютного объема содержания карты, важна степень полноты отображения исследуемого явления (отношение объема содержания карты к ее структурной модели, считающейся условно полной). Та часть информационной емкости карты, которая отображает ее тематическое содержание, названа специальной информационной емкостью карты (количество отображаемых показателей и их градаций и число характеризуемых ими географических объектов).
Для расчета специальной информационной емкости JS рекомендуется использовать при определенных условиях следующие формулы, в которых применяются двоичные логарифмы.
1. На карте нанесен один вид объектов, характеризующихся одним показателем при числе объектов N и градаций D:
JS = log2 N D = log2 N + log2 D.
2. Для N объектов одного вида приведено два показателя с числом градаций D1 и D2.
JS = log2 N D1D2 = log2 N + log2 D1 + log2 D2.
3. На карте выделено два вида объектов N1, N2, каждый из них имеет по одному показателю, число градаций соответственно D1и D2:
JS = log2 (N1D1 + N2D2).
4. На карте выделено два вида объектов N1, N2, по каждому объекту приведено два показателя. Число градаций по показателям составляет соответственно по две:
JS = log2 (N1А1А2 + N2 В1В2),
где А1, А2 и В1, В2 – первая и вторая градации первого и второго вида объектов соответственно.
Имеется оригинальный способ применения информационных функций при анализе карт с использованием натуральных логарифмов для характеристики неоднородности картографического изображения. Предположим, на участке карты показано n районов (ареалов). Требуется определить и выразить количественную меру их неоднородности или степень разнообразия картографического содержания. При наличии на карте лишь одного участка показатель неоднородности равен нулю (Н = 0). При увеличении числа ареалов неоднородность участка карты увеличивается, и показатель Н будет возрастать. Если число районов на участке карты остается постоянным, то неоднородность картографического изображения будет зависеть от площади Si каждого района. Неоднородность достигает максимума (Н = max), если их площади равны между собой.
Показатель энтропии может быть вычислен для явлений, имеющих на картах абсолютную или относительную числовую характеристику (например, количество осадков) и не имеющих никакой количественной характеристики (границы распространений форм рельефа). Для подсчета показателя абсолютной энтропии необходимо определить вероятность наличия каждого района на карте.
Вероятность того, что на карте будут помещены участки с максимальной площадью, будет тем больше, чем мельче масштаб.
Показатель относительной энтропии удобен для сравнительной характеристики неоднородности картографического изображения на двух или более разных участках.
Приведем конкретный пример. Для двух участков поверхности с кратерным расчленением (С1, С2)измерены диаметры кольцевых структур и подсчитаны их вероятности по формуле (4.4). Вычисленные значения энтропии для участков С1 и С2соответственно равны: Н(С1)= 1,114; Н(С2) = 0,738; Н(С1)= 0,71; Н(С2)= 0,53. Отсюда следует, что второй участок С2более однороден по кратерному расчленению поверхности, чем первый С1, так как показатели абсолютной энтропии по участку С2меньшие, чем по участку С1.
Информационные показатели предлагается также использовать и для оценки степени взаимного соответствия явлений на картах разного содержания. Пусть на одной карте изображено явление Z, состоящее из п ареалов или градаций Z1,Z2, ..., Zi,..., Zпс вероятностями Р1, Р1, ..., Рi, ..., Рn.На другой карте отражено явление L, имеющее т ареалов l1, l2, ..., lj,..., lтс вероятностями Р1, Р1, ..., Рj, ..., Рn.
Энтропия независимых событий всегда больше энтропии зависимых событий: Н(Z+L) > Н(ZL), причем разность Т(ZL)служит показателем взаимного соответствия явлений Z и L и отражает уменьшение неопределенности за счет внутренних ограничений в системе ZL:
Т(ZL) = H(Z + L) – H(Z ∙ L).(4.8)
Взаимосвязь можно оценить отношением, которое называется информационным коэффициентом:
K(ZL) = [T(ZL) / H(ZL)] ∙ 100.(4.9)
Информационный коэффициент изменяется в пределах от 0 до 100%. Если K(ZL) = 0, то явления Z и L не связаны между собой. При K(ZL)= 100% имеет место однозначное функциональное состояние между явлениями, т. е. Рi, Рj,и Рij равны между собой и Н(Z) = Н(L) = Н(ZL). Тогда Т(ZL) = Н(Z + L) – Н(ZL) = Н(ZL), значит, К(ZL) = 100%.
Таблица 4.2 Решетка для вычисления информационных показателей
L |
Z |
nL |
|||
|
1 |
2 |
3 |
… |
nLPL – PL ln PL |
1 |
3 |
9 |
|
… |
14 |
|
0,005 |
0,010 |
|
… |
0,020 |
|
0,027 |
0,046 |
|
… |
0,084 |
2 |
|
|
1 |
|
9 |
|
|
|
0,002 |
|
0,020 |
|
|
|
0,012 |
|
0,084 |
3 |
… |
… |
… |
… |
… |
nZPZ – PZ ln PZ |
5 |
14 |
… |
… |
630 |
0,008 |
0,02 |
… |
… |
1,000 |
|
0,038 |
0,084 |
… |
… |
5,400 |
Пример. Предположим, нам необходимо сравнить связь контуров почв (Z) и растительности (L)для одного и того же района, но нанесенных на отдельные специальные карты. На обе карты помещаем квадратную точечную палетку. Пусть всего на участке разместилось 630 точек. В каждой из них отмечены номера почвенного и растительного контуров. Для расчета показателей составляется информационная решетка (табл. 4.2). В каждой клетке таблицы, образованной пересечением строк и столбцов, проставлено по 3 показателя: 1) количество точек, попавших одновременно в пределы i-го (почвенного) и j-го (растительного) контуров (верхнее число); 2) величина вероятности Рij (среднее число); 3) произведение РijlnРij (нижнее число). Результаты суммируются для контуров растительности и почвенных контуров. После вычисления информационных функций получены результаты:
Н(Z)r = 2,060 : ln 12 = 0,83;
Н(L)r = 1,882 : ln 13 = 0,73;
Т(ZL) = H(Z + L) – H(Z ∙ L) = 0,486;
K(ZL) = [T(ZL) / H(ZL)] ∙ 100 = 14,1 %.
Таким образом, значение абсолютной и относительной энтропии для явления L меньше, чем для Z, несмотря на увеличение числа градаций. Карта растительности обладает большей однородностью (Н(L) = 1,882), чем почвенная (Н(Z) = 2,060).
НАПИСАТЬ КОММЕНТАРИЙ