Метод дендро-дерева Б. Берри
Метод дендро-дерева Б. Берри
В матрице таксономических метрик выбирается наименьший элемент, который связывает два объекта (см. табл. 3.3): EF = 0,96. Метрика свидетельствует, что объекты E и F находятся на минимальном и одинаковом расстоянии по отношению к другим объектам. Поэтому их можно заменить одним, присвоив символ М (рис. 3.4).
В дальнейшем на горизонтальной линии размещаем объекты последовательно по мере увеличения их метрик с учетом связи с первыми объектами EF. Объект G связывается с F метрикой 1,11, объект I с G – 1,38, I с H – 1,33, E с D – 1,66. Далее связь неотложенных объектов (A, B, J, C) с отложенными прерывается. В таких случаях внутри этих объектов и ищем наименьшие метрики между ними: А и В связывает минимальная метрика 1,15; А и J – 1,67. Объект С связан наименьшей метрикой 3,07 с ранее отложенной Н, поэтому он выделяется самостоятельно в конце по прямой линии (см. рис. 3.4).

Рис. 3.4. Дендро-дерево Бери
Отложенные объекты на горизонтальной линии с минимальными метриками связываются между собой (Н и І : А и В) или выделяется самостоятельно с общей наклонной линией М – С, на которой откладываются вычисленные метрики от объекта М (Е – F) путем вычисления усредненных величин, используя данные матрицы (см. рис. 3.3) по строкам Е – F:
А = (3,54+3,30)/2 = 3,42;B = (3,81+3,84)/2 = 3,82;
C = (4,82+4,06)/2 = 4,44;D = (1,66+1,68)/2 = 1,67;
G = (1,34+1,11)/2 = 1,22;H = (2,76+1,80)/2 = 2,28;
I = (2,26+1,51)/2 = 1,88;J = (3,72+3,22)/2 = 3,47.
Располагаем объекты относительно М по возрастающей величине на линии и производим группировку:

В нашем примере объекты можно объединить в 4 класса (EFG; HID; ABJ; C) по минимальным метрикам между объектами и по усредненным относительно объекта М (E, F).
Расчленение графа на подгруппы для определения количества групп объектов может производиться в процессе его построения (см. рис. 3.4): EF; HI; ABJ.
При делении объектов на классы важным критерием является минимизация внутригрупповой и максимизация межгрупповой дисперсии. Практически количество классов определяется априорно, т.е. по внешнему виду дендро-дерева. В выделенном классе объекты по анализируемым признакам являются сходными (однородными). Если они соседние в пространстве, то образуют однородный регион.
Пример кластерного анализа по способу Вроцлавский дендрит
Задача: провести зонирование территории города по предложенным признакам.
Таблица 3.4 Количественные показатели для зонирования города
Минск |
Площадь застройки, га |
Количество исторических памятников |
Количество архитектурных памятников |
Количество промышленных предприятий |
Площадь лесной зоны, га |
Шумовое загрязнение, балл |
|
дерев. |
бетон |
||||||
Объект № 1 |
0,1 |
25 |
5 |
10 |
2 |
2 |
80 |
Объект № 2 |
0,5 |
10 |
7 |
12 |
3 |
3 |
40 |
Объект № 3 |
1,5 |
15 |
3 |
16 |
5 |
0,5 |
30 |
Объект № 4 |
2,0 |
17 |
4 |
5 |
4 |
0,7 |
50 |
Объект № 5 |
3,0 |
18 |
1 |
4 |
7 |
5 |
20 |
Объект № 6 |
3,5 |
30 |
1 |
1 |
1 |
4 |
35 |
Этапы работы:
1. Подсчитываем сумму, среднее и сигму по столбцам:
|
Σ |
среднее |
σ |
1 столбец |
10,6 |
1,8 |
1,2 |
2 столбец |
115 |
19,2 |
6,6 |
3 столбец |
21 |
3,5 |
2,14 |
4 столбец |
48 |
8 |
5,1 |
5 столбец |
22 |
3,7 |
1,97 и т. д. |
2. Трансформируем количественные показатели в числа без измерений (табл. 3.4) с использованием формулы (3.7, 3.8).
Таблица 3.5 Нормализованные безразмерные данные
1 |
–1,42 |
0,88 |
0,7 |
0,39 |
–0,86 |
–0,31 |
1,96 |
2 |
–1,08 |
–1,4 |
1,63 |
0,78 |
–0,36 |
0,31 |
–0,13 |
3 |
–0,25 |
–0,64 |
–0,23 |
1,56 |
0,66 |
–1,25 |
–0,65 |
4 |
0,17 |
–0,33 |
0,23 |
–0,58 |
0,15 |
–1,12 |
0,4 |
5 |
1,00 |
–0,18 |
–1,16 |
–0,78 |
1,68 |
1,56 |
–1,18 |
6 |
1,42 |
1,64 |
–1,16 |
–1,37 |
–1,37 |
0,93 |
–0,39 |
3. Рассчитываем расстояния (метрику) между объектами по формуле (3.2) и проставляем в матрицу ниже:
|
1 |
2 |
3 |
4 |
5 |
6 |
1 |
0 |
2,21 |
6,26 |
3,11 |
5,62 |
4,10 |
2 |
2,21 |
Комментарии
Отпуск
Карты
|
НАПИСАТЬ КОММЕНТАРИЙ