Метод дендро-дерева Б. Берри

Метод дендро-дерева Б. Берри

В матрице таксономических метрик выбирается наименьший элемент, который связывает два объекта (см. табл. 3.3): EF = 0,96. Метрика свидетельствует, что объекты E и F находятся на минимальном и одинаковом расстоянии по отношению к другим объектам. Поэтому их можно заменить одним, присвоив символ М (рис. 3.4).

В дальнейшем на горизонтальной линии размещаем объекты последовательно по мере увеличения их метрик с учетом связи с первыми объектами EF. Объект G связывается с F метрикой 1,11, объект I с G – 1,38, I с H – 1,33, E с D – 1,66. Далее связь неотложенных объектов (A, B, J, C) с отложенными прерывается. В таких случаях внутри этих объектов и ищем наименьшие метрики между ними: А и В связывает минимальная метрика 1,15; А и J – 1,67. Объект С связан наименьшей метрикой 3,07 с ранее отложенной Н, поэтому он выделяется самостоятельно в конце по прямой линии (см. рис. 3.4).

Рис. 3.4. Дендро-дерево Бери

Отложенные объекты на горизонтальной линии с минимальными метриками связываются между собой (Н и І : А и В) или выделяется самостоятельно с общей наклонной линией М – С, на которой откладываются вычисленные метрики от объекта М (Е – F) путем вычисления усредненных величин, используя данные матрицы (см. рис. 3.3) по строкам Е – F:

А = (3,54+3,30)/2 = 3,42;B = (3,81+3,84)/2 = 3,82;

C = (4,82+4,06)/2 = 4,44;D = (1,66+1,68)/2 = 1,67;

G = (1,34+1,11)/2 = 1,22;H = (2,76+1,80)/2 = 2,28;

I = (2,26+1,51)/2 = 1,88;J = (3,72+3,22)/2 = 3,47.

Располагаем объекты относительно М по возрастающей величине на линии и производим группировку:

 

В нашем примере объекты можно объединить в 4 класса (EFG; HID; ABJ; C) по минимальным метрикам между объектами и по усредненным относительно объекта М (E, F).

Расчленение графа на подгруппы для определения количества групп объектов может производиться в процессе его построения (см. рис. 3.4): EF; HI; ABJ.

При делении объектов на классы важным критерием является минимизация внутригрупповой и максимизация межгрупповой дисперсии. Практически количество классов определяется априорно, т.е. по внешнему виду дендро-дерева. В выделенном классе объекты по анализируемым признакам являются сходными (однородными). Если они соседние в пространстве, то образуют однородный регион.

Пример кластерного анализа по способу Вроцлавский дендрит

Задача: провести зонирование территории города по предложенным признакам.


Таблица 3.4 Количественные показатели для зонирования города

Минск

Площадь застройки, га

 Количество истори­ческих памятников

Количество архитек­турных памятников

Количество промыш­ленных предприятий

 Площадь лесной зоны, га

Шумовое загрязнение, балл

дерев.

бетон

Объект № 1

0,1

25

5

10

2

2

80

Объект № 2

0,5

10

7

12

3

3

40

Объект № 3

1,5

15

3

16

5

0,5

30

Объект № 4

2,0

17

4

5

4

0,7

50

Объект № 5

3,0

18

1

4

7

5

20

Объект № 6

3,5

30

1

1

1

4

35

Этапы работы:

1.      Подсчитываем сумму, среднее и сигму по столбцам:

 

Σ

среднее

σ

1 столбец

10,6

1,8

1,2

2 столбец

115

19,2

6,6

3 столбец

21

3,5

2,14

4 столбец

48

8

5,1

5 столбец

22

3,7

1,97 и т. д.

2.      Трансформируем количественные показатели в числа без измерений (табл. 3.4) с использованием формулы (3.7, 3.8).


Таблица 3.5 Нормализованные безразмерные данные

1

–1,42

0,88

0,7

0,39

–0,86

–0,31

1,96

2

–1,08

–1,4

1,63

0,78

–0,36

0,31

–0,13

3

–0,25

–0,64

–0,23

1,56

0,66

–1,25

–0,65

4

0,17

–0,33

0,23

–0,58

0,15

–1,12

0,4

5

1,00

–0,18

–1,16

–0,78

1,68

1,56

–1,18

6

1,42

1,64

–1,16

–1,37

–1,37

0,93

–0,39

3. Рассчитываем расстояния (метрику) между объектами по формуле (3.2) и проставляем в матрицу ниже:

 

1

2

3

4

5

6

1

0

2,21

6,26

3,11

5,62

4,10

2

2,21

Комментарии

НАПИСАТЬ КОММЕНТАРИЙ

Ваше Имя:
Ваш E-Mail:
Вопрос:
Сколько часов 1 сутках?
Ответ:*