"Е.М.Миркес. Учебное пособие по курсу Нейроинформатика " - читать интересную книгу автора

проекция равна tc. При положительном значении вектор проекции сонаправлен с
вектором c, при отрицательном - противоположно направлен. При условии, что
длина вектора c равна единице, проекция вычисляется как скалярное
произведение (x-b,c). В противном случае скалярное произведение необходимо
разделить на квадрат длины c. Мера близости вектора (точки) x определяется
как квадрат длины разности вектора x и его проекции на прямую. При решении
задачи (4) необходимо найти минимум следующей функции:
Продифференцируем целевую функцию по неизвестным tq, cir, bir и
приравняем результаты к нулю.
(10)
Выразим из последнего уравнения в (10) bir:
(11)
В качестве bi можно выбрать любую точку прямой. Отметим, что для любого
набора векторов xij и любой прямой с ненулевым направляющим вектором ci на
прямой найдется такая точка bi, что сумма проекций всех точек на прямую x =
b + tc будет равна нулю. Выберем в качестве bi такую точку. Второе слагаемое
в правой части (11) является r-й координатой суммы проекций всех точек на
искомую прямую и, в силу выбора точки bi равно нулю. Тогда получаем формулу
для определения bi:
(12)
Из первых двух уравнений (10) получаем формулы для определения
остальных неизвестных:
(13)
Поиск решения задачи (4) для данного вида классификации осуществляется
по следующему алгоритму:
1. Вычисляем bi по формуле (12).
2. Вычисляем t по первой формуле в (13).
3. Вычисляем ci по второй формуле в (13).
4. Если изменение значения ci превышает заданную точность, то переходим
к шагу 2, в противном случае вычисления закончены.


Определение числа классов

До этого момента вопрос об определении числа классов не рассматривался.
Предполагалось, что число классов задано исходя из каких-либо дополнительных
соображений. Однако достаточно часто дополнительных соображений нет. В этом
случае число классов определяется экспериментально. Но простой перебор
различных чисел классов часто неэффективен. В данном разделе будет
рассмотрен ряд методов, позволяющих определить "реальное" число классов.
Для иллюстрации будем пользоваться пространственной моделью в двумерном
пространстве. На рис, 10 приведено множество точек, которые будут
разбиваться на классы.


Простой подбор

Идея метода состоит в том, что бы начав с малого числа классов
постепенно увеличивать его до тех пор, пока не будет получена "хорошая"
классификация. Понятие "хорошая" классификация может быть формализовано по