"Е.М.Миркес. Учебное пособие по курсу Нейроинформатика " - читать интересную книгу авторапроекция равна tc. При положительном значении вектор проекции сонаправлен с
вектором c, при отрицательном - противоположно направлен. При условии, что длина вектора c равна единице, проекция вычисляется как скалярное произведение (x-b,c). В противном случае скалярное произведение необходимо разделить на квадрат длины c. Мера близости вектора (точки) x определяется как квадрат длины разности вектора x и его проекции на прямую. При решении задачи (4) необходимо найти минимум следующей функции: Продифференцируем целевую функцию по неизвестным tq, cir, bir и приравняем результаты к нулю. (10) Выразим из последнего уравнения в (10) bir: (11) В качестве bi можно выбрать любую точку прямой. Отметим, что для любого набора векторов xij и любой прямой с ненулевым направляющим вектором ci на прямой найдется такая точка bi, что сумма проекций всех точек на прямую x = b + tc будет равна нулю. Выберем в качестве bi такую точку. Второе слагаемое в правой части (11) является r-й координатой суммы проекций всех точек на искомую прямую и, в силу выбора точки bi равно нулю. Тогда получаем формулу для определения bi: (12) Из первых двух уравнений (10) получаем формулы для определения остальных неизвестных: (13) Поиск решения задачи (4) для данного вида классификации осуществляется по следующему алгоритму: 2. Вычисляем t по первой формуле в (13). 3. Вычисляем ci по второй формуле в (13). 4. Если изменение значения ci превышает заданную точность, то переходим к шагу 2, в противном случае вычисления закончены. Определение числа классов До этого момента вопрос об определении числа классов не рассматривался. Предполагалось, что число классов задано исходя из каких-либо дополнительных соображений. Однако достаточно часто дополнительных соображений нет. В этом случае число классов определяется экспериментально. Но простой перебор различных чисел классов часто неэффективен. В данном разделе будет рассмотрен ряд методов, позволяющих определить "реальное" число классов. Для иллюстрации будем пользоваться пространственной моделью в двумерном пространстве. На рис, 10 приведено множество точек, которые будут разбиваться на классы. Простой подбор Идея метода состоит в том, что бы начав с малого числа классов постепенно увеличивать его до тех пор, пока не будет получена "хорошая" классификация. Понятие "хорошая" классификация может быть формализовано по |
|
|