"Е.М.Миркес. Учебное пособие по курсу Нейроинформатика " - читать интересную книгу автора

Главный вопрос: что могут нейронные сети. Ответ получен: нейронные сети
могут все. Остается открытым другой вопрос: как их этому научить?


Лекции 2 и 3. Сети естественной классификации

В данном разделе курса будут рассмотрены сети естественной
классификации. Этот класс сетей имеет еще одно название - сети, обучающиеся
без учителя. Второе название имеет более широкое распространение, однако,
является в корне неверным. В дальнейшем в нашем курсе будет рассмотрена
модель универсального нейрокомпьютера в которой будет явно выделен компонент
учитель и описаны его функции. В этом смысле данный вид сетей обучается с
явно заданным учителем. Когда давалось это название, имелось в виду, что
сети данного вида не обучают воспроизведению заранее заданной классификации.
Именно поэтому название "Сети естественной классификации" является наиболее
точным для данного класса сетей. Наиболее известной сетью данного вида
является сеть Кохонена [131, 132].


Содержательная постановка задачи

Достаточно часто на практике приходится сталкиваться со следующей
задачей: есть таблица данных (результаты измерений, социологических опросов
или обследований больных). Необходимо определить каким закономерностям
подчиняются данные в таблице. Следует заметить, что характерный размер
таблицы - порядка ста признаков и порядка нескольких сотен или тысяч
объектов. Ручной анализ таких объемов информации фактически невозможен.
Первым шагом в решении данной задачи является группировка
(кластеризация, классификация) объектов в группы (кластеры, классы)
"близких" объектов. Далее исследуются вопросы того, что общего между
объектами одной группы, и что отличает их от других групп. Далее будем
использовать термин классификация и говорить о классах близких объектов.
Слово близких, в постановке задачи, взято в кавычки, поскольку под
близостью можно понимать множество разных отношений близости. Далее будет
рассмотрен ряд примеров различных видов близости.
К сожалению, вид близости и число классов приходится определять
исследователю, хотя существует набор методов (методы отжига) позволяющих
оптимизировать число классов.


Формальная постановка задачи

Рассмотрим множество из m объектов {x}, каждый из которых является
n-мерным вектором с действительными координатами (в случае комплексных
координат особых трудностей с данным методом также не возникает, но формулы
становятся более сложными, а комплексные значения признаков случаются
редко).
Зададим пространство ядер классов E, и меру близости dist(a, x), где
a - точка из пространства ядер, а x - точка из пространства объектов. Тогда
для заданного числа классов k необходимо подобрать k ядер таким образом,