"В.Н.Щеглов. Модели признаков смерти от злокачественных новообразований для населения," - читать интересную книгу авторакоторая содержит меньшее число выводов К с оценками Г = 1. Конечно, далее
если возможно, следует с помощью информационно-поисковых средств интерпретировать полученную модель, а иногда и отбросить неинтересные тавтологии, которые неожиданно выявляются при тесной корреляции у с некоторыми сходными (с у) по смыслу переменными. Затем, если это требуется, уже строится модель для многокритериального Y. Еще отметим, что при исследовании объектов в динамике в массив исходных данных можно включать информацию (модели, в том числе и их Y), полученные на предыдущем шаге исследования (модели с "памятью"). Особенно это характерно при исследовании конфликтующих структур (дипломатия, разведка, информационное воздействие на социальные структуры...), при этом обычно Y отображается в виде значений k-значной логики. Программа АМКЛ вычисляет тупиковые дизъюнктивные формы в интервальном, и/или булевом и/или вообще в виде значений k-значной логики. Необходимые программы были выполнены В.Ф. Бучелем. Для наглядности представим такую модель М в виде следующего набора конъюнкций: К*1 V К*2 V ... V - (K1 V K2 V ... ) -> Z = 1, где К = (а1 < X1 < б1) & ... (аr < Xr < бr), причем К* относятся к целевой модели (т. е. для пораженной местности) и имеют свою (как и К) порядковую нумерацию. Далее, & - логическая связка конъюнкция ("и"), r - число интервалов (а, б), т. е. ранг К, V - логическая связка дизъюнкция ("или"), - константа "ложь", "отрицание", -> - логическая связка импликация ("если, то") и Z - цель исследования обычно в булевом виде. Z = 1 - проживание в местности (Н). В данной работе многие переменные Xi (i = 1, 2, ... ) будут булевыми, в этом случае при обнаружении болезни X = 1, при ее отсутствии X = 0. После вычисления К рассчитываются их оценки Г - число (повторяемость) каждой К в выборке и множества строк массива данных (номера больных), соответствующих Г; затем упорядочиваются все К по их Г. Начиная с К с наибольшей Г строится объединение множеств, соответствующих этим упорядоченным К. Отбрасываются те из них, множества (соответствующие Г) которых входят в объединенное множество всех ранее отобранных более "мощных" К. В итоге строится тупиковая дизъюнктивная форма. Ошибка М рассчитывается следующим простым способом. Известно, что идеальному генератору случая соответствует АМКЛ, где все Г = 1. Если после вычисления М удалить из исходного массива какую-либо одну строку - ее Z все равно будет распознана с помощью К, для которых Г = 2 или больше; однако возможна ошибка, если у некоторой К Г = 1 (полагаем, что структура М мало меняется при удалении одной строки для достаточно большой выборки). Будем называть максимальной ошибкой p для М суммарное число К, для которых Г = 1, отнесенное к общему числу (1040) в выборке умерших (в пораженной зоне их было около 70). Ошибка р в среднем для всех моделей (без их усечения, см. далее) равна 0,07. В работе [11] эта ошибка была равна 0,05, можно предположить, что выборка для настоящей работы была по неизвестным причинам (при сборе информации?) несколько "зашумлена". Программа построения АМКЛ предназначена для исследования сложных систем в динамике. Предполагается, что эти системы зависят также и от "скрытых" |
|
|