"В.Н.Щеглов. Модели признаков смерти от злокачественных новообразований для населения," - читать интересную книгу автора

которая содержит меньшее число выводов К с оценками Г = 1. Конечно, далее
если возможно, следует с помощью информационно-поисковых средств
интерпретировать полученную модель, а иногда и отбросить неинтересные
тавтологии, которые неожиданно выявляются при тесной корреляции у с
некоторыми сходными (с у) по смыслу переменными. Затем, если это требуется,
уже строится модель для многокритериального Y. Еще отметим, что при
исследовании объектов в динамике в массив исходных данных можно включать
информацию (модели, в том числе и их Y), полученные на предыдущем шаге
исследования (модели с "памятью"). Особенно это характерно при исследовании
конфликтующих структур (дипломатия, разведка, информационное воздействие на
социальные структуры...), при этом обычно Y отображается в виде значений
k-значной логики.
Программа АМКЛ вычисляет тупиковые дизъюнктивные формы в интервальном,
и/или булевом и/или вообще в виде значений k-значной логики. Необходимые
программы были выполнены В.Ф. Бучелем. Для наглядности представим такую
модель М в виде следующего набора конъюнкций:

К*1 V К*2 V ... V - (K1 V K2 V ... ) -> Z = 1,

где К = (а1 < X1 < б1) & ... (аr < Xr < бr), причем К* относятся к целевой
модели (т. е. для пораженной местности) и имеют свою (как и К) порядковую
нумерацию. Далее, & - логическая связка конъюнкция ("и"), r - число
интервалов (а, б), т. е. ранг К, V - логическая связка дизъюнкция ("или"), -
константа "ложь", "отрицание", -> - логическая связка импликация ("если,
то") и Z - цель исследования обычно в булевом виде. Z = 1 - проживание в
пораженной радиацией местности (П); Z = 0 - проживание в непораженной
местности (Н). В данной работе многие переменные Xi (i = 1, 2, ... ) будут
булевыми, в этом случае при обнаружении болезни X = 1, при ее отсутствии X =
0.
После вычисления К рассчитываются их оценки Г - число (повторяемость)
каждой К в выборке и множества строк массива данных (номера больных),
соответствующих Г; затем упорядочиваются все К по их Г. Начиная с К с
наибольшей Г строится объединение множеств, соответствующих этим
упорядоченным К. Отбрасываются те из них, множества (соответствующие Г)
которых входят в объединенное множество всех ранее отобранных более "мощных"
К. В итоге строится тупиковая дизъюнктивная форма. Ошибка М рассчитывается
следующим простым способом. Известно, что идеальному генератору случая
соответствует АМКЛ, где все Г = 1. Если после вычисления М удалить из
исходного массива какую-либо одну строку - ее Z все равно будет распознана с
помощью К, для которых Г = 2 или больше; однако возможна ошибка, если у
некоторой К Г = 1 (полагаем, что структура М мало меняется при удалении
одной строки для достаточно большой выборки). Будем называть максимальной
ошибкой p для М суммарное число К, для которых Г = 1, отнесенное к общему
числу (1040) в выборке умерших (в пораженной зоне их было около 70). Ошибка
р в среднем для всех моделей (без их усечения, см. далее) равна 0,07. В
работе [11] эта ошибка была равна 0,05, можно предположить, что выборка для
настоящей работы была по неизвестным причинам (при сборе информации?)
несколько "зашумлена".
Программа построения АМКЛ предназначена для исследования сложных систем
в динамике. Предполагается, что эти системы зависят также и от "скрытых"