Россиев А.А. Итерационное моделирование неполных данных с помощью
многообразий малой размерности,
Описывается метод моделирования неполных данных с помощью последовательности
кривых, обобщающий метод главных компонент. Обсуждаются три
версии метода:
а) линейный . с моделированием данных последовательностью линейных многообразий малой
размерности;
б) квазилинейный . с построением "главных
кривых" (или "главных поверхностей"), однозначно проектируемых на линейные главные компоненты;
в) существенно нелинейный . основанный на
построении "главных кривых" ("главных струн и балок") с использованием
вариационного принципа; итерационная реализация этого метода близка методу
самоорганизующихся карт Кохонена.
Все полученные зависимости, кроме линейной, нуждаются в экстраполяции, которая производится
с помощью формул Карлемана. Метод трактуется как построение нейросетевого конвейера, решающего следующие задачи:
а) заполнение пробелов в данных;
б) ремонт данных . корректировка
значений исходных данных так, чтобы наилучшим образом работали построенные модели;
в) построение вычислителя, заполняющего пробелы
в поступающей на вход строке данных (в предположении, что данные о новых
объектах связаны теми же самыми
отношениями, что и в исходной таблице).
Разработанная технология предназначена для решения
широкого спектра задач, связанных с
обработкой неполных данных. Она реализована в программных продуктах FAMaster и ModelAnalyzer.
ГЛАВА I.
ПРОБЛЕМЫ ОБРАБОТКИ
И ИТЕРАЦИОННОГО
МОДЕЛИРОВАНИЯ НЕПОЛНЫХ
ДАННЫХ С ПОМОЩЬЮ
МНОГООБРАЗИЙ МАЛОЙ
РАЗМЕРНОСТИ
ВВЕДЕНИЕ
I.1. МЕТОДЫ ОБРАБОТКИ ДАННЫХ С ПРОПУСКАМИ
I.2. ГЛАВНЫЕ КРИВЫЕ
I.3. ТАБЛИЦЫ ЭМПИРИЧЕСКИХ ДАННЫХ
Задачи эмпирического предсказания
Требования к методам обработки
таблиц эмпирических данных
I.4. ИТЕРАЦИОННОЕ МОДЕЛИРОВАНИЕ НЕПОЛНЫХ ДАННЫХ С ПОМОЩЬЮ
МНОГООБРАЗИЙ МАЛОЙ РАЗМЕРНОСТИ
Постановка задачи
ГЛАВА II. ЛИНЕЙНЫЕ И КВАЗИЛИНЕЙНЫЕ
МНОГООБРАЗИЯ
ВВЕДЕНИЕ
II.1. МЕТОД ГЛАВНЫХ КОМПОНЕНТ
II.2. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ
II.3. ЛИНЕЙНЫЕ МНОГООБРАЗИЯ МАЛОЙ РАЗМЕРНОСТИ
Сингулярное разложение матриц с
пропусками
Метод главных компонент для
таблиц с пробелами
II.4. ВОССТАНОВЛЕНИЕ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ЛИНЕЙНЫХ МОДЕЛЕЙ
II.5. МНОГОМЕРНЫЕ ЛИНЕЙНЫЕ МНОГООБРАЗИЯ
Ортогонализация базисной системы
векторов
Двумерные линейные модели
Трехмерные линейные модели
II.6. КВАЗИЛИНЕЙНЫЕ МНОГООБРАЗИЯ МАЛОЙ РАЗМЕРНОСТИ
Метод построения квазилинейных
моделей
II.7. ИНТЕРПОЛЯЦИЯ
Интерполяция полиномом небольшой
степени
Интерполяция кубическими
сплайнами
II.8. ЭКСТРАПОЛЯЦИЯ
Проблема экстраполяции, оптимальное аналитическое продолжение
и
формула Карлемана
Интерполяция и оптимальное
сглаживание по формуле Карлемана
II.9. ИСПОЛЬЗОВАНИЕ КВАЗИЛИНЕЙНЫХ МОДЕЛЕЙ
II.10. МЕХАНИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ
II.11. НЕЙРОННЫЙ КОНВЕЙЕР ДЛЯ ДАННЫХ С ПРОПУСКАМИ
ГЛАВА III. САМООРГАНИЗУЮЩИЕСЯ
МНОГООБРАЗИЯ МАЛОЙ
ВВЕДЕНИЕ
III.1. ОПРЕДЕЛЕНИЕ ГЛАВНЫХ КРИВЫХ
Алгоритм Hastie-Stuetzle
III.2. ИДЕЯ САМООРГАНИЗУЮЩИХСЯ КРИВЫХ
III.3. SOC
Алгоритм построения SOC
III.4. SOM
Квадратная SOM
Гексагональная SOM
Алгоритм построения квадратной SOM
Алгоритм построения
гексагональной SOM
III.5. ПРОБЛЕМА ЛОКАЛЬНОГО МИНИМУМА
Метод отжига
Многосеточный метод
III.6. СГЛАЖИВАНИЕ
Проблема сглаживания
Кусочно-линейная проекция на ломаную
Кусочно-линейная проекция на квадратную и
гексагональную сетки
III.7. МЕХАНИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ
ГЛАВА IV. ЭКСПЕРИМЕНТАЛЬНЫЕ
РЕЗУЛЬТАТЫ
ВВЕДЕНИЕ
IV.1. ФАКТОРНЫЙ И КЛАСТЕРНЫЙ АНАЛИЗ АДМИНИСТРАТИВНЫХ ТЕРРИТОРИЙ
КРАСНОЯРСКОГО КРАЯ ПО
ПОКАЗАТЕЛЯМЗДОРОВЬЯ И ЗДРАВООХРАНЕНИЯ
IV.2. ТАБЛИЦА РЕЗУЛЬТАТОВ ВЫБОРОВ ПРЕЗИДЕНТОВ США
IV.3. ВЕРИФИКАЦИЯ СВЯЗЕЙ МЕЖДУ ДВУМЯ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
IV.4. СОЧЕТАННЫЕ ПОРАЖЕНИЯ ПРОВОДЯЩЕЙ СИСТЕМЫ СЕРДЦА