Предсказательное моделирование, основанное на численном решении сложных дифференциальных уравнений с граничными условиями, описывающих физические феномены, происходящие с исследуемым объектом в различных условиях, часто является достаточно трудоемким и не позволяет проводить массовые вычислительные эксперименты для анализа и оптимизации объекта. В последние годы появилось новое направление в моделировании, в котором по данным - результатам экспериментов с некоторой исходной моделью - строится новая модель, имеющая ту же структуру входных и выходных данных, обеспечивающая близость результатов обеих моделей для одних и тех же значений входных данных, но обладающая существенно более высоким быстродействием. В этом случае новая модель может заменить исходную модель, и поэтому называется суррогатной моделью или метамоделью (моделью над моделью).
Метамодели строятся по данным, поэтому многие проблемы, которые необходимо для этого решать, формулируются в терминах анализа данных. Однако в процессе построения и использования метамоделей необходимо взаимосвязано решать различные задачи анализа данных - такие как определение внутренней размерности множества данных, построение процедур снижения размерности, построение многомерных аппроксимирующих зависимостей, кластеризация и классификация данных и др. При этом выходные данные одной задачи являются входными данными для другой задачи, и целевые функции для частных задач нельзя определить независимо. Существенной особенностью решаемых задач является также тот факт, что многомерные данные лежат, как правило, вблизи нелинейных многообразий существенно меньшей размерности (по сравнению с размерностью исходных данных). Сами постановки возникающих задач анализа данных, как правило, имеют нетрадиционные постановки, обобщающие классические постановки аналогичных математических задач, что требует разработки новых или усовершенствовании существующих методов анализа данных.