Добрый день.
Поставлена следующая задача: есть выборка с 300 полями. В ней представлены больные онкологией люди. Поля - результаты анализов. Необходимо для новых людей со сданными анализами определить, есть ли у них онкология.
Для начала я планирую воспользоваться методом главных компонент, чтобы уменьшить размерность выборки. Что делать после, не знаю.
Если бы были две выборки - больные/здоровые, то это была бы задача на классификацию. Но что делать, если выборка одна? Как сравнивать новые значения вектора с исходной выборкой?
Есть идея использовать в данном случае генетический алгоритм. Но все остается на уровне идеи.
Какой алгоритм в решении данной задачи вы бы использовали?