А можно ли сделать так, чтобы ML-движок сам выделял признаки из набора однотипных данных? Например, слова в тексте. Как?
Для оценки текста мы можем взять какие-то слова, дать им веса, и т.д.
А можно ли как-то переложить эту задачу на машину?
Ну, если у нас есть выборка данных из 10,000 текстов, и, скажем, есть 10,000 других текстов, по которым имеется оценка 1 и 0.
То существуют ли алгоритмы-технологии, которые сами выведут модель из этих 10,000 ответов, которую затем можно будет применить к выборке из 10,000, чтобы оценить ее так же - на 1 или 0?
А можно ли как-то переложить эту задачу на машину? --> Можно. существуют ли алгоритмы-технологии, ---> Существуют. Это вообще в принципе уже реализовано? -->Реализовано. Как это называется? Что курить, читать, гуглить, смотреть? --> Начните с "векторизации текста", далее - по ссылкам.