1. Какой классифицирующий алгоритм вы использовали бы определялки тематик уровня ашмановскогого
семантического зеркала (там 2500 категорий). Обучать предполагается на этом самом семантическом зеркале.
2. Сколько примерно потребуется текстов для обучения конкретного алгоритма?
3. Какой источник текстов вы бы использовали, чтобы охватить по возможности большее количество тематик?