Видимо речь идет о поиске запросов для SEO-ядра.
1) Удалить дубликаты
2) Воспользоваться общедоступным списком стоп-слов, в интернете их полно. Там различные города России, слова "скачать", "порно", "бесплатно" и все такое. Такие списки можно загуглить, но перед использованием обязательно прошерстить глазами, чтобы нужных запросов не убрать.
3) Потом вручную просматриваете то, что осталось. Надо на разные группы под разные страницы разбивать, если их у вас 1500, а вы искали под 1 страницу.
4) Ничего не удаляйте, сделать группу "мусор" и в нее перемещайте.
Вообще логика неправильная, надо сначала собрать семантическое ядро для вашей тематики, потом его сегментировать, потом распределить по будущим страницам, потом досоздать страницы.
1500 - это не много, люди пользуются базами ключей (Моаб, Пастухов), синомизацией, искуственной семантикой и т.д., чтобы собирать полные семантические ядра.