Я бы прошелся по всей выборке сначала - нашел максимальное количество вхождений слов, в топе наверняка будет мусор аля "Группа", "Live" и прочее. В идеале их вообще почистить(или пометить как-то, например так {{live}}). Дальше по 1 слову (допустим Red), делаем выборку, если в выборке много двух и более -словных сочетаний и мало однословных - скорее всего однословные мусор, а многословные содержат как минимум двухсловное название. Далее чистая стастистика - считаем вхождения каждого слова в выборку, если много - входит в название, мало - мусор. По статистике собираем название из максимально повторяющихся слов. Более подробно уже серьезно на бумажке порисовать/почёркать и вывести стройный алгоритм.