Если в общем -
Word2Vec перевидет каждое слово в вектор, в Вашем случае, размерности 50. Дальше, Вам надо построить вектор всего документа, например, взяв среднее всех слов (векторов).
Псевдокод:
embedding_matrix = []
def build_matrix(text):
for token in text:
embedding_matrix.append(model.wv[token] )
return np.mean(embedding_matrix, axis=0)
df['vector'] = df['text'].apply(lambda t: build_matrix(t))
В итоге, у Вас каждый документ представлен вектором размерностью 50, который можно подать на вход любому алгоритму.