0.818514878027
Sentense: Можно выдыхать спокойно, новые Star Wars олдскульно отличные.Абрамс — крутой, как и всегда. Сценарий, музыка, актёры и съемка — идеально.
Net: 0.8496 | Original: 0.9945 | mse: 0.020996091420100005
----
Sentense: Всем советую сходить на звездные войны супер фильм
Net: 0.6521 | Original: 0.9171 | mse: 0.07022710247469019
----
Sentense: СИЛА ПРОБУДИЛАСЬ! ДА ПРИБУДЕТ С ВАМИ СИЛА СЕГОДНЯ НА ПРЕМЬЕРЕЧУДА, КОТОРОЕ ВЫ ЖДАЛИ 10 ЛЕТ!
Net: 0.5084 | Original: 0.8428 | mse: 0.11181628888559215
----
Sentense: Хоть и не являюсь поклонницей #StarWars,но это исполнение чудесно!
Net: 0.6073 | Original: 0.8013 | mse: 0.037626316978027215
----
Sentense: Кто сегодня посмотрел звездные войны? я я я :))
Net: 0.9997 | Original: 0.7515 | mse: 0.06161306839960497
----
Sentense: Новые Звездные войны лучше первого эпизода, но хуже всех остальных
Net: 0.7553 | Original: 0.6476 | mse: 0.011603524060728511
----
Sentense: Хан Соло умрёт. Приятного просмотра
Net: 0.8520 | Original: 0.6473 | mse: 0.041919074830498025
----
Sentense: У всех вокруг Звездные войны. Я одна что ли не в теме?
Net: 0.3137 | Original: 0.642 | mse: 0.10776774679754442
----
Sentense: Идти или не идти на Звездные Войны, вот в чем вопрос
Net: 0.3598 | Original: 0.6389 | mse: 0.07788687273479397
----
Sentense: Звездные войны оставили двоякие впечатления. И хорошо и не очень.Местами не чувствовалось что это те самые… что-то чужое проскальзывало
Net: 0.7570 | Original: 0.5947 | mse: 0.026341183355763607
----
Sentense: Вокруг столько разговоров, неужели только я не фанатею по Звёздным войнам?
Net: 0.2960 | Original: 0.3408 | mse: 0.002010777129260961
----
Sentense: они вырвали мое бедное сердце из грудной клетки и разбили его на миллионы и миллионы осколков
Net: 0.4511 | Original: 0.1187 | mse: 0.11047035887966121
----
Sentense: ненавижу дноклов, проспойлерили мне звездные войны— пижамка найла
Net: 0.4842 | Original: 0.1056 | mse: 0.14336165619139976
----
Sentense: Проснулась и поняла, что новый Star Wars разочаровал
Net: 0.5266 | Original: 0.0939 | mse: 0.1871920009783976
----
Sentense: Я разочарован #пробуждениесилы
Net: 0.4147 | Original: 0.041 | mse: 0.1396483722604013
Почему отличаются значения в статье на хабре, с вашими значениями и с моими значениями?
И я отправил вам личное сообщение на хабре.
xdgadd, спасибо, я двигаюсь как улитка. Обновил код в своем вопросе и результат выполнения.
Не могу понять как сформировать X_train, y_train из тех данных, что у меня есть.
xdgadd, спасибо. В вашем коде все понятно, но что такое "написать функцию для эмбеддингов и подать сети на вход обработанные данные". Я не очень понимаю где входные данные в этой статье: https://habrahabr.ru/company/dca/blog/274027/
Куда эти числа втыкать?
Сделайте замену func = cmp_to_key(locale.strcoll), чтобы не вызывать две вложенные функции каждый раз
Сделал. За 1 сек. отработало.
На счет словаря. Я, конечно, за перфекционизм.
Но, не очень подсекаю как сделать словарь, ведь там еще куча данных идет.
Это я упростил, чтобы просто вопрос задать.
А реально, там типа такого:
{'src': 'Яблоко', 'dst': 2343, 'id': 324234, 'trans': 'gy'}
Спасибо большое.
- Список словарей приходит из манги, и уходит в темплейт, лишний раз что-то менять в структуре как-то не хочется.
- Сайт мультиязычный, сделал локаль
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8')
Вроде все работает.
- С itemgetter выполнялось за 1 сек, а в вашем решении со списком словарей за 1.2 секунды, самая тяжелая страница, какую я только смог сгенерить. Так что практически без потерь.
- Может и с другими языками решатся похожие проблемы. Говорят, что они там так же бывают.
Надо будет проверить с немецким.
Вот что у меня получилось:
Почему отличаются значения в статье на хабре, с вашими значениями и с моими значениями?
И я отправил вам личное сообщение на хабре.