Любовь, если вам интересны крупные проекты типа Яндекс.Переводчика или продуктов ABBYY, то они написаны на C++, если мне не изменяет память. Для того, чтобы туда попасть вам понадобится года 3 опыта работы разработчиком на этом языке (он отнюдь не простой), отличное знание структур данных и базовых алгоритмов, и умение решать программистские задачки вот такого типа: https://leetcode.com/problemset/all/?difficulty=Medium
Любовь, SDL и ABBYY - это IT-компании. Обычно на одного продуктового эксперта в таких компаниях приходится десяток программистов, которые воплощают его идеи в жизнь.
Машинный перевод - это машинное обучение (ML) чистейшей воды.
Изучать языки вам никто не мешает, изучайте на здоровье, только за это не платят.
Ручным составлением словарей или чем-то подобным занимаются очень редко, в основном в рамках академической деятельности.
График первой производной будет заходить на отрицательную полуплоскость, когда функция убывает.
Форексы там просто в качестве примера используются, а EMA используют для подсчёта функции ошибки в некоторых задачах машинного обучения, например.
Чтобы график быстрее реагировал на изменения в данных, просто поставьте параметр побольше, я бы с 0.9 начал и изменял в зависимости от того, что именно хочется получить.
vipermagi, ну возьмите тогда экспоненциальное скользящее среднее, чтобы придать больший вес новым данным, но идея ровно такая же, если вам нужно погасить колебания, то надо брать какое-то среднее :)
По задумке, когда угол роста сглаженного графика начинает резко уменьшаться (кажись это называется градиент), то это достижение максимума.
Это называется "первая производная стремится к 0" :)
Иван Мельников, я пытаюсь намекнуть, что при обучении вы можете упереться не в базу, а в CPU/GPU. Оптимизировать нужно то, что является бутылочным горлышком всего процесса. С какой скоростью ваш CPU/GPU кластер способен обрабатывать данные из этой базы?
jcmvbkbc, мне кажется я нашёл ошибку в ваших размышлениях: вы опираетесь на то, что диапазон значений у log(float) больше, чем у обычного float.
На самом деле это не так. Каждому значению float соответствует ровно одно значение log(float). Тот факт, что они меньше по абсолютному значению, не играет абсолютно никакой роли, ведь исходное состояние остаётся лишь у нас в голове, с точки зрения компьютера это всего лишь новый float.
Сергей Горностаев, так я об этом и говорю. Когда ты знаешь математику, то применяешь её не задумываясь, а когда не знаешь - придумываешь скрипящие велосипеды.
Сергей Горностаев, это правда, программирование как навык требует обучения в ПТУ, а не в ВУЗе. Я как-то забываю про то, что не всем интересно решать сложные задачи, многие занимаются программированием в основном из-за денег.