Ответы пользователя mayton2019 — Хабр Q&A

Задать вопрос

Ответы

Можно ли обучить бота повторять действия в игре?

mayton2019 @mayton2019
Bigdata Engineer

Если речь идет о computer vision - то да. Скорее всего можно. Но мне жаль ваш талант. Если вы действительно создатите такого бота который обучается по картинке то вас можно нанимать на работу и платить столько денег что дешевая прокачка Эльфа в какой нибудь MMORGPG вам станет просто не нужна. Сможете купить все.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Нужно нагрузить сеть?

mayton2019 @mayton2019
Bigdata Engineer

Есть много способов устроить нагрузочное тестирование. Как вариант - приложение JMeter https://jmeter.apache.org/

При чем здесь Wifi - непонятно. Обычно тестируют приложение а не частные куски сетей.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как мониторить Spring Boot процесс (вылетает)?
mayton2019 @mayton2019
Bigdata Engineer
Трудно поверить конечно, что в логах у тебя ничего не написано. Как вариант - ты упираешся в какие-то прикладные ограничения который сам и создал.

Для начала тебе надо посмотреть чем заняты потоки в обычно (стационарном режиме) и в тот момент времени когда системе стало плохо. Когда именно - ты сам определишь. Пишешь дескыть "оно останавливается" - значит есть какой-то субъективный способ понять что беда уже случилась.

Значит тебе надо дважды вызвать вот эту утилиту

$ jstack --help Usage: jstack [-l][-e] <pid> (to connect to running process) Options: -l long listing. Prints additional information about locks -e extended listing. Prints additional information about threads -? -h --help -help to print this help message

и сохранить в текстовый файл что она выдаст. Потом сравнить. Разница - будет подсказывать причину.

И еще понаблюдай глазами за памятью через JVisualVM. Может что-то раньше увидишь.

Ответ написан более трёх лет назад

Комментировать
Комментировать
Что нужно чтобы написать ИИ который будет обучаться и угадывать которое число ты выберешь из 3 вариантов?

mayton2019 @mayton2019
Bigdata Engineer

Это наверное к ИИ не имеет отношения. Просто статистика. Марковские сети. И наверное теория игр.
Все это было создано задолго до термина ИИ в современном его понимании.

Ответ написан более трёх лет назад

16 комментариев

16 комментариев
Куда поместить 2 миллиарда строк?

mayton2019 @mayton2019
Bigdata Engineer

А попробуй сделай так

create index name_idx on emails(name);

и повтори свой запрос еще разик.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как ускорить алгоритм скользящего среднего?

mayton2019 @mayton2019
Bigdata Engineer

Для расчета среднего нам нужна сумма элементов и количество. Количество - это константа.

Сумма конечно меняется. Но если у нас уже есть расчитанная сумма от 1 000 000 элементов то
следующее скользящее среднее будет не сильно отличаться. Нужно от сумма забрать первый элемент
и добавить элемент с индексом 1 000 001. Это и есть оптимизация.

Тоесть первая итерация расчитывается полностью. Следующая - на основании предыдущей. Как в численных
методах.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как самостоятельно изучать теоретическую информатику?

mayton2019 @mayton2019
Bigdata Engineer

Скорее всего - никак. Информатика (и вычислительная техника) это все практические науки. Их надо изучать параллельно делая что-то руками. Все что вы перечислили. Теория игр. Криптография. Должно быть подкреплено реальным проектом где это используется.

В противном случае - эти знания бесполезны и забудуться. Это я по себе говорю. Такой мой опыт.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Странное поведение флешки?

mayton2019 @mayton2019
Bigdata Engineer

Очень много причин может быть. Основная - это ноутбук и смартфон используют разные драйверы для FAT32.
У ноутбука этот драйвер - более толерантный к ошибкам. У смартфона нет. Дальнейшее расследование этого
пустяка уже потребует денег и специалистов.

Попробуй отформативроать в ExFat https://en.wikipedia.org/wiki/ExFAT
Возможно многие потенциальные баги там уже исправлены.

FAT12/FAT32 - это морально устаревшая система и сегодня нет оснований ее использовать. Она создавалась для магнитных дисков и дискет малого объема.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Scala Spark Missing type parameter for List / Почему возникает данная ошибка?
mayton2019 @mayton2019
Bigdata Engineer
Я долго подбирал те слова которые ругательные, но которые цензура все таки пропускает. Вобщем выходило очень по старо-словянски. Вобщем лихо. Сиречь молвить совсем тяжко. Бесовщина... Все неправильно.

Во первых для чтения и обработки CSV файла тебе не нужен RDD. Это очень сырой тип данных который щас никто почти не использует. Его почти всегда заменяют на DataFrame/DataSet. Он остался только в легаси коде и в тех кейсах когда нужно обработать текст (natural language).

Во вторых желательно разделить просто Scala-функции и протестировать их отдельно.

В третьих. Тебе надо поработать со Schema и DataFrames. Тебе дано 9 comma-separated файлов. Получи из них сначала 9 датафреймов. При чтении используй следующий шаблон.

val atusact = spark.read.format("csv") .option("header","true") .option("inferSchema", "true") .option("delimiter", ",") .load("/data/atusact.csv")

После того как все датафреймы будут загружены - ты работаешь с данными которые имеют схему. (опция infer).
И из каждого датафрейма можешь получить колонки и типы как коллекции объектов.

Ошибки implicite conversions имеют отношение к языку Scala больше чем к Spark. Если перепишешь все на PySpark то ошибка сама собой уйдет. Я не хотел-бы на ней останавливаться. Отдельным топиком задай по Scala.

P.S. Я вообще игнорировал твоё задание. Мне безразлично что там надо сделать. Я просто смотрел по стилю.

P.P.S Не пиши флуд с картинками. Это не помогает в решении вопроса а только запутывает и раздражает читателя.

Ответ написан более трёх лет назад

2 комментария
2 комментария
Как реализовать завершение игры "Жизнь" на Си?

mayton2019 @mayton2019
Bigdata Engineer

Отвечу на первую часть вопроса

Одно из условий остановки игры, если поле зацикливается.
Но как это реализовать? Знаю способ, с запуском "скрытой" игры, которая будет течь в 2 раза быстрее, и сравнивать поле этой игры с полем оригинальной каждый ход. Затем на каком то моменте поля совпадут и с этого момента запустить сравнение по ходам со стартовым первоначальным полем. Когда совпадут, получается зациклилось.
Но можно ли как-то попроще это реализовать?...

Я не программировал Convay-s Life т.к. было не особо интересно. Но я наблюдал работу приложения Golly. Там можно было проводить сутки напролет в экспериментах, задавая различные конфигурации клеток и вот к чему я пришел.

Невозможно докзать завершение игры просто так. Поле, даже небольшого размера может состоять из осцилляторов или ружей и пожирателей которые имеют разные периоды и могут сейчас не взаимодействовать друг с другом но внезапно пересечся через 10 000 эпох. Поэтому чтобы доказать что имеет место устойчивый период надо физически воспроизвести все эпохи.

Короче клеточный автомат имеет свойства которые невыводимы из начальной конфигурации в общем случае.

В частных случаях например когда вы знаете что такое глайдер и куда он полетит - то пожалуй можно. Но таких случаев будет мало.

Нерешенные вопросы:
1) Поле бесконечное? Как быть с конечными ресурсами оперативной памяти?
2) Поле конечное? Уничтожаем клетки (глайдеры) которые вылетают за границу поля?
3) Поле завернутое в тор (бублик)? Будем ли считать линейные трансформации поля - эквивалентными к исходному?

Данные вопросы вобщем-то тоже влияют на проблему завершения жизни Конвея.

По поводу идеи автора с удвоением времени. Может не сработать если период повтора не будет кратен двойке.
По сути надо не сравнивать x и 2x эпоху. А записывать в базу данных все x - 1 эпох и проверять все-с-последней.
Но такая сверх-задача невыполнима например с растущим бесконечным полем.

Вторая часть вопроса не так интересна. Ее можно задать отдельным вопросом в habr.

Ответ написан более трёх лет назад

6 комментариев

6 комментариев
Как устроен поисковый индекс Google?

mayton2019 @mayton2019
Bigdata Engineer

Google использует шаблон map-reduce. Это когда исходная выборка (индекс) может быть разрезана на беконечно большое число partitions. Можно резать по хешу от hostname. Это дает возможность запускать ваш поисковый запрос не на 1 хосте а сразу на 1000 hosts и потом просто выдать сортированный union первых top n релевантных результатов. Кроме того google может кешировать ответы. Это снижает нагрузку на дубли поисков.

Этот шаблон известен. Просто google первый поставил задачу отказа от сверх-дорогих и ресурсоёмких серверов и перешел к использованию множества дешевых серверов но соединенных в поисковый grid. Кроме того файловые системы навроде hdfs дают возможность на обычных жлобских HDD делать бесконечно большую файловую систему. У этой ФС конечно есть недостатки. В частности она может быть не консистентна. Но для периодически обновляющегося текстового индекса - это норм. Типа eventual consistancy.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как сделать непадающий telegram bot?

mayton2019 @mayton2019
Bigdata Engineer

Техно-стек Erlang/OTP считаеться эталлоном надежности. Акторы. Супервизоры.

Вот изучи новый язык. Хорошая мотивация уже есть :)

Ответ написан более трёх лет назад

Комментировать

Комментировать
В каком 2d-коде можно сохранить 4КБ информации?

mayton2019 @mayton2019
Bigdata Engineer

Посмотри вот в этой табличке https://ru.wikipedia.org/wiki/%D0%A1%D1%80%D0%B0%D...

По теме. Я думаю что тебе не стоит думать в таких категориях. Все равно хорошую игру в 2К ты не втолкаешь. Шахматы в 5К втолкнули ну и что? Это слабые шахматы. Если у тебя есть хорошая игра то лучше положить ее в хостинг и в QR код добавить просто ссылку.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как сделать телеграм бота который может парсить вводимые данные в форму на сайте?

mayton2019 @mayton2019
Bigdata Engineer

Никак. Как же ее парсить, когда ее нигде нет?

Ответ написан более трёх лет назад

Комментировать

Комментировать
Чем ошибки отличаться от исключений?

mayton2019 @mayton2019
Bigdata Engineer

Обычно ошибки - это некое детерминированное поведение когда например в С++ функция fopen возрващает файловый хендл. И если проверка этого указателя на NULL - положительна значит была ошибка. И программист сам вручную принимает решение что делать.

Исключения - это некоторое свойство блока кода в котором может произойти "нечто" и мы на своём уровне не желаем отрабатывать каждую ошибку каждой функции а определяем некий общий обработчик всех ошибок одного типа.

Если не обрабатываем - то считается что делегируем обработку исключения той функции которая нас вызвала. По сути передаем управление "наверх". Тоесть кто вызвал - тот и обязан разруливать ситуацию. Очень похожий подход принят в акторной технологии.

Обычно механика исключений хорошо приживается в языках с Garbage Collectors.

Поэтому, подытоживая - да. Ошибки не равны исключениям. Исключения - это более высокоуровневый мехнизм.

Ответ написан более трёх лет назад

10 комментариев

10 комментариев
Замена матов на *** перед отправкой поста через бота, как реализовать?

mayton2019 @mayton2019
Bigdata Engineer

Матерные слова можно фильтровать с помощью фильтра Блума. Это для экономии места. Но справочник слов все равно нужно для начала найти.

Ответ написан более трёх лет назад
Зачем нужно выравнивание памяти? Точнее, почему процессор обращается 2 раза к невыравниным данным?

mayton2019 @mayton2019
Bigdata Engineer

Вопрос такой что отвечая на него можно новую книгу написать. Тут даже С не причем. А причем - архитектура процессора x86. Кстати тут еще надо кеш-линии рассмотреть. Это фокус такой. Что если тебе надо 1 байт прочитать
из произвольного адреса, современная архитектура этого не умеет. Она читает (обычно) кусок памяти шириной в 64 байта. Это обзывается кеш-линия. И уже из нее будет прочитан нужный байт. Отвечающие верно сказали выше. Еще можно добавить такое (условное правило) что тип данных должен лежать в сегменте данных по адресу кратному самому размеру типа. Тоесть int должен лежат на адресах кратных 4, long - 8 байт и так далее. Вот насчет MMX/SSE не знаю.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как получить понимание разработки игры?

mayton2019 @mayton2019
Bigdata Engineer

Из сбивчивых жалоб и стенаний автора можно только то что нет опыта и есть признаки выгорания от учёбы. У меня тоже такое было. Я выгорал. И самое лучшее в этот момент - бросить самообучение и заняться другим делом за которое платят и которое вполне осязаемо. Самая большая беда новичка - это амбиции. Это желание сразу сходу делать своё где есть все фичи в мире и можно грабить корованы и прочее. Это ошибка. Ошибка которая как раз приводит к выгоранию. Лучше написать морской бой в браузере который работает чем писать 3д шутер 10 лет и потом выкинуть его на свалку просто потому что он морально устарел. Одиночки вообще никакой игры не могут написать. Игра сегодня - это как съемки сериала. Требует слишком много разных знаний из разных областей и 1 чел никогда все не охватит.

По поводу мотивации и геймдева. Лучше всего наверное влиться в команду которая уже делает игры. Влиться самым младшим подмастерьем и хотя-бы пол-годика поработать и понаблюдать как идет процесс разработки. Да. Надо будет приглушить амбиции. Но ничего не поделать. Я думаю что это единственный верный путь где не будет выгорания. Эмоциональный контакт с командой очень важен.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как проверить количество цифер после точки во float в Python?

mayton2019 @mayton2019
Bigdata Engineer

С практической точки зрения удобнее задать вид форматирования (например 4 знака после запятой) и любое значение float при выводе на печать форматировать.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Насколько такой метод проверки является корректным и как его можно сократить?
mayton2019 @mayton2019
Bigdata Engineer
Вот эту сигнатуру ты сам придумал.

def add_time(self, h=0, m=0, d=0, dw=0, mh=0, y=0):

и дальше уже пошли все остальные беды отсюда. А прикинь еще будет 20 методов которые делают сравнение времени, разность в днях или календарные расчеты и везде-везде у тебя будет это ужасное векторизованное представление времени. Хотя на самом деле время - это просто вещественная точка на оси истории. Одно число. Например для unix-time достаточно целого числа 32х бит чтобы хранить любую дату с 1970 года.

С проверками условий тут ничего не поделать. Все они будут как ты и написал в полном объеме. С проверкой типов можно извернуться и свалить их хотя-бы на type hints.

Посмотри как python3 рекомендует работать с временем https://docs.python.org/3/library/datetime.html

Если очень хочешь создавать свой класс Clock - создавай. Только опиши хотя-бы для себя какой у него SingleResponcibility. Что он делает. Что хранит. Может окажется что тебе его делать не надо. Есть альтернативы.

Ответ написан более трёх лет назад

5 комментариев
5 комментариев

Самые активные сегодня

Михаил Лялин
- 4 ответа
- 0 вопросов
rPman
- 3 ответа
- 0 вопросов
frontAng
- 0 ответов
- 2 вопроса
Drno
- 2 ответа
- 0 вопросов
Rsa97
- 2 ответа
- 0 вопросов
Dmitry Bay
- 1 ответ
- 1 вопрос