Задать вопрос

mayton2019

Bigdata Engineer

1383

вклад
26

вопросов
2790

ответов
19%

решений

Ответы

Что быстрее поиск по файлу JSON в PHP или в базе посредством MySQL?

mayton2019 @mayton2019
Bigdata Engineer

Недавно я смотрел доклад Бартунова (это один из ведущих разработчиков Postgres в РФ ), вобщем он хвастался, что на поисковых операциях по Json , pg быстрее чем MongoDb.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как лучше выполнять перенос изменений из feature-ветки в develop?

mayton2019 @mayton2019
Bigdata Engineer

Вот тут с первых слов у меня уже непонятно

Регулярно переношу изменения из feature-ветки в develop ветку (та ветка в которую переносятся итоговые изменения и из которой формируются релизы).

Зачем ты это делаешь? Какова твоя роль? Везде все знать? Если ты лид - сделай code-review отпиши комментарии и пускай отвественный разработчик сам заливает в develop.

А это что?

сквошил изменения, видел полный набор изменений, ревьювил и исправлял их и формировал итоговый коммит, который черри-пиком переносил уже в develop.

Мне кажется у тебя вообще налицо какая-то ненужная активность. Эти чери-пики и сквоши не надо применять для производтсва кода. Я около 7 лет работаю с git и мы просто обходились обычным merge.

Ответ написан более трёх лет назад

5 комментариев

5 комментариев
В чем принципиально различие postgres от mysql?

mayton2019 @mayton2019
Bigdata Engineer

Postgresql - более консервативен. Его можно брать почти для любых проектов. Есть partitioning что свидетельствует о зрелости системы и об Enterprise-ready. Единственное что может быть не очень - это некий кумулятивный эффект от частых inserts/updates который требует вакуума. И со счетчиками транзакций там есть нюанс. Но скорее всего в твоём сегменте разработки PHP/Laravel - тебе будет просто безразлично сущестование вакуума.

MySQL это лейбл под которым на самом деле могут работать различные engines таблиц. И если анализировать какой-то performance-инцедент то нужно в первую очередь спрашивать с какой опцией таблица создавалась. MyISAM/Innodb/e.t.c. Потому что выбор этого двигателя влиял на какие-то опции скорости и транзакций. Я заменял например в создающих скриптах InnoDb на MyISAM для того чтобы просто быстрее прогрузить 1Тб CSV файл.

В более современных версиях типа MariaDb (я уже не следил за этими новостями) есть более умные двигатели которые учитывают дефекты старых и по идее они должны быть универсальнее. Тоесть можно их брать смело.

Что лично меня раздражает в диалекте My/SQL - так это странного вида кавычки-апострофы. Никогда не понимал зачем это.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как установить библиотеку через pip (возникает ошибка)?
mayton2019 @mayton2019
Bigdata Engineer
А ну сделай у себя в консоли

wget https://files.pythonhosted.org/packages/ca/91/6d9b8ccacd0412c08820f72cebaa4f0c0441b5cda699c90f618b6f8a1b42/requests-2.28.1-py3-none-any.whl

Ответ написан более трёх лет назад

4 комментария
4 комментария
Существуют ли игровые движки работающие с CSS анимацией, а не рисующие на Canvas?

mayton2019 @mayton2019
Bigdata Engineer

У каждой вещи есть своё предназначение. Например у JavaScript - делать браузерные игры. У заднего прохода - делать дефекацию организма. Но находятся иногда мужчины которые находят анусу необычное применение.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Каким образом одна и та же игра может рендериться за счёт разных графических библиотек?

mayton2019 @mayton2019
Bigdata Engineer

Скорее всего собирается 3 дистрибутива. И кладутся в один каталог. В рантайме игра определяет какое API доступно и загружает соотв. dll-ки.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как скачать все файлы лежащие на сайте в статике?

mayton2019 @mayton2019
Bigdata Engineer

Дело в том что http-протокол не поддерживает команду DIR. Тоесть мы не можем спросить перечень файлов.
Можем только сказать GET /url когда точно-точно знаем путь.

Хотя некоторые старые сервера типа Apache поддеживают auto-index mod. Который просто генерит такие html-листинги. Но это опция. Ее могут включать а могут нет. Некоторые поддерживают редирект на ошибку. Но это тоже опция.

Вот пример такого листинга https://repo1.maven.org/maven2/

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как создать папку с помощью докера?

mayton2019 @mayton2019
Bigdata Engineer

RUN mkdir создает папку внутри docker-image.
Поэтому ее не видно невооруженным глазом.
Тоесть это подготовка артифакта дистрибутива а
не манипуляции с твоими каталогами.

Ответ написан более трёх лет назад

2 комментария

2 комментария
Можно ли делать так чтобы константный текст брался на этапе "(пре)компиляции" из фаила который не являеся source code?

mayton2019 @mayton2019
Bigdata Engineer

Совершенно непонятно зачем это надо? Константы можно просто объявлять в исходнике.

Тут зря автор смешал в кучу теги Go и С++. Это слишком разные философии разработки.
Я-бы сказал что в Go многие вещи сознательно упрощаются или выбрасываются. И обсуждать
вот так вот просто через запятую Go и С++ немыслимо.

Даже термин пре-компилляция уже вызывает такой себе диссонанс. От пре-процессора сознательно
уходят в современных языках. И на него не стоит обращать внимание. Он - рудимент.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Какова сложность алгоритма?

mayton2019 @mayton2019
Bigdata Engineer

Я обычно оцениваю на глазок просто мысленно предполагая что данных очень много.
Например строка длиной 2 млрд символов.
В этом случае 3 линейных поиска по ней (indexOf) дадут нам формулу

O(n)

Это в негативном сценарии когда мы не нашли скобочек трех типов.

Но в позитивном сценарии если мы нашли - начинает работать еще более хардкорная логика
реплейсмента которая ... ну я не знаю как работает. replace(..) которая под капотом тоже имеет
свою complexity. Наверное тоже линейную если стоит билдер строк. Получается что линейная вложена
в другую линейную. Получается квадратичная.

o(n^2)

Вообще мне кажется что этот код не оптимален и его лучше просто переписать на какой-то replace
с регулярками чтоб заменять не только первое вхождение но и все. Впрочем я тут не сильно помню как
Js работает с заменой. Пускай знающие откомментируют.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как узнать какая кодировка была использована?

mayton2019 @mayton2019
Bigdata Engineer

Предположительно BinHex. Но надо проверить все символы.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Зачем нужна база данных если можно хранить данные в json файлах?

mayton2019 @mayton2019
Bigdata Engineer

movchans ваша фраза (заголовок вопроса) просто выдает в вас неопытного разработчика который еще с базой не работал.

MongoDb помимо хранения json файлов (на самом деле внутри она хранит bson) предлагает опции масштабирования (можно поднимать несколько нодов одной базы) и командную строку запросов. Кроме того можно создавать индексы, по разным полям документа - это коробочная фича Mongo.

И я даже не знаю сколько у вас уйдет времени на то чтобы просто повторить этот функционал. Даже атомарная работа с документами. Если вы не опытный разработчик - то работая с файлами вы наделаете таких дел что ойойй. Я готов даже спорить на коньяк что наделаете. Интуиция такая вот.

По остальным пунктам что написал Roman Kitaev я полностью согласен.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как построчно сравнить два файла txt?

mayton2019 @mayton2019
Bigdata Engineer

Первое. Тема топика Python + PowerShell. Тоесть непонятно тебе нужно программировать и развивать этот софт или решить задачу 1 раз и забыть. В зависимости от желания - будет разная реализация.

Второе. Есть коробочные утилиты fc (Windows) diff (Linux) которые такое сравнение делают. Но обычно для исходников и при условии что изменений мало. Почитай про них. Возможно это частично решит твою задачу.

Третье. Ты хочешь сравнивать одну строку со всеми из другого файла. Это декартово произведение. В данном случае тебе можно сортировать оба файла и тогда одинаковые значения будут кластеризованы рядом. Sort + Diff решают твою беду.

Вобщем думай. Но лучше 1 раз сделай покрывающий пример двух файлов. И результат чего надо на выходе. Это сэкономит время.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как заставить делиться число пока результат не станет меньше или равно делителю?
mayton2019 @mayton2019
Bigdata Engineer
В науке это называется факторизация или разложение числа на простые множители.

$ factor 50 50: 2 5 5

50 раскладывается на 2 умножить на 5 в квадарте.

Но ты почему-то решил что надо делить только на 2. Да еще и с каким-то недоказанным округлением.

Ответ написан более трёх лет назад

2 комментария
2 комментария
Как начать парсинг csv с нужной строки?

mayton2019 @mayton2019
Bigdata Engineer

Если csv.reader поддерживает интерфейс iterable то можно сделать фильтр как тут пишут https://learnpython.com/blog/map-filter-reduce-python/

filter(function, iterable)

Ответ написан более трёх лет назад

Комментировать

Комментировать

Как строку или таблицу превратить Map?

mayton2019

mayton2019 @mayton2019 Куратор тега Java

Bigdata Engineer

Вот заготовка.

Map<String, List<Integer>> list = new LinkedHashMap() {{
           put("Петя", Arrays.asList(1, 2, 3));
           put("Развитие", Arrays.asList(3, 4));
        }};

        String res = list.entrySet().stream().map(
                entry -> entry.getKey() + " ; " + entry.getValue()
        ).collect(Collectors.joining("\n"));

Ответ написан более трёх лет назад

Комментировать

Комментировать

Как оставить в UTF-8 строке только 2х байтовые символы?

mayton2019 @mayton2019
Bigdata Engineer

Вот по такой маске 110xxxxx 10xxxxxx (где x - это произвольный бит) можно выделить двухбайтные символы.
Со ссылкой на вики https://en.wikipedia.org/wiki/UTF-8

Но я думаю что ты делаешь что-то не то. Тоесть тебе надо делать другое.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Влладалаьаьыджввла?

mayton2019 @mayton2019
Bigdata Engineer

но к сожалению спустя чуть меньше чем через 1,5 месяца работы был забанен(разрабы юзают easy anti cheat).И после бана у меня встал вопрос продолжать двигаться к очеловечиванию бота или же меня подвела винда(как я предполагаю она выдаёт эмулированные действия,это я вычитал на каком то форуме)

Я боюсь что никто не сможет спасти твоего бота до тех пор пока у нас не будет точной причины бана.
Оперировать предположениями - это значит терять зря время и играть в астрологию. Вот ты пишешь что
тебя подвела "винда".

При чем тут винда? Как ты решил что винда? Какие были логи? Нужно - больше фактов.

Меня лично тема ИИ и НС интересует. И я готов ее обсуждать. Но я сейчас вообще не нахожу ни одного основания что здесь обсудить.

Вобщем подумай над анализом. Ты еще создашь 100500 ботов. Но тебе нужен лог сетевого трафика и полный анализ действий во времени. Без этого никак.

Ответ написан более трёх лет назад

3 комментария

3 комментария
Как получить прошлые версии сайтов на githab.io?

mayton2019 @mayton2019
Bigdata Engineer

Можешь сделать
git log
и посмотреть историю изменений
Потом
git checkout xxxxxx
и указать хеш коммита.

Ответ написан более трёх лет назад

7 комментариев

7 комментариев
Чем асинхронность лучше многопоточности для чат-бота?

mayton2019 @mayton2019
Bigdata Engineer

Насчет чят бота не скажу. Вообще скажу.

Если задача связана с вычислением численных метдов например. Или рендерингом 3D. Или крипто-майнингом. Или нейро-сетей - где
CPU -> 100%, I/O -> 0% то тогда тебе прямая дорого в мультипоточность (мультипроцессность). Количество тредов расчитывается обычно по формуле = количество ядер (иногда АЛУ/Threads) умноженное на коєффициентик. Подбирается экспериментально для конфигурации и среды исполнения. У меня для Java-11 выходило что на 4 ядра Core-i3 надо было 5 вычислительных потоков.

Если в задаче главным дирижёром является канал I/O а нагрузка на расчет малаая (парсер) - то используют технологи асинхронизма. Это когда ваши вычисления подписываются на события I/O и 80% времени ничего не делают а только ждут события от I/O. При благоприятных условиях хендлеры могут потреблять вообще 0% ресурсов. Нет событий. Поэтому таких хендлеров можно поднять очень много. Пример - акторные технологии. Хендлер. Актор. Горутина. Пример 10 000 акторов обслуживается 10 потоками исполнителями.

Ответ написан более трёх лет назад

2 комментария

2 комментария

Самые активные сегодня

Drno
- 2 ответа
- 0 вопросов
VoidVolker
- 2 ответа
- 0 вопросов
Adler
- 2 ответа
- 0 вопросов
Smolovrat
- 0 ответов
- 1 вопрос
Максим К
- 1 ответ
- 0 вопросов
An
- 0 ответов
- 1 вопрос