Задать вопрос
  • Какие linux дистрибутивы можно установить на пк с 8 гигами озу?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Основным консюмером памяти в десктопах является именно UI. Практически ты можешь брать любые дистрибутивы на базе XFCE и они должны норм работать. Это главная причина почему XFCE существует. По поводу вырвиглазности я вообще не понял. Ты куда смотреть будешь? В веб-содержимое или в XFCE ?

    Вообще если ты такой сёрфер которому надо 10 вкладок и скорость - то ты должен сам понимать что браузеру просто необходима память. Потому что шрифты и картинки и буферизованные видео всегда будут требовать много. И здесь просто работает обычная экономика. Если у тебя много памяти - то браузеру комфортно. Если мало - то его ресурсы падают в paging со всеми вытекающими. И здесь не будет волшебной таблетки. Будет просто плавная деградация производительности. Умеряй аппетиты короче.
    Ответ написан
    3 комментария
  • Как я могу конвертировать число в символ?

    mayton2019
    @mayton2019 Куратор тега Java
    Bigdata Engineer
    System.out.println((char)3);

    Так не надо делать. Это получение Unicode символа по коду 3.
    Оно сработает но с точки зрения code-review некрасиво и твоя команда
    будет тебя бить и чморить за такой способ кастинга.

    В java есть специальные литералы для работы с кодировками.
    Например для символа с кодом 3 (однобайтного типа ASCII)
    '\x03'
    Или например для кириллической буквы А в кодировке UTF-16
    '\u0430'
    Ответ написан
    3 комментария
  • Что можно написать новичку на асм?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Если ты новичек - начни с простого. Когда я учился в универе - у меня был просто интерес написать
    графическую библиотеку для SVGA/VGA режимов графики. На дворе стояли 90-е и тогда не было
    никаких ускорителей и видяшки назывались S3/Trident. Вобщем сильно много я не написал.
    Было просто рисование цветных трапеций на экране. И это чудовищно непроизводительно для
    процесса разработки. Любой С++ ник заткнет тебя за пояс по скорости выкатки новых фич.
    А качество кода на выходе у gcc вполне себе хорошее чтобы не найти вообще кейсов где
    человек может лучше написать. Вообще в чем заключается оптимизация на асме? Держать
    в голове карту регистров и помнить какой из них под чего использован. Еще неплохо-бы
    помнить что у тебя в кешах лежит.

    Что еще из простого. Попробуй реши квадратное уравнение на FPU и на SSE. Это разные
    техно-стеки и будет познавательно сравнить какой способ лучше или удобнее.
    FPU - это легаси но он еще поддерживается в железе. Я тоже хотел когда-то написать но бросил
    в силу своей нетерпеливости. Мне было интересно понять насколько FPU близок к языку Forth.

    По топику выше пишут интересные советы по брутфорсу но это задача на уровне алгоритмизации
    сложная и я-бы на твоем месте все таки начал с квадратных уравнений. Заодно освоишь работу с вводом
    выводом текста.

    Вобщем брутфорсы и умноженя матриц это очень круто но ту просто попробуй это ПРАВИЛЬНО решить
    на языке высокого уровня и проникнись с сложностью решения. И я думаю на этом этапе ты устанешь
    и не пойдешь дальше. Вообще ассемблер - это язык очень узкого применения и какие-то языковые
    фичи (ООП) в ассемблере уж точно не нужны. Ну по крайней мере они там не имеют какого-то явного
    преимущества.
    Ответ написан
    Комментировать
  • Активно ли разработчики пользуются встроенными в Postgres функциями?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Кину 5 копеек по поводу работы с датами. Да это зло. Работа с датами в современном API это
    самый большой технический долг начиная с Unix, когда дата представлялась секундами с 1970 года
    в виде DWORD. Я не встречал ни одного языка программирования и ни одной DBMS где изначально
    была-бы какая-то очень строгая и математичная концепция работы с временем. Везде были ограничители
    в основном завязанные на примитивные типы либо на строки вариативной длины. В Java например
    долгое время экплуатировался тип java.util.Date который сегодня считается дыркой (мутабельность)
    и неточным и его заменяют на java.time.* семейство типов. Параллельно с ним где-то в космосе
    висит java.sql.Date который декларирован в интерфейсах JDBC как основа для БД. С ним-же и работают
    все драйвера реляционных бд.

    По поводу вычислений на application tier. В последнее время DBMS девальвировали. И в основном
    используются в микросервисах как хранилище таблиц без особой логики. В этом есть свои смыслы.
    Например удобнее тестировать и хранить 100% кода в языках Java/Node/C#. Это создает гомогенность
    языка в проекте. В противном случае логику пришлось бы неизбежно резать на 2 слоя и хранить
    половину в application и другую половину деплоить через flyway/liquibase в БД при этом еще и
    не забыть тестировать 100% совместимость тех-же функций для работы дат-времени (никто
    кстати невкурсе что в Oracle год может быть 9999 а java.util.Date мне удалось сгенерировать
    такую Aug 17 09:12:55 EET 292 278 994. .. оптимистичненько доживем до 290 миллионов
    лет хотя проблема comparison этих типов остается) Стандарты ISO помогают но они скорее
    декларируют намерения сохранить нужное значение. Вот и если вы новичек - то я гарантирую
    что вы словите кайф в попытке в Java разобраться в проекте какой тип дат вам брать. И еще
    помножите это все на типы данных БД (их там будет 4 штуки обычно. Парочка для зональных
    и парочка для локальных).

    Использовать или нет функции PG? Ответ - it depends. В некоторых случаях оптимизатор не видит
    индекса если ты делаешь неявный кастинг из строки в дату например. Я тут не уверен надо проверять.
    Но есть старая админская поговорка. Плохой execution plan - проверь типы данных в предикатах.
    Беда реально существует для Spark/Databricks и даже включена в учебный план. По крайней мере int/Long
    различается на уровне Catalyst-optimizer. Вобщем если вы - лентяй то можете лупить строки вместо дат
    и надеятся что SQL машина правильно интерпретирует. Если вы хотите быть точным то делайте CAST или
    to_date с явным описаловом YYYY-MM и т.д.

    Еще один поинт в части где хранить логику. Это я пишу просто для кругозора. Чтобы топик
    не циклился вокруг Постгреса а люди видели пошире. В классических БД данные качаются
    к клиенту.
    Тоесть делаете SELECT * из миллирад строк - и этот миллиард будет прокачан до конца
    когда вы читаете резалт-сет по сети. Такова парадигма. Или курсор. Но суть таже. А в BigData данные
    лежат на месте но к ним "ходит" код
    . Вот такой метафизический парадокс. Сами понимаете что
    тут получается что встроенных функций даже как бы ... и нет. Подчеркиваю разницу.
    Ответ написан
    3 комментария
  • Как ускорить агрегацию данных в PostreSQL?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Ммм... Можно данные разбить по периодам. Месяцы. Годы. Кварталы. И считать агрегации только по последнему
    закрытому периоду. А по старым - считать не надо. Потому что уже посчитаны. Главное сохранить куда-то.
    Типа analytic_table.
    Раньше эта техника называлась OLAP. А щас ее вроде бы уже не используют. Заменили на BigData.
    Ответ написан
  • Можно ли перенести диск с Linux(Ubuntu) на другое устройство?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Это квест вообще. Более перспективный вариант как мне кажется - это все таки установить новый экземпляр
    ОС а со старого диска брать только HOME.
    Ответ написан
    Комментировать
  • Как правильно решить конфликт?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Это не про GIT/Gitlab. Это про программирование.

    Процесс ресольва конфликтов - это абсолютно ручной процесс. Его нельзя автоматизировать. Просто береться
    2 разработчика которые создали конфликт. Садятся рядышком и вместе обсуждает чьи изменения нужно
    затянуть.

    Что там сотворил GitLab - непонятно. Я не готов ничего сказать. Надо смотреть консоль команд которая форсируется самим приложением GitLab. Возможно они были неправильные. Или вы не так описываете
    ситуацию.
    Ответ написан
    2 комментария
  • Как из любой точки мира передать сообщение на ESP32 или любую ардуинку без установления подключения?

    mayton2019
    @mayton2019
    Bigdata Engineer
    За 40 лет существования протокола TCP/IP ничего не изменилось. Чтобы один хост соединился
    с другим - ты должен знать dest_addr, dest_port.
    Ответ написан
    Комментировать
  • Как в Python перейти на другой диск?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Попробуй так

    os.chdir('d:/Downloads')
    Ответ написан
    Комментировать
  • Как убрать ввод исходных чисел и операций при тестировании программы на python?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Берешь текстовый файл input.txt и записываешь в него все текстовые вводы. В том числе с переводами строк.
    Потом запускаешь примерно так

    $ python3 app.py < input.txt
    Ответ написан
  • Как показать работодателю реализованные проекты?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Это очень странный вопрос. Если ты подписывал NDA, то понятное дело что ничего показать не можешь.
    Можешь просто рассказать об этом. Портфолио имеет большее значение для дизайнерских проектов
    где есть визуальная часть и она очень очевидна и ее можно быстро оценить.
    Ответ написан
    Комментировать
  • Ubuntu лагает на VirtualBox?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Я подозреваю что лаги связаны с неполной поддержкой видео.

    Я-бы советовал просто отключить в Ubuntu все те вещи которые тебе не понадобяться.
    Если Ubuntu ставиться в качестве Http сервера - то выключи Gnome/Kde.
    Ответ написан
    Комментировать
  • Как организовать хранение данных ингредиентов в базе рецептов?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Поскольку нет никаких больше требований. У нас имеется типичная документно-ориентированная БД.
    Рецепты. Ингредиенты не специфицированы. Могут быть любые.

    Лучше всего здесь подходит MongoDb. И поиск по ингредиентам нормально сработает.
    Одна таблица. Просто и изящно.
    Ответ написан
  • Почему не выводится график регрессий?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Распечатай на экране точки через которые должна пройти линия регрессии. Скорее всего она вылетает за
    границы масштаба поэтому ее просто не видно.

    Вообще не понимаю на что ты расчитываешь делая такой черный ящик. Занялся машинным обучением - выводи
    каждый шаг. Объем выборки. Кусок дата-сета хотя-бы покажи. У тебя ведь нет даже expectations относительно
    того как должны выглядеть эти линии.
    Ответ написан
    Комментировать
  • Как просмотреть номер телефона на OLX?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Без кода никто этот вопрос решать не будет потому что для симуляции этой ошибки надо код написать.
    Я не знаю таких энтузиастов которые сядут и за ништяк напишут. Но по поиску olx parser в гитхабе есть
    проекты. Можете посмотреть как у них реализован сбор телефонов.

    https://github.com/digitalashes/olx-parser
    Ответ написан
    Комментировать
  • Почему счетчик на корутине работает не корректно?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Ну... если проводить аналогию с потоками. То count будет иметь столько экземпляров сколько
    корутин запущено. Тоесть счетчик локальный по отношениию к функции.

    И поскольку textView - это глобальный объект. Его видят все функции то они начинают его бомбить
    разными значениями.
    Ответ написан
    4 комментария
  • Какую базу данных выбрать для поисковой системы?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Из поисковых систем для Full-text search я помню только две. Sphinx, Lucene (на его базе Elastic/Solr). Но насколько они применимы в данном примере - я не знаю. Надо глубже понимать задание. На уровне юз-кейсов.

    Зачем тут графовая БД - непонятно. Приведите пример что вы хотите записывать в граф.
    Ответ написан
    8 комментариев
  • Как использовать HttpClient с NTLM аутентификацией?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Хз. Но NTLM считается уже не безопасным для современных требований. Может поэтому?
    Ответ написан
    Комментировать
  • Почему проблема в парсинге времени используя node-xlsx?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Такая ошибка бывает когда ты используешь смесь из двух разных API. Из API локального времени и времени
    с указанием тайм-зоны.

    Лечится это переходом всех функций в какой-то единый API.
    Ответ написан
    Комментировать
  • Как сделать поиск по СПИСКУ сайтов?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Обычно разработчики гугло-поисков обычно используют этот API
    https://developers.google.com/custom-search/v1/overview

    Насчет мульти-доменного поиска - не помню такого. Надо искать в описании.
    Ответ написан
    Комментировать