Задать вопрос
  • Что делать, если уже созданы 4 раздела при установке Ubuntu ??

    mayton2019
    @mayton2019
    Bigdata Engineer
    ntfs - не родная система для этого дела. Если вы так по чесному хотите смигрировать на Ubuntu - то уходите совсем. Если хотите держать две ОС - то может лучше загружайтесь с флешки. Если вам ценна та инфа которая осталась на ntfs разделах.
    Ответ написан
    Комментировать
  • Бот, понимающий смысл?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Можно начать с построения семантической сети по тексту.
    После того как сеть будет построена. Задача бота сводится по поиску вершин и рёбер в этой сети.
    Вершины и ребра будут по сути ответом на поставленный вопрос.

    С ботами я никогда не имел дела. Но разбирался как работает RDF/Semantic web/GraphQl.

    Но это всё из области четкой логики. Из того что умерло в 80х вместе с языком Пролог и Лисп.

    Возможно современные боты строятся как-то по другому. На базе нечетких (аналоговых или вещественных
    понятий). Например если Саша любит Машу - то с точки зрения нечеткой логики это не факт
    а просто величина чуть меньше единицы. Предположение. И если по тексту будет много фактов
    проявления любовей от Саши то в этом случае эта нечеткая связь будет расти и крепнуть
    по некой функции с насыщением но никогда не достигнет единички а просто так и останется
    предположением. Сюда-же до кучи механику нейроных сетей.

    Хотя КМК НС плохо подходят для текстовых задач. У них есть большой лимит по памяти. Сеть хорошо
    обобщает факты. Но плохо помнит частные случаи.
    Ответ написан
    53 комментария
  • Как оптимизировать запрос получения рекомендуемых постов с одним из тех же тегов?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Что такое 123 и 555 ? Это переменные? Или константы?

    Это важно понимать для дальнейшей оптимизации.
    Ответ написан
  • Хранение данных с датчиков. Как формировать UUID?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Совершенно нет никакой мотивации к использованию uuid.

    Uuid используется в распределенных мессенжинговых системах где принципиально невозможно обоспечить единый счётчик.

    В случае автора - лучше просто работая арифметикой загрузить нужные данные без конфликтов ключей. И сэкономить ценное место.
    Ответ написан
    Комментировать
  • Как организовать несколько сайтов (веб-приложений) с Java бэкендом на одном VPS?

    mayton2019
    @mayton2019 Куратор тега Java
    Bigdata Engineer
    В старом Апаче это называлось - виртуальный хостинг. Один Ip - и много имён в dns.
    Ответ написан
    Комментировать
  • Профит от многопоточности на простом примере?

    mayton2019
    @mayton2019 Куратор тега Java
    Bigdata Engineer
    Это очень опасный пример. Он завязан на фазы уборки мусора. Прогрев JIT. И размер кешей. В зависимости он версий java и ос. И никакой синьор-помидор тут не сможет точно сказать какие переходные процессы текут во 2 варианте кода.

    Как переписать - я не знаю. Но мультипоточка всегда полезна при парсинге множества сайтов одновременно. Вот пускай автор сделает веб краулер.
    Ответ написан
  • Как от заданных точек захватить области по вертикали и горизонтали?

    mayton2019
    @mayton2019 Куратор тега Java
    Bigdata Engineer
    Если белая это 0. Штрихованная это 0,5. Сплошная -1. Тогда на каждой итерации добавляем по 0,5 крестиком. Для каждой небелой. На 4й день все поле будет в единичках.
    Ответ написан
    Комментировать
  • Как работает matches из BCryptPasswordEncoder.class java?

    mayton2019
    @mayton2019 Куратор тега Java
    Bigdata Engineer
    По документации енкодер добрвляет 8 байтную случайную salt. На матчер это не оказывает влияния.

    Видимо так и задумано.
    Ответ написан
  • Веб-приложение для металлизации музыки. Возможно ли?

    mayton2019
    @mayton2019 Куратор тега Java
    Bigdata Engineer
    Мне видится такая декомпозиция.
    1) перевод источника (mp3/aac/ogg) в формат pcm.
    2) распознавание ритма и основной мелодии и гармонии. Выделение отдельных инструментов и классификация.
    3) рендеринг ударной партии и сведение сольных партий с дистошеном.
    4) pcm -> mp3

    Пункт 2 является самым сложным. За него даже заплатят денег если автор осилит это.

    Остальные пункты этого задания технически решены и интереса не представляют. Они - утилитарны.
    Ответ написан
    Комментировать
  • Как в RC6 вводятся текст и ключ?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Схема при которой пользователь вводит НЕЧТО с клавиатуры и это нечто расматривается как ключ шифрования - очень слабая схема и не выдерживает атак. Пользоватль ленив и глуп. И всегда будет стараться вводить пароли и ключи по 1-2 символа. С этим ничего не поделать. Поэтому если автор заинтересован чтобы поле ключей было более сложным - надо использовать во первых SALT в совокупности с паролем. И использовать функцию хеширования наподобие SHA1 чтобы получить более-менее сложый ключ. В некоторых случаях (сеансовые ключи) можно получить энтропию из внешнего мира (часы в микросекундах и текущее положение мышки на экрасне).

    Тоесть само наличие в схеме алгоритма RC5 еще не гарантирует что у тебя система надежна. Нужно чтобы ее использование было чистым и лишенным человеческого фактора.
    Ответ написан
  • Как разбить число?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Это очень стандартная задача для теории алгоритмов. Погугли "задача о разбиении числа". Она решалась очень много раз и есть для всех языков.
    Ответ написан
    Комментировать
  • Существует ли меинстримный способ оптимизации и доставки изображений?

    mayton2019
    @mayton2019
    Bigdata Engineer
    В топике КМК спутаны несколько вопросов. Сжатие и кроп - это разные методы. И crop теоретически
    повреждает картинку убирая из нее потенциально значимую часть сведений (копирайты или
    надписи внизу). Поэтому надо обговорить твоё задание не с бухты-барахты а более детально.

    Что делает imagecompressor - я не знаю. Но предположительно он берет JPEG и прогоняет по нему WEBP
    алгоритмы и потом перегоняет обратно в JPEG используя некую совместимость между ними. В цифру
    70 % я не поверю. Там скорее всего идет какой-то нечеткий критерий. А в условиях нечеткости можно написать
    любые проценты и при этом окружающие покивают головами ведь критерий-то нечеткий.

    По поводу сервиса. Я-бы поднял AWS-Lambda и поставил туда какой-то опенсорцный JPEG-WEBP кодек
    и использовал бы для себя как конвертер. Но по последнему пункту тебе надо искать программиста
    под AWS.
    Ответ написан
    Комментировать
  • Какие есть книги по архитектуре БД?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Таких паттернов скорее всего нет. Самый важный паттерн - это Нормальные формы (обычно с 1 по 3).
    Нормализация более высоких порядков обычно в продуктовых БД не делается. (почти не делается).

    Вообще в этой предметной области опасно давать паттерны т.к. всегда найдется задачка где даже
    де-нормализация (анти-паттерн) дает например буст к производительности и это не укладыватся
    в теорию. Хотя тебе любой базовик подтвердит что иногда денормализация полезна и делается).

    По книгам - посмотри
    Дейт - Введение в системы баз данных.
    Есть еще огромная тонна книг специфичная по отношению к вендору БД (Oracle/MSSQL/Db2) и у каждой
    из них будут свои рекомендованные паттерны. Поэтому давать их нет смысла или паттерн в одной DBMS
    может стать анти-паттерном в другой (временные таблицы MSSQL/Oracle).

    Или тебе надо сразу определиться на какой DBMS ты будешь работать.
    Ответ написан
  • Алгоритмы на хэш функциях?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Они так и называются SHA1 - Secure Hash Algorithm 1, MD5 - Message Digest 5.
    Ответ написан
    Комментировать
  • Есть какой-нибудь простенький sql валидатор/линтер?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Тебе по сути надо 300 файлов разложить на 2 кучки. SQL и не-SQL верно?
    Ответ написан
  • Как решить такую задачу на логику?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Элементарно.

    Обозначим поезда A,B. Обозначим управление например поездом A, так Left(A,x) - ехать влево на x единиц расстояния (это берется из возможности управления скоростью и контроля временем). Тогда заставим
    поезд A ехать туда сюда с амплитудой которая увеличивается. И в каждой крайней точке амплитуды
    - переключаться на поезд B и делать те-же манипуляции.

    Left(A,1), Left(B,1)
    Right(A,2), Right(B,2)
    Left(A,3), Left(B, 3)....

    Они гарантировано встретятся.
    Ответ написан
    Комментировать
  • Микропроцессор intel 8086, как записать пользовательские данные в область операционной памяти?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Автор у тебя уже есть какой-то HelloWorld для 8086 где есть каркас этого приложения?

    Опубликуй пожалуйста. Я думаю что это будет очень продуктивно иначе участники топика не поймут что именно тебе непонятно.
    Ответ написан
    Комментировать
  • Веб-сервер Linux и сбор стат.отчетов. Что посоветуете?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Непонятно что такое "хост" и как с него можно что-то собирать. Хост - это технический термин. Не бизнесовый и наверное в топике имелось в виду другое. Может на этих хостах - ftp/cifs файловые хранилища?
    Ответ написан
    Комментировать
  • Как реализовать инкрементный + full backup linux?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Правильно выше пишут. Технически tar+cron решает эту задачу. И обычно самое простое решение - самое надежное. Если "хочется отслеживать" - то это уже другая задача. И она не имеет прямого отношения к бэкапу. Тоесть вопрос состоит из двух независимых частей. Собственно бэкап. И какой-то мониторинг который должен ... что то мониторить.
    Ответ написан