• Неверная компиляция классов C++ в Unreal engine 5?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Начни с простого. Сделай новый проект в UE и сымитируй одну ошибку. Так проще разбираться.
    Ответ написан
    Комментировать
  • Есть ли бесплатная база данных с фильмами?

    mayton2019
    @mayton2019
    Bigdata Engineer
    В мире существует огромное количество баз с фильмами где лежит мета-дата.
    Это сведенья об актерах, аннотоции, рецензии и технические подробности релиза и рейтинги прокатов.
    Вот когда-то я качал отсюда например https://developer.imdb.com/non-commercial-datasets/
    Поищи в kaggle и google базах по машинному обучению. Там тоже есть метадата. Но вся она
    не стандартизирована. Разрозненна. И тебе предстоит работа дата-инженера в попытках
    хотя-бы привести это все к общему знаменателю
    . Справочники везде будут разные
    и модель нормализации вообще бывает разная. Кроме того эти базы ведут конкретные
    люди, которые ведут их в системе ценностей запада и США и поэтому их взгляд на
    содержимое будет вполне себе понятным. Тоесть объективной базы или объективной
    аннотации без купюр или без повестки будет найти почти невозможно.

    Сами фильмы - это платная услуга и скорее всего такого ты не найдешь нигде.
    А если где-то и найдешь - это обычно быстро закрывают. Может у соседа по дому
    есть росшаренная папка Windows. Как вариант.

    Если просто скроллить ленту rutor то можно найти неплохие релизы новых фильмов
    но как по мне - там больше шир-потреб или что-то очень старое и ненужное. Рутор
    неплох но очень мало чего я для себя там находил. Ну там Comedy Club можно было найти.

    Еще в телеграм канале внезапно стали появляться ленты с аносами и линками на сами фильмы
    но я таких советовать тут не буду (понятное дело). Кроме того они живут как бабочки-мотыльки.
    Несколько дней и потом внезапно закрываются.
    Ответ написан
  • Как создать мессенджер?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Если гуглить по ключевому слову С++ socket server то обычно находят приложение клиент-сервер
    который по TCP/IP передает текстовые сообщения. Я считаю что это - минималистичный мессенджер.
    Вот бери его и думай как развивать дальше.
    Ответ написан
    Комментировать
  • Имеет ли смысл напрямую кидать свое резюме компаниям?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Да. Имеет смысл. Его прочитают и положат в стопку других ожидающих писем и отпишуться стандартной корпоративной отпиской. Сомнительно что в данный момент ваш профиль будет нужен.

    Обычно информацию о найме распространяют через рекрутинговые агенства. Это - правильный путь и
    вполне современный. У рекрутера база вакансий всегда больше чем у кадровика какого нибудь банка
    или завода.
    Ответ написан
    Комментировать
  • Как типизировать обмен данными между микросервисами?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Почитай про GraphQL https://graphql.org/ . Многим - нравится. Можно декларировать гетерогенные структуры и типы данных.
    Ответ написан
  • Можно ли задавать вопросы об оптимизации и/или улучшение качества базы данных?

    mayton2019
    @mayton2019
    Bigdata Engineer
    можно ли в принципе кидать свою БД с просьбой об улучшении или оптимизации ?

    Скорее всего - нет. Подобного рода консультации делают консалтинговые конторы которые продают
    вам либо DBMS либо программный продукт (1С) и прочее.

    Хабр не должен их подменять собой.

    Если вы проектируете новую БД - то вы должны сводить вашу консультацию к 1-2 вопросам.
    Например - почему медленно работает данный запрос (текст SQL прилагается). Сделали
    такие-то такие-то индексы и все равно - медленно. Вот такой вопрос - для хабра.

    Риторические и философские вопросы - обычно производят много шума и флуда и в конечном счете
    все равно не несут никакого ответа.
    Ответ написан
    Комментировать
  • Существует ли обобщение контроллеров?

    mayton2019
    @mayton2019
    Bigdata Engineer
    В ООП существует 2 правильных пути расширения функционала.

    1) Наследование. Ты делаешь базовый контроллер с какими-то общими функциями. И другие контроллеры просто наследуются от базового. Наследование всегда красиво выглядит на диаграмме классов. Такое и приятно показывать на презетнациях. И заказчик доволен. Недостаток наследования - иногда в наследника попадает то что не нужно. И в этом случае наследование нужно просто дробить на большее число уровней. 2-3-4 и так далее.
    2) Композиция. Ты включаешь внутрь одного контроллера один или несколько функционалов от других контроллеров. Композиция не имеет пределов вообще. Можно композировать что угодно и с чем угодно. Композицию используют даже люди которые на знают ООП. И не на ООП языках. Просто у них для этого есть другие названия.

    К сожалению программирование на аннотациях делает из разработчиков ООП некий слабый подвид разработчиков которые перестают думать в парадигме ООП и зачем-то начинают искать другие пути
    разработки. Зачем - непонятно.
    Ответ написан
    Комментировать
  • Как реализовать поиск по всем полям всех моделей и связанных сущностей?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Реляционные базы данных не создавались для таких поисков. Они эффективны там где индекс используется.
    В твоем-же варианте нужно сделать джойн всего-со-всем и искать по этому всему без индексирования.

    Попробуй денормализовать ВСЕ и слить ВСЕ в один сет документов. И эти документы положи в ElasticSearch.
    Это - коробочное решение сегодня для любого текстового поиска. Работает быстро. Пропорционально числу
    вычислительных nodes. Чем больше nodes в кластере - тем быстрее ищет.
    Ответ написан
  • Как можно увеличить место dev/sda2 на "горячую"?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Непонятно что такое "Файловая система Linux". Это какой-то фасад за которым стоит вполне себе конкретная
    реализация (ext4, xfs). И не все из них поддерживают растягивание размера на ходу. XFS например - поддерживает.
    Ответ написан
    Комментировать
  • Как исправлять названия файлов (переименовывать) скачанных из ВК и других источников с нижним подчеркиванием?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Я ищу какое-нибудь приложение, утилиту или скрипт, который поможет мне автоматически исправлять имена файлов.

    Коробочного решения скорее всего не будет. Тут слишком много всякой специфики. Не напасешся правил.

    Из кроссплатформенных - могу предложить Java и Python. Разумеется вы должны уметь на них
    писать или лучше наймите фрилансера чтоб он вам один раз это хотя-бы написал.
    Ответ написан
    Комментировать
  • Блок схема оформлена правильно?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Второй блок странно выглядит. Когда я рисовал схемы (более 20 лет назад) в ВУЗах было принято
    обозначение ввода данных внутри паралелограмма.

    Бочка-набок - это типичное обозначение из очередей сообщений (Message Queues) но в данном
    случае это было-бы неправильно. Работа MQ - это бесконечный процесс и тогда надо как-то обозначить
    что процессинг и вывод тоже бесконечный. А у нас стоит явный СТОП алгоритма.
    Ответ написан
  • Как ускорить запрос Select живом поиске?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Select title from table where title Like % : title % limit 10


    runapa, есть разные пути как ускорить текстовый поиск. Человек в ответах верно написал что если
    ты включаешь лидирующий знак % то индекс не используется. Это правда. Классические индексы БД
    не умеют искать по середине выражения. Только по префиксу или по полному совпадению. Если сработает
    - попробуй переписать вот так.

    Select title from table where title Like : title % limit 10


    Если в поле title - ты постоянно ишешь какую-то категорию - то можно эту категорию выделить
    в отдельное поле и проиндексировать его и сделать его лидирующем в плане запроса.
    Тогда поиск будет выглядеть так.

    Select title from table where category='физ-лицо' AND 'title Like %: title % limit 10

    и фактическое время запроса будет уменьшено. Но это требует эксперимента.

    Если это все не помогло - то тогда почитай как в MySQL работает полнотекстовый поиск
    https://dev.mysql.com/doc/refman/8.0/en/fulltext-n... Это возможно потребует
    переделки всей таблицы. И переделки всех запросов.
    Не всем это подходит и не всегда оптимально. Поэтому делай эксперименты с замером времени.
    Текстовые индексы имеют побочные свойства. Они либо медленнее обновляются (неконсистентны)
    в отличие от B+Tree либо требуют ручных действий по обновлению.
    Ответ написан
    Комментировать
  • Как борются с взломом нейросетей?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Существует только один способ улучшать работу нейросетей - продолжить обучение на новых данных.

    Сам термин взлом здесь не применим. НС оперируют нечеткой логикой поэтому никакого взлома
    нет. Есть просто детерминированное поведение выхода в зависимости от входа.
    Ответ написан
    Комментировать
  • Как установить chat-gpt на компьютер?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Судя по разговорам чят-жпт слишком дорогой в обслуживании. Там пол-лимона в день уходит на аренду оборудования в датацентре. Сомнительно что у кого-то дома стоит эквивалентное железо.
    Ответ написан
  • Библиотека для индексации документов Golang?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Когда-то давным давно использовали logrotate. Эта утилита просто дробила лог на дневные и часовые
    и прочие доли. Это позволяло искать быстрее. Если ты заранее знаешь что событие произошло например
    за последние сутки а не за последние 10 лет к примеру. Но logrotate может не работать под Windows.

    Коробочного решения для твоего вопроса я не знаю. Кроме Elastic ничего не приходит в голову.

    Есть еще программный продукт Splunk. Но я его никогда не использовал поэтому советовать не буду. Почитай сам.

    Вообще тебе нужен разработчик. Я думаю что дешевле всего трекать отдельные логи по событию event:login к примеру. Я так делал для сужения поиска. Для библиотек log4j это конфигурируется на уровне приложения.
    Там как-то добавляется appender + rule.
    Ответ написан
    Комментировать
  • Зачем нужны class в Python?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Классы удобны когда все функции объединяются общим контекстом. Например подключение к БД.
    Или класс - клиентское окно где можно рисовать графику. Можно кодить и без классов на голых
    функциях (такое тоже практируется) но тебе придется одним параметром всегда передавать
    контекст.


    Использование классов (объектов) для хранения состояния - это признак зрелости исходного кода.
    Ответ написан
    Комментировать
  • Как повысить уровень создания проектов на чистом php?

    mayton2019
    @mayton2019
    Bigdata Engineer

    Тем не менее сейчас я столкнулся с тем, что на собеседованиях начинают спрашивать что серьезного доводилось делать на чистом php - без фреймворков и мои ответы на их вопросы касательно парсеров, скиптов для обмена данными остаются неубедительными. Даже дальше кадровиков иногда дело не уходит.

    Еще спрашивюат какие патерные проектирования используешь, придерживаешься ли принципов Solid?

    Мне кажется что за 9 лет ты уже достаточно получил опыта чтобы проходить собеседования. Просто ты - неуверенный. Тебе надо овладеть риторикой и просто базовыми умениями убеждать собеседника.

    Очень часто рекрутеры слушают не твои ответы а считывают твой уровень уверенности.
    Эти чортовы засранки - настоящие психологи. И они обучены распознавать лузеров и всяких мамкиных
    вайтишников.

    Шаблоны проектирования... Темя душная и нудная. Способна убить любой энтузиазм. Тебе не надо их знать
    все. Все - никто не знает. Прочитай про 3-4 штуки и попробуй узнать знакомые. Например singleton - достаточно
    известный шаблон и почти все разработчики всегда его использовали только не знали об этом. Или пул объектов.
    Например везде где есть базы данных - он используется. Или фабрика. Да я и сам их не знаю. Надо будет
    почитать - почитаю. Но для собеса - выучи хотя-бы классификацию. Они там разбиты по категориям
    как порождающие, поведенческие и так далее. Как в химии например. Я химию не знаю но примерно
    догадываюсь что есть кислоты и щелочи. Что действие их взаимо-нейтрализующее.

    А сейчас я не только ради прохождения собеседований, но и ради повышения скилла хотел бы углублённо погрузиться в написание кода без фреймворков. Но как к этому подойти? Не писать .же бложег или интернет-магазин на чистом php? А если даже и напишу, то где гарантия, что это было сдлано путёво с использованием нужных патернов и соблюдением принципов Solid?

    Нет нет это - чепуха. И это тебе не надо. Никто этот код все равно смотреть не будет (вообще никогда
    сцуко не смотрят).

    Главный совет. На собеседовании ты должен непрерывно говорить. Как оратор с трибуны. Тебя
    должны остановить когда - достаточно. Но если ты сказал 2 предложения и замолчал - это выглядит
    как будто ты не знаешь или не уверен в себе.

    Для проверки - закажи тестовое собеседование у друзей. Пускай они тебя поспрашивают. И запроси
    фидбек. Пускай они честно ответят что не понравилось. Записывай все пункты. Повторяй учебное
    собеседование до тех пор пока все будут довольны.

    Собеседования - как олимпиады. К ним надо привыкнуть и войти в некое астральное состояние духа.
    Вот как только ты в него зашел - так ты и сразу готов пройти любое настоящее.
    Ответ написан
    Комментировать
  • Не работает return PHP. Ничего не выводит на экран, что делать?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Попробуй так

    print implode(sqr(-1, -2, 15));

    UPD: +implode
    Ответ написан
  • Надежны ли показания контрольных хеш сумм?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Есть ли вероятность что если два одинаковых файла имеют отличия то контрольные хеш суммы будут одинаковые или иметь отличие в 1 символ ?

    Все современные криптографические хеши обладают свойством типа "эффект лавины" когда
    случайное изменение 1 бита входного текста вызывает изменение 50% битов хеша (или крипто-блока).

    В силу эффекта лавины такая ситуация невозможна для криптографических хеш-функций.

    Обычные контрольные суммы не тестируются на эффект лавины и не обязаны этому следовать.

    Может ли вирус во время вычисления хеш сумм подменять значения хеша ?

    Наука криптография изучает софистическую модель взаимодействия Алисы и Боба которые
    ведут переписку по незащищенному каналу который контролируется злоумышленником Кларком.
    И на этом пожалуй все. Никакие вирусы при этом не рассматриваются. Криптография предполагает
    что комьютер Алисы и Боба абсолютно полностью защищен и никаких снифферов или кейлоггеров
    или перехватчиков файлов там быть не может.


    Вирусы изучает инфо-безопасность и форензика уже с позиции анализа посмерного снимка.
    Тоесть когда уже событие случилось. И при этом у них и методы изучения и выводы и инструменты
    совсем другие. Криптография к этому моменту уже никому не интересна. Работа вируса отменяет
    сразу все аксиомы криптогарфии одним махом.
    Ответ написан
    Комментировать
  • Есть ли хорошие пошаговые туториалы проектов на С++ для новичков?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Обычно С++ в вакууме не существует. Его учат сразу применительно к программированию UI под Windows,
    или к Unreal Engine, или к сетевому программированию под Linux/Unix. Или еще более специфичный
    сегмент - сетевое оборудование и микроконтрллеры. Это неизбежно.

    Особенно когда ты доходишь до дисковой подсистемы, сетей или мультизадачности - ты просто выходишь за рамки С++ и нужно разбираться во всем остальном. И мне кажется что в этом главный челлендж. Не сам язык а
    системная архитектура и прикладные фреймворки.

    Тоесть в самом вопросе ты должен сам решить куда ты дальше со знаниями С++ пойдешь.

    P.S. С++ за 14 дней... - это завсегда можно найти.
    Ответ написан
    3 комментария