• Если БД две, то к какой из них будет обращение?

    @alexalexes
    Если это MySQL, сразу после подключения есть запрос на выбор БД (use ваша_база), его нельзя проигнорить и начать выполнять другие запросы, связанные с контекстом таблиц.
    Если это другая СУБД, то выбирается по умолчанию схема данных та, которая закреплена за пользователем по его правам доступа, либо она имеет то же имя, что и логин пользователя.
    Ответ написан
    Комментировать
  • Как задетекировать изменение вероятности успеха в испытаниях Бернулли?

    Maksim_64
    @Maksim_64
    Data Analyst
    Если одним словом то тестирование гипотез:
    Например Cumulative Sum (CUSUM) Control Charts.
    1. https://www.ncss.com/wp-content/themes/ncss/pdf/Pr...

    2. https://www.osti.gov/servlets/purl/1374023 (с vpn)

    3. https://en.wikipedia.org/wiki/Sequential_probabili...

    4. Чего нибудь байесовое обязательно тоже имеется (погуглить)
    5. Огромное семейство Likelihood тестов тоже подойдет, p-это всего лишь параметр (погуглить).

    Будешь работать с CUSUM (это моя рекомендация для решения проблемы) там тоже тест статистика для кумулативный суммы и т.д. В конечном счете все сводится к тестированию гипотез.
    Ответ написан
    1 комментарий
  • Апгрейдить или продать ПК?

    CityCat4
    @CityCat4
    //COPY01 EXEC PGM=IEBGENER
    У меня тоже тачка 2013-го сборки, но она пойдет под замену, потому что грейдить это - это примерно как пытаться делать утопленнику искуственное дыхание. Это сейчас примерно как ооооочень жиденький офисный комп, прямо бюджетный-разбюджетный.
    Для программирования видюха не нужна, брать можно со встройкой. Памяти от 16, ssd под систему.

    Впрочем, все как всегда, упирается в бабки. Если с бабками все совсем туго - ну можно и это грейдить - памяти до 16, ssd, поискать проц на развалах.
    Ответ написан
    Комментировать
  • Как избавиться от процесса "Yandex voice-assistant Alice", который остаётся после закрытия Яндекс.браузера?

    @evgepet Автор вопроса
    Представитель Яндекса подсказал решение: в настройках в разделе "Системные" нужно снять галочку "Ускорять запуск браузера"
    Ответ написан
    Комментировать
  • Не работает модель для игры камень, ножницы, бумага?

    Maksim_64
    @Maksim_64
    Data Analyst
    Вся твоя затея не имеет никакого смысла. KNeighborsClassifier - использует по умолчанию Minkowski metric, что эквивалетно для p=2, обычной Евклидовой дистанции.

    Евклидова дистанция не имеет никакого смысла - для категориальных переменных на вход, она мощный инструмент для непрерывных и бесполезный для категориальных. А у тебя именно категории stone, shears и paper которые закодировал ты правда, совершенно не правильно. Тебе тут нужен OneHotEncoder, а так ты как бы говоришь алгоритму что paper (3) чем то отличается по весу в модели чем stone (1) . В целом можно работать с так называемой Hamming distance, которая позволяет KNeighborsClassifier получать категории на вход, но scikit-learn не поддерживает ее из коробки, то есть ее можно добавить как custom metric.

    Если ты собираешься чему то научится то:
    1. Изучи примеры с объектом pipeline он позволяется осуществлять трансформации на тестовом и тренировачном датасете, внутри пайплайна.

    2. Для любого алгоритма для этой задачи необходим OneHotEncoder его прям в пайплайн встроешь. Примеры в доках scikit-learn имеются.

    3. По скольку у тебя категориальные переменные на вход, то используй алгоритмы которые базируются на деревьях решений. Все они есть в scikit-learn.
    Ответ написан
    2 комментария
  • Каким образом можно настроить ping компьютера по имени в другой подсети?

    Tkreks
    @Tkreks
    Системный инженер
    самый простой способ - в файле hosts прописать соответствие ip -> домен который будет = имени компьютера
    Условно:
    computer123 192.168.12.34

    Либо вариант 2, который так же связан с DNS. Если у Вас есть подконтрольный Вам DNS сервер, и DHCP сервер который раздает в сеть IP, и он же раздает настройки DNS сервера, который = IP вашего подконтрольного сервера, то создать там А запись, которая будет ссылаться на нужный Вам IP.
    Условно в микротике
    Static DNS
    6656341c784df243786976.png

    DHCP config
    665634363e6a2617474981.png

    Если же Вы про WINS или как оно там называется, то там уже сложнее и нужно более подробно рассказывать про то, какое оборудование используете, топология сети, что не получается?
    Либо поднять WINS сервер и через DHCP options передавать его IP
    Ответ написан
    Комментировать
  • Как правильно организовать выборку зашифрованных данных PostgreSQL?

    Melkij
    @Melkij
    PostgreSQL DBA
    Никак.

    Ловите своих DBA, архитектора, безопасников, начальство и совместно вникаете, существует ли вообще вектор атаки, от которого вы так пытаетесь защититься.
    Один постоянный универсальный ключ шифрования зашитый в приложении и открыто передающийся по сети - это больше профанация чем безопасность. И хорошо ещё, если ключ не сохраняется в логах базы вовсе в открытом виде.

    Если начальство решает, что да, такое шифрование необходимо и от чего-то защищает - то это будет прямым ответом на задачу: поскольку необходимо шифрование parent_iin, то быстрый поиск по этому полю невозможен.

    Единственное возможное исключение: если ваша функция шифрования обязуется быть immutable в терминах postgresql, т.е. на один и тот же ключ и исходные данные генерировать всегда один и тот же бинарно идентичный результат. Тогда делаете индекс по parent_iin и ищете по условию where parent_iin = функция_шифрования(данные, ключ) то есть по зашифрованному представлению данных.
    Ответ написан
    Комментировать
  • Почему ПК не принимает оперативную память, хотя дожен бы?

    @Drno
    Ну для начала попробуйте запустить всё на авто. А дальше -
    это какой то ноу-нейм китай, хз рабочая она или нет...
    покупать надо лучше нормальную фирменную оперативку - кингстон, hynix, etc...
    Ответ написан
    4 комментария
  • Хочу написать python Бота который играет в сапер за меня, и наверное мне нужно наставление более опытного?

    Vindicar
    @Vindicar
    RTFM!
    1. Ввод данных
    Окей, гугл, как сделать скриншот в питоне

    2. Предобработка данных
    Используя что-то типа opencv matchTemplate(), превращаешь скриншот в двухмерный массив, описывающий игровое поле.

    3. Принятие решения
    Имея двухмерный массив, описывающий поле, определи, где надо ставить мину. Если решение принять не удаётся - определи, какую клетку надо открывать.

    4. Реализация решения
    Зная номер клетки, выполнить щелчок по ней. См. pyautogui.
    Ответ написан
    Комментировать
  • Почему ошибка при импортировании большой базы данных?

    @q2digger
    никого не трогаю, починяю примус
    он же пишет.
    Consider increasing innodb_buffer_pool_size.

    увеличивайте параметр innodb_buffer_pool_size
    Ответ написан
    Комментировать
  • Почему компьютер хуже работает, пока не отключу блок питания?

    @tukreb
    Блок питания, вряд-ли, скорее всего у вас вздулись кондёры на материнке. Проверить это можно самому, отключите всё питание, и посмотрите есть ли на материнке такие цилиндрические контейнеры (бывают маленькие и большие) у которых не плоская крышка, а вздутая, либо ещё бывает снизу под ними что-то вытекло. Если такое есть со вздутием, или вытекшие, то вам в СЦ для починке, либо покупать новую материнку.

    кондёры должны иметь ИДЕАЛЬНО ровную поверхность и под ними тоже всё должно быть чисто, за исключением когда там под ними клей.
    Ответ написан
    6 комментариев
  • Как подчинить алгоритм YouTube?

    @psiklop
    Надо решать не следствие, а причину - то есть себя. Дисциплина нужна, при включении ютуба категорично не смотреть предложенное, а пользоваться старомодным поиском. Включил - закрыл глаза - вспомнил что-то полезное на тему, что смотрел ранее - набрал в поиске и смотришь!
    Ответ написан
    Комментировать
  • Какую нейросеть можно использовать для позиционирования стикера на макете упаковки товара?

    Maksim_64
    @Maksim_64
    Data Analyst
    Безнадежные вводные.
    1. Никто не будет делать и предоставлять в открытом доступе нейронные сети столь узкой направленности. Это не имеет ни какого коммерческого смысла.

    2. Здесь речь идет о профессиональном софте работы с изображениями который поддерживает скриптинг (для автоматизации процесса).

    Какой именно понятия не имею, я в этом не разбираюсь.
    Ответ написан
    6 комментариев
  • Подойдут ди друг другу кабель 6 категории и компьютерная розетка категории 5е?

    flapflapjack
    @flapflapjack
    на треть я прав
    Конечно да) кабель высшей категории уж точно подойдет розетке и разъёму, относящихся к категории ниже
    Ответ написан
    6 комментариев
  • Номер телефона на WordPress меняется на левый номер, как бороться?

    Eridani
    @Eridani
    Мимо проходил
    Коллтрекинг
    Ответ написан
    Комментировать
  • Что лучше, SONiC или Cisco IOS?

    @Everything_is_bad
    мне необходим в домашную лаболаторию коммутатор
    вообще пофиг, бери чё осилишь, тут же главное понимание как делать, а не в какой железке.
    Ответ написан
    Комментировать
  • Как правильно удалить эти коммиты?

    AshBlade
    @AshBlade
    Просто хочу быть счастливым
    git revert

    1. Получаешь изменения
    2. Выполняешь git revert последовательно для каждого коммита в обратном порядке (т.е. с конца к началу), либо git revert --no-commit HEAD~10..
    3. Коммитишь это
    4. Пушишь


    т.е. примерно так

    git pull
    git revert HEAD~10..
    git commit -m "revert: newbie master push"
    git push


    Вот тут есть подробнее
    Ответ написан
    Комментировать
  • Возможно ли математически поставить под сомнение принцип случайности при раздаче карт в дураке на телефоне?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Самое сложное что в этой задачае - это сбор датасета. Тебе нужно аккуратно записывать
    сколько людей играет. И кто сдает какие карты. И после того как ты соберешь хотя-б несколько
    сотен сеансов игр, можно будет гонять всякие анализы по этому датасету и искать зависимости.

    Без этих данных - очень сложно строить гипотезы.
    Ответ написан
    Комментировать
  • Насколько безопасны браузеры?

    Везде говорят о том, что хранить пароли в браузере не безопасно, но из этого возникло пару вопросов.

    "везде" - это где?
    Главная опасность тут в том, что мало кто ставит мастер-пароль для паролей в браузере и из-за этого любой по факту процесс, который запущен от имени твоего пользователя может прочитать эти пароли.
    По тому есть смысл поставить мастер-пароль.

    + При использовании менеджера паролей в каком-то конкретном браузере ты усложняешь себе переезд на другой браузер, но это уже скорее вопрос удобства, а не безопасности.

    + Некоторые браузеры предлагают своё облачное хранилище для паролей - тут тоже вопрос, доверяешь ли ты условному гуглу, яндексу, или кому-то ещё хранение данных для входа в твой банк, например.

    А влияет ли на безопасность аккаунта, к примеру, незавершённая сессия? Стоит ли выходить из почтового ящика, соц. сетей и вообще любых аккаунтов в интернете, или это паранойя?

    Если ты используешь чужой компьютер, то обязательно все сессии нужно завершать.
    Хранить свои пароли на чужом компьютере тоже не стоит.
    Если девайс уже скомпрометирован, то трояну совершенно не составит труда украсть твои данные, пока сессия открыта, во время твоей работы.
    Ответ написан
    9 комментариев
  • Какие есть нейронные сети которые можно обучить на исходном коде?

    @rPman
    Ни одна gpt не сможет полноценно решать такую задачу
    скормить исходники движка Unreal Engine

    потому что это НОВАЯ информация, ее не получится добавить в виде обучающей выборки и finetune. Так как это заставит модель больше галлюцинировать.
    В теории это возможно
    но потребуется переобучение (пусть и с использованием уже pretrained модели на старте) на данных, на которых эту сеть обучали! это наиважнейшее условие, с некоторой эффективностью можно проредить исходные данные, буквально на днях читал об исследованиях, как можно оценить, какие данные можно использовать для дообучения а какие нет.

    Стоимость этого будет сравнима со стоимостью полного обучения - миллионы баксов, без преувеличения!

    После этого потребуется еще доводка с помощью алгоритмов RLHF (нужны серии специально подобранных вопросов, так же это очень связано с тем какая была обучающая выборка, иначе модель будет низкого уровня и способна только для задач completion и очень слабо для chat, а тебе нужны instruction

    GPT умеет легко обучаться только на данных, которые влезают в контекстное окно. У лучшей открытой сетки llama3-70b это 8к токенов (обычно это +-1 файл исходников) да и у других от силы 16к и 32к но они слабые и способности запоминать данные во всем окне очень слабые.
    Если что, советую mixtral 8x22b, требует 85гб для 4бит квантизации (в этом случае незначительно теряется качество) или лучше 96гб для 5битной. 64к размер контекста, работает несколько токенов в секунду на процессоре, т.е. будешь ждать но не критично долго

    Но это не значит что совсем нельзя. Привожу пример сессии моей беседы с бесплатным anthropic claude (у них большое окно контекста, влезает несколько исходных файлов), скармливал исходники приложения на c# для поиска дубликатов видео.

    Подготовил вопросы, они должны быть в старте промпта (тогда сетка их будет использовать на протяжении всей беседы) и подготовил промпты типа:
    - вот список файлов проекта, с каакого файла нужно начать анализ чтобы ответить на эти вопросы
    Смотрим что скажет сетка, и подсовываем ей по одному исходному файлу который она попросит
    - проанализируй этот файл, если тебе нужна информация по классам, определенным в другом месте, сообщи об этом

    Дополнительно в процессе беседы дублирую информацию из основных вопросов, либо задаю наводящие вопросы, если ответ получил не полный

    Сеть поняла написанный код, как он работает и смогла ответить на нетривиальные вопросы.

    К промптам в конец советую добавлять что то типа, 'проанализируй шаг за шагом', и эмоциональные 'мне очень важно получить ответ на этот вопрос, иначе меня уволят' и т.п.

    Будь креативным в промптах, чем лучше запрос тем больше шансов получить ответ.

    Для новых вопросов начинай новую сессию, заново заливая файлы. Чем больше файлов в контексте тем хуже сеть их понимает.

    p.s. 'точно и без ошибок' не будет!
    Ответ написан
    Комментировать