Задать вопрос
  • Как борются с взломом нейросетей?

    @rPman
    Бояться нужно не левой разметки, это не взлом.

    Взлом нейронных сетей, это когда с виду незначительные (для человеческого глаза) изменения в изображении кардинально меняют результат работы нейросети.

    Гуглить adversarial attacks или атаки с использованием искажающих примеров.

    В принципе нормального универсального решения нет. Если атакующему будет неограниченный доступ к работающей нейросети, он сможет на ее основе создать алгоритм подбора искажающего примера для ее обмана. Поэтому - не давай пользователям неограниченного доступа ну и веса самой сети само собой. Это все из-за того что конкретные атакующие изображения будут работать только с той нейросеткой, для которой они создавались (буквально именно с теми весами).

    Кстати если это невозможно (т.е. веса сети должны быть на конечном устройстве, т.е. почти всегда), попробуй каждому клиенту предоставлять свою уникальную сеть, пусть и обученную на тех же данных (или нет) но с другими весами, такие сети будут по разному реагировать на искажения входных данных, т.е. атака будет возможна только адресной или сделает ее создание значительно дороже). Да, это дороже, с точки зрения обучения сети (это вопрос, на сколько далеко должен быть чекпоинт от результата, начиная с которого нужно вести переобучение, возможно и не очень далеко).

    Если погуглить, бороться с этой атакой предлагают правкой исходного датасета, т.е. добавлять в него такие искаженные данные (т.е. обучил нейросеть на исходных данных, нагенерировал искажений, добавил их к обучающей выборке и запустил файнтюнинг, повторить, оценивая время/стоимость создания искажения с каждым таким циклом) и просто увеличением его робастности - агументации данных (добавить в уже имеющиеся данные искажений, поворотов, шумов, например погодных, и чего то странного, тупой пример - одень людей в костюмы инопланетян, маски животных, раскрась лица, добавь рук или наоброт, без фанатизма само собой).

    Так же гуглятся предложения по Регуляризации функции потерь.

    Главная беда нейронных сетей - они очень плохо работают, если им давать только хорошие данные, вместо тех признаков что мы как люди привыкли примечать (потому что у нас огромный багаж знаний в довесок, плюс мы постоянно дообучаемся) сети выделяют какие то дикие и абстрактные для нас признаки, по которым внезапно так же можно решать задачу, и именно на этом сети легко обманывать. Чем больше плохих данных ты даешь, тем больше знаний о предметной области (чем не является искомые объекты) - тем лучше она их будет искать, в идеале плохие данные должны быть на границе с хорошими... у людей 'человеческие детеныши' отлично умеют 'бесить взрослых', прощупывать пределы допустимого, совершая максимально дичайшую дичь но рядом с тем что еще не успели запретить или не достаточно хорошо определили.
    Ответ написан
    Комментировать
  • Библиотека для индексации документов Golang?

    @rPman
    Либо менять способ хранения лога на что то структурированное (даже если это будет sqlite база без индексов, уже хорошо, но лучше конечно полноценную БД) и в последствии не знать горя, либо пилить сервис, который будет на лету мониторить изменения в логах и заливать опять же их в структурированную БД.

    Все зависит от типов запросов, от того, какие индексы тебе нужны, если хватит индекса по времени, уже считай повезло (когда при анализе приходится сканировать весь массив данных за запрошенный интервал) и данные можно будет хранить, поделив на интервалы (в реляционных базах есть для этого инструменты).

    Под БД я имею в виду любой инструмент который умеет индексировать записи и выделять структурные элементы (твои event: role: time: и тд.), причем возможна ситуация, когда сами данные дополнительно хранить не обязательно (хватит только индекса и информации о том где эти данные лежат),
    в одном месте
    у меня было (непродолжительное время как эксперимент) так, данные хранились в текстовом дампе, утилита индексации обновления данных вычисляла и хранила информацию о именах файлов и смещении в них для каждой записи, а по каждой записи для полей смещение внутри записи и длину строки (там были только числа и строки), информация об этом была значительно компактнее чем делать их копию в базу... но и индексировать ничего не надо было кроме времени.


    p.s. От текстовых, а точнее не структурированных, логов лучше избавляться с самого начала разработки, причем буквально на столько, чтобы приложение вообще ничего не выдавало в stdout и stderr (кроме собственно хелпа и данных, если это потоковые инструменты), причем конечно красивее централизованно красиво собирать логи по сети в хорошую БД, но не обязательно, иногда даже простая сериализация объектов в php:serialize/json по событиям по строчкам в тот же лог файл уже лучше, ведь такие файлы обрабатывать на порядок проще (json можно парсить на скорости гигабайты в секунду потоковыми парсерами, и это в одном потоке)... ну на это на сколько я знаю куча библиотек написано, в т.ч. прямо встроенные в ОС
    Ответ написан
    Комментировать
  • Почему на РЕД ОС тормозит RDP?

    @rPman
    p.s. rdp сервер для linux реализован для галочки и по факту неэффективная трансляция экрана.

    Все зависит от задачи, тебе нужно подключаться к машине на linux и запускать приложения? Или тебе нужно запускать видео/игры с динамичным контентом и минимальной отзывчивостью с ценою понижения качества изображения?

    Если тебе нужно подключиться к linux серверу и запускать приложения, то настоятельно рекомендую использовать x2go, клиенты есть по до все ОС кроме мобильных (может уже есть не смотрел давно). Подходит для сетей с низкой пропускной способностью.

    Если тебе нужно управлять экраном с динамичным контентом, при наличии широкого канала (под сотню мегабит) и низкими пингами, то рекомендую rustdesk
    Ответ написан
    Комментировать
  • Какую ответственность несет провайдер в случае взлома?

    @rPman
    В лучшем случае будет проходить в деле свидетелем ;)
    Ответ написан
    Комментировать
  • Какая достичь максимальной скорости просмотра экрана?

    @rPman
    Не верю что вы не гуглили свой вопрос!

    В гугле народ рекомендует библиотеки mss, dxcam (для windows), d3dshot,.. сам лично не пользовался, в любом случае упрешься в скорости обработки, и как только с изображением понадобится работать не через оптимизированную библиотеку типа opencv то сразу станет грустно.

    60fps это высокие скорости и обрабатывать изображение лучше на чем то по быстрее чем питон.
    Ответ написан
    Комментировать
  • Как добавить в регулярное выражение кириллицу?

    @rPman
    preg_replace не понимает мультибайтовые кодировки, и воспринимает символы просто как набор байт, соответственно он может найти искомый символ к примеру на пересечении двух символов, где конец первого и начало второго символа случайно совпали с искомым символом (что произойдет с этими двумя символами или всей строкой после можете сами догадаться).

    Я периодически вижу в интернете странные попытки настраивать локаль и использовать модификатор u и говорят даже работает, но документации для этого мне найти не удалось

    Но зато есть штатный механизм работы с кодировками - это расширение Multibyte String, пользуйтесь им и все будет работать как ожидается. В частности использовать нужно mb_ereg_replace
    Ответ написан
    1 комментарий
  • Как в линукс проверить, запущено ли net приложение?

    @rPman
    Нет нужды создавать mutex или semaphore, исторически, хоть в windows хоть в linux для этого открывают файл (пустой, их называют .lock) в режиме SharedAccess NONE
    https://learn.microsoft.com/ru-ru/dotnet/api/syste...
    https://learn.microsoft.com/ru-ru/dotnet/api/syste...
    FileMode = Create тогда файл будет автоматически создан если отсутствует и не выдаст ошибки если уже есть
    FileAccess = Write чтобы файл можно было создать (если создать его заранее то хватит Read)
    SharedAccess = None запрет на повторное открытие хоть на чтение хоть на запись


    При попытке открыть такой файл повторно, будет выдана ошибка, при этом при закрытии процесса, операционная система следит за закрытием файлов автоматически.
    Ответ написан
    Комментировать
  • Какой сервис сейчас предоставляет много места за недорого?

    @rPman
    Cамое дешевое что я знаю - это криптовалютные проекты вида siacoin (цены в месяц за терабайт! отдельно за хранение, загрузку выгрузку)

    https://github.com/SiaFoundation штатный кошель работает как привычные google/microsoft/dropbox/... хранилища и имеет простой и удобный api, так же есть такое https://github.com/lukechampine/us

    p.s. в таких проектах (это не только про siacoin) нужно помнить что твои файлы не обязаны храниться у народа вечно (даже если людям это выгодно, на сроках в годы всякое случается) поэтому закладывай ежегодное пересоздание контрактов и повторный перезалив данных (чтобы подсовывались другие хосты)

    Лично уже давно не пользовался filecoin, проект не мертв (сеть работает, хосты файлы хранят и раздают) но вся его сопроводиловка похоже народу надоела, сайты не работают и т.п.
    Ответ написан
    Комментировать
  • Как переубедить нейросеть (чтобы данные из промпта считались более важными)?

    @rPman
    С LLM у тебя только два варианта - добавлять информацию в запрос, а в случае с противоречиями, тюнить и усложнять подводку, типа если ты хочешь чтобы везде где сетка использует цвет красный она говорила
    бибип:
    Дальше в ответе вместо цвета - 'красный' ты должен писать бибип, с учетом правил русского языка, рода и склонения. Назови три цвета у светофора

    Три цвета у светофора: бибип, желтый и зеленый.



    Так вот тюнинг, очень противоричивая технология, в каких то случаях она значительно улучшает результат, есть даже ускоренный тюнинг, затрагивающий очень небольшой процент весов или даже только веса векторов запроса но не самой сетки (есть открытый проект peft с поддержкой практически всех доступных моделей), к сожалению openai не дает красивого доступа к этому, хотя для младших моделей типа gpt35turbo или davinci у нее такой механизм есть.

    Этот механизм имеет недостатки, из-за проблемы 'катастрофического забывания', чем больше данных ты пытаешься добавить в модель через дообучение, тем больше она забывает ранее выученных (с этим борются подмешиванием данных из изначальной обучающей выборки но это не так просто)
    Ответ написан
    Комментировать
  • Как и где учить математику, если вкатываешься в нейросети?

    @rPman
    Построение нейронных сетей из готовых инструментов (типа pytorch или для конкретных сетей типа transformer для llm), как это ни странно, не требует никаких знаний математики.

    Если же тебе нужно разбираться в том что внутри, т.е. понимать как это работает и уметь разрабатывать новые технологии (к примеру даже при наличии готовых технологий, сам процесс повышения качества работы llm требует очень специфических знаний), то тебе нужно углубляться в статистику и матанализ, на уровне выше школьного.

    И еще момент, сами знания, которые ты получишь из книг скорее всего тебе слабо помогут, они дадут базис и терминологию, но тебе все равно нужна будет практика, много.
    Ответ написан
    Комментировать
  • Как получить массив в массиве, в одном запросе?

    @rPman
    Зачем?

    Я надеюсь ты объединяешь в одном запросе данные изначальной таблицы и той из которой собираешь data с помощью inner (left если нужны записи с пустым data) join?

    Реляционные базы данных это про буквально табличное представление данных, не подразумевающее наличие вложенных списков (в некоторых типа oracle есть такие типы но по сути это как бы отдельный запрос к серверу, да достаточно эффективный но запрос).

    Если тебе нужен плохой совет, ты можешь сериализовать данные, собрав строку из них, например с разделителем ',' с помощью GROUP_CONCAT. В этом случае, используя группировку ты исключишь из результата запроса дубликаты (который умножает данные таблицы на данные data, дублируя колонки из таблицы) но потратишь время на конкатенацию на sql сервере и парсинг (для числ да простой) массива из строки на бакэнде.
    Ответ написан
    6 комментариев
  • Как снимать игровые видео по старым играм?

    @rPman
    Любимое многими Open Broadcaster Software пишет все и вся.

    Так же, обычно системы виртуализации (если вам совсем ретро вида DOS или платформеры) имеют встроенные механизмы записи видео
    Ответ написан
    Комментировать
  • Клонирование приложений из Windows Store?

    @rPman
    попробуй скачать .appx вручную (возможно инструкция ниже немного устарела но идея та же)
    https://winitpro.ru/index.php/2015/04/21/kak-skach...

    это архив внутри может быть и exe и msi
    Ответ написан
  • Как отписаться от 2000 пользователей в Инстаграм?

    @rPman
    Расширение к браузеру типа tempermonkey, запускающее пользовательский JavaScript по маске в url.
    Заранее помести список ид пользователей в localstorage и скриптом бери следующий id пользователя, открывай его страницу, или элементов с помощью css selector и метода querySelector, и жми на кнопку отписаться .click()

    Паузы между действиями с помощью setTimeout
    Ответ написан
    Комментировать
  • Как подключить беспроводной сетевой адаптер в Virtualbox?

    @rPman
    VirtualBox умеет пробрасывать только usb устройства, и то если повезет.
    Проброс pci устройств можно настроить на linux используя kvm, и там тоже только если повезет
    Ответ написан
    Комментировать
  • Как запустить exe с сетевого диска?

    @rPman
    Точно помню что запуск .net (точнее clr) приложения с сетевого диска работает в особом контексте прав и для этого нужно очень глубого ковырять права доступа, понижая защиту всей машины значительно
    * для начала поковыряйся в настройках internet explorer! дада, свойства браузера в панели управления, безопасность, выбрать местная интрасеть, кнопка другое, там будет что то про .net, поэкспериментируй), точно помню что в gpedit были политики связанные с сетью и .net их тоже нужно ковырять
    Извини делал я это во времена winxp, уже не помню, кстати один из способов, в свойствах приложения можно включить режим совместимости (будет запрос на превышение прав, это обходится другим способом, через планировщик задач)
    * еще советуют включить поддержку smb1, не уверен что это актуально но тут пишут что какраз для win10 это помогает.

    Настоятельно не рекомендую так делать! это значительное понижение безопасности машины. Лучше копируй приложение на локальный диск, но при запуске делай текущим сетевой каталог. Будут сложности с .dll но это другой вопрос (поместить их в PATH, кстати так же на локальном диске)

    p.s. еще есть вариант, не подходит для многопользовательского доступа к приложению, только монопольный, в сети размещай не сами файлы а файл образа диска .vhd (создается в управление мой компьютер - Управление дисками), этот файл можно с помощью diskpart монтировать из батника, и файлы на этом диске будут уже считаться локальными (может поплохеть, если во время записи оборвется связь, ищи способ отключить кеширование записи в свойствах этого диска)
    Ответ написан
    Комментировать
  • Как сделать свою колонку с Алисой?

    @rPman
    Попробуй с этого проекта начать изучение, там есть ссылка на полугодовалой давности версию, когда она была на питоне
    Ответ написан
    Комментировать
  • Купил бу комп.. В диспетчере указывался 1 cpu. После перестановки винды в скрылся обман. Cpu другой. Как это сделали как противостоять не разбирая пк?

    @rPman
    Запустил пару игр, которые были у него на компьютере, чип и видео карта показали хорошие результаты.


    Коробка, которая стоит рядом с монитором не обязательно к нему подключена, реальное подключение могло было быть к другому компьютеру, а дальше мошенник не подпускает покупателя к кабелям и отключает самостоятельно (тем более если монитор, клавиатура и мышка остаются свои, то запутать с кабелями не сложно, кабели уходят под стол, какие то приходят из под стола в корпус компьютера на столе, при должном старании мышку и клавиатуру можно использовать вообще беспроводную, а кабели вывести фейковые)

    p.s. и да про софт тебе сказали, изменить название устройства не сложно, проверять только со своей флешкой со своей ОС, к сожалению windows так не запустить.
    И да, с видеокартами уже давно научились биос перепрошивать а там что угодно можно нарисовать, верить можно только бенчмаркам.
    Ответ написан
    Комментировать
  • Нейросеть, которая по ссылке из ютуба смотрит видео и отвечает на вопросы по нему?

    @rPman
    Не существует (публично) ИИ, работающего с видео, но говорят что следующий ИИ обучать будет именно на них.

    Это значит единственное что можно сделать, это взять субтитры, в т.ч. автосгенерированные, скормить их уже существующим текстовым языковым моделями например от openai, и придумать промпты, с помощью которых можно что то вытянуть из этого.

    Если нужен хардкор, то можно брать видео, разбирать по кадрам и скармливать существующим алгоритмам типа SAM, но не уверен что можно полученный поток данных с пользой распознать.
    Ответ написан
    1 комментарий