Задать вопрос
  • Почему может зависать ПК?

    @rPman
    У меня очень похоже подвисал очень старый комп, причина оказалась в блоке питания.

    Твой случай не обязательно такой же.

    Для выявления нужно начинать с установки числу ос (можно на другой диск) без приложений и попытке выдавать то же подвисание, иначе это покажет что проблема в софте.

    Выявлять причину железную сложно, нужно по очереди проверить каждую комплектующую в заведомо рабочем компьютере.
    Написано
  • Из-за чего могут лагать интерфейсы Windows 11?

    @rPman
    Драйвера установлены на видео карту?
    Видеокарта случайно не была в жёстком майнинге или БУ?
    Написано
  • Какие могут быть возможные причины изменения ответа LLM на один и тот же запрос?

    @rPman
    Докину, у нейронок, любых, есть проблема - переобучаемость, когда вместо выявления закономерностей обучающего датасета, она тупо 'запоминает' фактические данные, собственно главный критерий остановки обучения нейронки - сравнение метрик на обучающей и тоестовых выборках, как только качество у первой растет без роста на второй, так пора останавливаться.

    Так вот для llm-ок переобученность в локальном смысле (в пределах какого то одного 'признака'/'знания') модели может оказаться проще запомнить факт а не 'понять' его (т.е. не сможет сформулировать для себя применимость этого знания), и скорее всего это даже чаще всего и происходит, когда то это идет на пользу (когда нейронка умудряется цитаты из вики выдавать, особенно это полезно при паттерне запросов think step by step, тогда вываливаемые справочные данные работают как встроенный RAG, улучшая результат) но чаще просто занимает веса и отнимает ресурсы при обучении.

    Такое запоминание можно наверное считать записью в базе данных, но с очень очень большими оговорками, больше как аналогия.
    Написано
  • Какие могут быть возможные причины изменения ответа LLM на один и тот же запрос?

    @rPman
    @Maksim_64
    LLM осуществляет поиск информации в интернете
    никаким боком тут этого нет, поверх llm есть несколько продуктов, которые с помощью RAG докидывают в контекстное окно потенциально полезную информацию (типа макрософтовский bing copilot в chatgpt и как самостоятельный продукт, или боты coze, плюс совсем отстойные реализации у других, типа сберовского гигачата) и все это делают очень отвратительно, скорее всего из-за экономии денег (качественная реализация получится дорогой)

    При обучении использовалась информация из интернета, собственно это и есть то что сделано llm-ки такими хорошими - обучение на мусорных данных без их разметки. Дальше там идет генерация этих данных и конечно технологии типа RLHF, когда уже обученная сетка тюнится на серии вопрос-ответ (дает хороший буст в качестве но с кучей ограничений - информации этот способ не добавляет), в этом случае качество датасета вопросов кстати наиважнейшее, и его сбор становится очень дорогим, на столько что есть кому заплатить таким проектам как lmsys, или то что дало возможность openai продвинуться вперед с gpt35 до gpt4, за счет сотни миллионов пользователей и их вопросов.

    Сам finetuning моделей не добавляет информации, точнее не так, добавление новой информации ломает модель и делает ее хуже. Правильное дообучение должно содержать очень строго выверенную часть изначального обучающего датасета (в идеале всю) и даже это не гарантирует качественного результата. У нейронок есть отвратительная способность сваливаться в ловушки медленного переобучения (любых - это особенность алгоритмов обучения), когда новая информация требует на порядки больше времени обучения чем если бы та же информация была добавлена с самого начала.

    llm-ки не ищут информацию внутри себя, это абсурд, я столько людей видел пытающихся с пеной у рта отстаивать эту бессмысленную идею без каких либо шансов и логики типа llm это БД. llm-ки строят внутри модель знаний и закономерностей, которые присутствовали в обучающей выборке, примерно как человеческая память, на любую информацию идет попытка сохранить ее не как факты, а как алгоритм ее создания (через структуры на основе весов в нескольких рядом стоящих слоях). Собственно вопросом является, когда нейронка пытается принимать решения на основе запомненной информации, она для этого пользуется новыми структурами (грубо говоря дважды запомнила информацию, один раз как якобы факт а другой раз для принятия решения) или строит взаимные структуры... кажется mistral публиковали работу на тему поиска тех самых весов, отвечающих за конкретные знания.

    Новые версии llm-ок это не только обновление обучающего датасета, но и алгоритм (pipeline) обучения. Там уже давно не упирается все в загрузил обучающие данные, нажал кнопку, получил готовую модель... нет там последовательный процесс, с пересозданием модели, с правкой алгоритмов, структуры, токенизера и кучи всего что нам на публично не известно.
    Написано
  • Появился "фантомный" съёмный диск Windows 10 22H2, как его убрать?

    @rPman
    Gutaro, чтобы найти устройство, открываешь диспетчер устройств, включаешь в меню 'по подключению' и ищешь диск глазами по имени, тот же что показан в свойствах диска в проводнике, закладка оборудование. Список устройств буде древовидным, сразу все видно (чтобы раскрыть все ветви, нажми * на корне или соответствующий пункт меню по правой кнопке)
    Написано
  • Как найти источник данных этого сайта?

    @rPman
    там еще в меню можно сохранить всю сессию в .har файл, это в формате json абсолютно все данные красиво разложенные по массивам.
    Написано
  • Как изменить иконку файлов pdf не изменяя иконку html файлов, если и то и то открывается через Chrome?

    @rPman
    Для открытия файлов .pdf я использую браузер Chrome
    у меня только один вопрос - зачем!?
    Его просмотрщик не блещет функционалом, любой opensource будет не хуже, зато не придется изгаляться обманом пользователей.

    p.s. по теме вопроса, а если отредактировать ресурсы браузера, и заменить в них иконку? само собой подпись файла так же удалить и молиться что гугл не проверяет сам себя на модификацию (маловероятно)
    Написано
  • Ложное срабатывание на sfx архив?

    @rPman
    Lapish72, невозможно удалить встроенный .net, максимум обновление.
    да даже если можно, не представляю ситуации, когда пользователь это сделал, а главное, если смог сделать, значит и удовлетворить требования для приложения сможет.
    Написано
  • Ложное срабатывание на sfx архив?

    @rPman
    вы пробовали определить, на что именно агрятся антивирусы?
    на модель sfx?
    на вашу программу?
    на .net sdk установщик?
    ...?

    Есть неплохой способ немного прикормить дракона (антивирусы), это цифровая подпись приложения. Это путь не простой, инструкции есть, разные, с разной достоверностью, одни говорят что достаточно купить у майкрософта за $100 (в год кажется), другие что можно обойтись любым удостоверяющим центром,... в общем покопайтесь. Этот путь позволяет не просто уменьшить аппетиты антивирусов (особенно если агрятся они на всякую фигню а не на загрузку неподписанного кода по сети или какой-нибудь инжект своего кода в чужое адресное пространство...) но даже убрать еще одно предупреждение браузера о запуске недоверенного кода (т.е. можно запускать приложение с одного клика в браузере), правда получения администраторских прав это не отменяет.

    Но верный способ - не заниматься этой фигней. Не нужно прикрывать отсутствие грамотной организации рабочего места (и наличие администратора) техническими методами, обходя ограничения.

    .net sdk идет в поставке с windows по умолчанию начиная с win7 (в winxp с оговорками, но вас врят ли интересует 2-ая версия), достаточно ваше приложение собрать под нужную версию, идущую с используемой вашими пользователями версией windows и таскать с собой его уже не придется (win7 - .net sdk 3.5, win10 - 4.5, а win11 - 4.6 мало того, в пределах мажорной версии при включенных обновлениях они по любому должны были обновиться до последней версии, т.е. 4.8.1 ).

    p.s. без разрешения майкрософт разработчики не имеют права распространять .net sdk установщики со своим приложением, это ограничение лицензионное.
    Написано
  • Существует ли Шазам для вещей?

    @rPman
    Refguser, настоятельно рекомендую почитать эту документацию, оба этих api позволяют искать изображения по текстовому запросу, но не по изображению

    у обоих компаний есть приложения по поиску на основе изображения, через поиск, но не в api.

    p.s. у bing кажется есть, я не нашел как именно но кажется это возможно

    p.p.s. я недавнол уже на этот вопрос отвечал, tineye умеет искать по изображению но не по похожести (т.е. найдет слегка искаженное или отредактированное изображение но не разные изображения одного и того же)
    Написано
  • Компьютер откатил данные на пару месяцев назад, как вернуть нынешние данные?

    @rPman
    GIBRID64r, две разные windows (в корне каждого диска есть windows и program files каталоги)
    Написано
  • Компьютер откатил данные на пару месяцев назад, как вернуть нынешние данные?

    @rPman
    У тебя установлено две ос на разные диски? Диск с в каждой свой.
    Написано
  • Почему в браузере постоянно вылезает капча?

    @rPman
    Используется прокси или ВПН?
    Написано
  • Консультация по авторскому праву. Как правильно использовать чужие фото на своем сайте?

    @rPman
    сервисы, которые сканируют загруженные на сайт изображения и выдают URL сайтов, где есть эти изображения

    tineye.com (api 50к запросов $1k) - поисковик по изображениям, выдает список сайтов где он был, с 200x годов (сайтов уже нет а ссылка на изображение и оно само хранится), умеет искать сложные ситуации, типа из изображения сделали картинку с текстом.

    Есть еще web archive но он только хранит

    И да, это не про юридическое, с юридической точки зрения это еще одна точка отказа бизнеса.
    Написано
  • Консультация по авторскому праву. Как правильно использовать чужие фото на своем сайте?

    @rPman
    а как определить авторство изображения, если иск прилетает постфактум, когда событие уже произошло, и удаление мало что решит?
    Написано
  • Как решить проблему с загрузкой ubuntu?

    @rPman
    Try kernel bootparameter:
    pci=nommconf

    прописывать в /etc/default/grub в GRUB_CMDLINE_LINUX_DEFAULT (там в виде строки "" опции перечислены через пробел типа
    GRUB_CMDLINE_LINUX_DEFAULT="quiet splash pci=nommconf"

    после этого
    sudo update-grub
    и перезагрузить машину
    Написано
  • Пришло письмо с pay pal, хотя им не пользуюсь. Как реагировать?

    @rPman
    С чего вы взяли что это письмо от paypal? что в адресе ОТ/from? (формально тут тоже есть способы смошенничать)
    Никогда не доверяйте никаким письмам, все перепроверяйте на официальном сайте. Не переходите по ссылкам из писем, как минимум не проверив их на домен (к сожалению многие легальные сервисы в ссылках из своих официальных писем используют домены, отличные от их собственных, для сбора маркетинговой информации наверное), заходите на официальный сайт сервиса введя сайт вручную или из избранных/закладок чтобы гарантировать что это не фишинг.
    Написано