Задать вопрос
  • Как повысить точность классификации по табличным документам?

    @rPman
    и ни слова, на основе чего же ведется предсказание то?
    по какому 'алгоритму' разметку производит человек?
    Написано
  • Локальные нейросети для автоматизации. Что лучше использовать?

    @rPman
    обычная оперативка тоже будет работать, просто медленнее раз в 6-10 (а если батчинг смотреть с видеокартами, там и все 300 можно разницу получить)

    для phi нужно 2x16 и будет хватать примерно на 8к контекста, но lmstudio очень красиво оптимизирует и тормозить будет только при переполнении
    Написано
  • Локальные нейросети для автоматизации. Что лучше использовать?

    @rPman
    Refguser, любая г..но, лишь бы было суммарно много видеопамяти, буквально майнинговые материнки с кучей любых (лучше одинакового вендора intel/amd/nvidia а то есть проблемы с дрейверами) видеокарт
    У меня 2х16гб nvidia 4060ti, они для игр медленные, а вот для нейронок соотношение стоимость/скорость наилучшие.

    vseminelybim, 32гб на адекватные модели мало, нужно 64гб, лучше 128гб, тогда в режиме batching можно получить хороший прирост в 'токены в секунду', т.е. к примеру нужно тебе обработать один файл несколькими запросами (системный промпт+данные+запрос+...), при использование кеша системный промпт+данные закешируются не не будут обрабатываться, а значит время и ресурсы будут тратиться только на анализ запроса и генерацию ответа, а если у тебя много разных запросов над одними и теми же данными, они в режиме батчинга одновременно будут обрабатываться... памяти для этого нужно много.

    Точно знаю, можно неплохо грузить модель с диска (особенно озаботились когда deepseek вышел с требованиями в 600гб только на веса), что так же для батчинг режима хорошо.. но все же, ждать пол часа ответа на вопрос (даже если их одновременно было задано 100) это садомаза.
    Написано
  • От чего "плавно" за 5-10 минут мог сломаться процессор?

    @rPman
    Ziptar, суперкомпьютеры, особенно старые, это обычные сервера, с необычным сетевым оборудованием, возможно необычными корпусами и системами охлаждения
    Написано
  • Как извлечь отдельные файлы из архива?

    @rPman
    выведи на экран строку, которую запускаешь и запусти ее вручную в терминале, смотри сообщение об ошибках
    Написано
  • Как создать мультипризнаковую мноклассовую модель классификации текстов?

    @rPman
    Что то я сомневаюсь, что вы смогли свою задачу решить такими простыми алгоритмами, вы проводили проверку, какой был процент верных ответов?

    Я верно понимаю, что у вас огромный объем описаний, которые не формализованы? потому что иначе задача решается серией парсеров на основе регулярых выражений.

    Боюсь вам нужна gpt, она буквально может на вход получить ваш текст а на выход к примеру json с нужными полями.

    если готовы сами обучать (у вас большой обучающий датасет тысячи - десятки тысяч примеров) то берете какой-нибудь pretrain (хоть того же yandex или facebook llama или гугл gemma или qwen) небольшого размера (думаю хватит 1..8 b их можно дешево до тюнить) и набор утилит peft (погугли, есть готовые статьи с примером в т.ч. на хабре)

    если не готовы, берете модель по умнее (скорее всего уже не локально), и составляете качественный помпт, в котором есть максимально качественные примеры (будет работать с десятками или даже единицами)

    p.s. я бы вместо отправки мощной модели самого текста, заставил бы ее создать приложение (как я бы его создавал, вся проблема не в нем а серии описаний разных типовых и не очень форматов данных, ведь не все же они отличаются друг от друга, наверняка можно выделить группы похожих) причем такое, что если встречается новый формат, снова топать к ИИ и обновлять приложение, добавляя новый или подправляя уже имеющися
    Написано
  • Почему после переноса физического ПК в виртуальный (на гипервизор) перестали работать некоторые сайты?

    @rPman
    серверные windows с серверными видеокартами (10х к цене при сравнимой производительности с десктопными, но их можно разделять между виртуалками)
    Написано
  • Как заставить работать Web-сервис с несколькими операциями?

    @rPman
    Где ошибка, что не так?

    #1 {main} thrown in C:\OpenServer\domains\monitor\index.php on line 6
    Написано
  • Какие протоколы лучше использовать для обхода ТСПУ Ростелекома?

    @rPman
    Vamp, на ростелекоме ssh работает, в т.ч. и vpn по верх него, но это tcp, а значит качество и скорость будут считанные мегабиты, и плохие пинги
    Написано
  • Как перевести в вебмани на ру карту?

    @rPman
    а в других валютах p2p разве не работает? есть рубли не доступны, используй баксы... биткоины на худой конец, они там тоже есть
    Написано
  • Как запретить автоскачивание на Андроиде?

    @rPman
    штатно можно отключить интернет только мобильный, при наличии wifi приложения получат его

    удалить приложения можно, через adb, даже те что не дают удалить из интерфейса, НО если приложение есть в прошивке, удаление просто откатит версию до версиив прошивке и оно обновляется

    можно сделать disable в настройках приложения, но это работает как я понимаю до перезагрузки

    в общем штатно защититься от шпионажа не получится
    Написано
  • Как запретить автоскачивание на Андроиде?

    @rPman
    это приложения-шпионы от гугла и сяоми, по простому это не отключить, ведь само назначение смартфона - слежка за народонаселением (это вы думаете что вам звонить и развлекаться)

    тут по уму поможет только рут, но можно попробовать пободаться, подсунув к примеру приложения пустышки с теми же id (хотя не уверен что запрет обновляться так же поможет)
    Написано
  • Как загрузить json?

    @rPman
    но загрузить то дамп как то придется...

    советую не анализировать его полностью вручную, так как скорее всего вложений многоуровневых нет, читай файл по строчно как текст и регуляркой проверяй наличие "+7925726844296": { собирай в строку из предыдущих и ее уже json_decode
    Написано
  • 4G WI-FI CAMERA КИТАЙСКИЙ АОС?

    @rPman
    так она наверное для внутреннего рынка, частоты залочены... ищи совместимую прошивку для глобального рынка
    Написано
  • На что Windows выделяет столько памяти?

    @rPman
    открытые приложения начинают падать, закрываться, перезапускаться, закрываются проводники
    посмотри журналы, пуск - монитор стабильности системы, так же есть старая панель управления в ней есть система - инструменты windows - просмотр журналов событий

    там будет информация о причинах падения
    Написано
  • Меня забанил YouTube?

    @rPman
    попробуй открыть с новым профилем (что бы исключить глюки расширений), в приватном режиме расширения обычно отключают
    Написано
  • Почему после переноса физического ПК в виртуальный (на гипервизор) перестали работать некоторые сайты?

    @rPman
    по уму wsl2 вам тогда подойдет, правда нужно будет gui настраивать

    p.s. не понимаю, почему вы это в виртуалке запускаете, это вопрос экспериментов и обучения? потому что запускать все это на одной машине точно не добавит availability (если я верно понял что речь идет о настройке vmware ha)

    в вопросе на скринах вообще всякие mail.ru и прочие, я запутался зачем вам все это
    Написано
  • Почему Excel превращает число с точкой в какое-то странное число с точкой?

    @rPman
    Есть универсальный способ решить большую часть проблем - изменить тип на текстовый (у всей колонки). Так же есть лайфхак, при задании значения ячейки можно добавить перед ним апостраф `123.32 тогда это значение так же будет текстовым с гарантией.

    Для не целых чисел еще есть проблема с десятичной точкой, которая в разных локалях разная (точка или запятая)

    Если пользователь вводит значение в ячейку, тип которой не установлен, то там окажется все что угодно, и дата (3.99 -> 3 месяц 1999) и строка и число в форматах отображения отличных от желаемого. Если бы это поведение в пределах документа можно было бы изменить, это решило бы огромное количество проблем, но майкрософту это не надо.

    p.s. Правильно - не использовать excel как формат хранения машиночитаемых данных, на столько сложный и непредсказуемый (особенно когда до него доходят руки пользователей) еще поискать. Если у вас офис - используйте ms access, это вполне себе нормальная база данных (правда майкрософт и этот продукт забросили, мне иногда кажется что все лучшее что создали или купили майкрософт они специально ломают и выбрасывают) и к экселю там тоже можно навести 'дорожки'
    Написано
  • Почему после переноса физического ПК в виртуальный (на гипервизор) перестали работать некоторые сайты?

    @rPman
    Александр Демин, к сожалению видеоускоритель адекватно не эмулируется, даже virtual box с их экспериментальной (уже 10 лет как, заброшенной) поддержкой direct3d детектируется из браузера.

    Есть конечно проброс pci-e внутрь виртуальной машины (поддерживают машины основанные на kvm, например от redhat и некоторые гипервизоры vmware) и там есть проблемы с драйверами, иногда решаемые, а так же серверные windows с серверными видеокартами (10х к цене при сравнимой производительности с десктопными, но их можно разделять между виртуалками)

    p.s. есть рекомендация опробовать wsl2 от майкрософта, в частности в них есть возможность установить на linux машину драйвера на видеокарту и она корректно будет использовать хост оборудование, правда, как я понимаю, одновременно не получится использовать в нескольких виртуальных машинах одну и ту же gpu, хотя использование этой же gpu в хост и в вируталке возможно, было бы не плохо, если бы вы протестировали и отпиались, работает ли в нескольких виртуалках одна и та же gpu)
    Написано
  • Почему Excel превращает число с точкой в какое-то странное число с точкой?

    @rPman
    OwDafuq, точно в нужной ячейке указанный формат? а что в xml там какой тип? string или currency?
    Написано