Refguser, любая г..но, лишь бы было суммарно много видеопамяти, буквально майнинговые материнки с кучей любых (лучше одинакового вендора intel/amd/nvidia а то есть проблемы с дрейверами) видеокарт
У меня 2х16гб nvidia 4060ti, они для игр медленные, а вот для нейронок соотношение стоимость/скорость наилучшие.
vseminelybim, 32гб на адекватные модели мало, нужно 64гб, лучше 128гб, тогда в режиме batching можно получить хороший прирост в 'токены в секунду', т.е. к примеру нужно тебе обработать один файл несколькими запросами (системный промпт+данные+запрос+...), при использование кеша системный промпт+данные закешируются не не будут обрабатываться, а значит время и ресурсы будут тратиться только на анализ запроса и генерацию ответа, а если у тебя много разных запросов над одними и теми же данными, они в режиме батчинга одновременно будут обрабатываться... памяти для этого нужно много.
Точно знаю, можно неплохо грузить модель с диска (особенно озаботились когда deepseek вышел с требованиями в 600гб только на веса), что так же для батчинг режима хорошо.. но все же, ждать пол часа ответа на вопрос (даже если их одновременно было задано 100) это садомаза.
Что то я сомневаюсь, что вы смогли свою задачу решить такими простыми алгоритмами, вы проводили проверку, какой был процент верных ответов?
Я верно понимаю, что у вас огромный объем описаний, которые не формализованы? потому что иначе задача решается серией парсеров на основе регулярых выражений.
Боюсь вам нужна gpt, она буквально может на вход получить ваш текст а на выход к примеру json с нужными полями.
если готовы сами обучать (у вас большой обучающий датасет тысячи - десятки тысяч примеров) то берете какой-нибудь pretrain (хоть того же yandex или facebook llama или гугл gemma или qwen) небольшого размера (думаю хватит 1..8 b их можно дешево до тюнить) и набор утилит peft (погугли, есть готовые статьи с примером в т.ч. на хабре)
если не готовы, берете модель по умнее (скорее всего уже не локально), и составляете качественный помпт, в котором есть максимально качественные примеры (будет работать с десятками или даже единицами)
p.s. я бы вместо отправки мощной модели самого текста, заставил бы ее создать приложение (как я бы его создавал, вся проблема не в нем а серии описаний разных типовых и не очень форматов данных, ведь не все же они отличаются друг от друга, наверняка можно выделить группы похожих) причем такое, что если встречается новый формат, снова топать к ИИ и обновлять приложение, добавляя новый или подправляя уже имеющися
штатно можно отключить интернет только мобильный, при наличии wifi приложения получат его
удалить приложения можно, через adb, даже те что не дают удалить из интерфейса, НО если приложение есть в прошивке, удаление просто откатит версию до версиив прошивке и оно обновляется
можно сделать disable в настройках приложения, но это работает как я понимаю до перезагрузки
в общем штатно защититься от шпионажа не получится
это приложения-шпионы от гугла и сяоми, по простому это не отключить, ведь само назначение смартфона - слежка за народонаселением (это вы думаете что вам звонить и развлекаться)
тут по уму поможет только рут, но можно попробовать пободаться, подсунув к примеру приложения пустышки с теми же id (хотя не уверен что запрет обновляться так же поможет)
советую не анализировать его полностью вручную, так как скорее всего вложений многоуровневых нет, читай файл по строчно как текст и регуляркой проверяй наличие "+7925726844296": { собирай в строку из предыдущих и ее уже json_decode
открытые приложения начинают падать, закрываться, перезапускаться, закрываются проводники
посмотри журналы, пуск - монитор стабильности системы, так же есть старая панель управления в ней есть система - инструменты windows - просмотр журналов событий
по уму wsl2 вам тогда подойдет, правда нужно будет gui настраивать
p.s. не понимаю, почему вы это в виртуалке запускаете, это вопрос экспериментов и обучения? потому что запускать все это на одной машине точно не добавит availability (если я верно понял что речь идет о настройке vmware ha)
в вопросе на скринах вообще всякие mail.ru и прочие, я запутался зачем вам все это
Есть универсальный способ решить большую часть проблем - изменить тип на текстовый (у всей колонки). Так же есть лайфхак, при задании значения ячейки можно добавить перед ним апостраф `123.32 тогда это значение так же будет текстовым с гарантией.
Для не целых чисел еще есть проблема с десятичной точкой, которая в разных локалях разная (точка или запятая)
Если пользователь вводит значение в ячейку, тип которой не установлен, то там окажется все что угодно, и дата (3.99 -> 3 месяц 1999) и строка и число в форматах отображения отличных от желаемого. Если бы это поведение в пределах документа можно было бы изменить, это решило бы огромное количество проблем, но майкрософту это не надо.
p.s. Правильно - не использовать excel как формат хранения машиночитаемых данных, на столько сложный и непредсказуемый (особенно когда до него доходят руки пользователей) еще поискать. Если у вас офис - используйте ms access, это вполне себе нормальная база данных (правда майкрософт и этот продукт забросили, мне иногда кажется что все лучшее что создали или купили майкрософт они специально ломают и выбрасывают) и к экселю там тоже можно навести 'дорожки'
Александр Демин, к сожалению видеоускоритель адекватно не эмулируется, даже virtual box с их экспериментальной (уже 10 лет как, заброшенной) поддержкой direct3d детектируется из браузера.
Есть конечно проброс pci-e внутрь виртуальной машины (поддерживают машины основанные на kvm, например от redhat и некоторые гипервизоры vmware) и там есть проблемы с драйверами, иногда решаемые, а так же серверные windows с серверными видеокартами (10х к цене при сравнимой производительности с десктопными, но их можно разделять между виртуалками)
p.s. есть рекомендация опробовать wsl2 от майкрософта, в частности в них есть возможность установить на linux машину драйвера на видеокарту и она корректно будет использовать хост оборудование, правда, как я понимаю, одновременно не получится использовать в нескольких виртуальных машинах одну и ту же gpu, хотя использование этой же gpu в хост и в вируталке возможно, было бы не плохо, если бы вы протестировали и отпиались, работает ли в нескольких виртуалках одна и та же gpu)
по какому 'алгоритму' разметку производит человек?