Задать вопрос
  • Почему не открываются программы?

    @rPman
    Если проблема возникает сразу после установки из официального репозитария, то это уже повод бить тревогу (что то с железом? но слишком специфическая ошибка)

    Наибольшая вероятность - вирус, причем написанный с ошибкой (не все вирусы обнаруживаются антивирусами).

    И еще момент, даже если 'ничего левого не качать', вирус/троян может проникать из локальной сети 'провайдера' при использовании слабых паролей на машине (типа admin/12345678) и отключенном фаерволе. Вирус может быть запущен просто с флешки или соседнего диска (на сколько я помню действие по умолчанию все еще запуск приложения, прописанного в autorun.inf)

    ну и самое главное, 'левое' у каждого это разное, нужно понять, после установки какого приложения происходит поломка файлов, и исключить его из установки в следующий раз, выявить это сложно но реально, делать все в виртуальной машине, создавая снапшот перед установкой каждого следующего приложения
    Ответ написан
    Комментировать
  • Как показывать рекламу только для тех кто заходит через Wifi?

    @rPman
    Что такое 'заходит через Wifi'? если я расшарил свое мобильное соединение по wifi, то все кто его используют уже должны смотреть рекламу?

    Без установки специализированного по на устройстве раздачи интернета по wifi, определить этот факт будет очень сложно (но есть хаки, если не использовать https, то можно просканировать локальную сеть на javascipt, открывая что то типа http://192.168.0.1 и попытаться измерить скорость до роутера, в 99% случаев ip адрес которого известен).
    Ответ написан
    Комментировать
  • Где достать словарь с городами и регионами на русском и английском языках?

    @rPman
    Первый же из гугла не подходит?
    Ответ написан
    Комментировать
  • Как реализовать бэкап сайта/бд посредством PHP?

    @rPman
    Суточного бакапа тебе будет достаточно? Если в момент смерти сайта ты сможешь восстановить только 'вчерашнюю' копию, с потерей всех сегодняшних изменений и данных?

    Резервное копирование обычно разделяют на две составляющие (потому что технологии так устроены), это резервное копирование базы данных и резервное копирование файлов. Если копировать файлы базы данных как файлы, можно не восстановить корректно их потом (потому что в момент копирования эти файлы могут использоваться), то же самое относится и к просто файлам, если в момент проведения резервной копии эти файлы начнут изменяться, можно получить кашу из частично измененных файлов.

    Чтобы решить эти проблемы используют снапшоты, на выбор - либо на уровне виртуальной машины (если она используется либо у провайдера), либо разделов (например если используется lvm), либо файловой системы (если используется btrfs/zfs/ntfs, с оговорками).

    Перед резервным копированием делают снапшот файловой системы, замораживая ее состояние, делают копирование, после чего снапшот удаляют/отключают. Самые быстрые снапшоты на основе файловой системы и у виртуальной машины (правда некоторые делают это вместе с оперативной памятью, что медленнее).

    Самый интересный механизм резервного копирования базы данных - это онлайн репликация базы на соседнюю машину. Все изменения будут копироваться в тот же миг как они были совершены на исходной машине (можно настроить master-master репликацию, тогда изменения будут гарантированно синхронизированы), что позволяет использовать копию практически моментально, не теряя данных вообще (это не учитывает сценарий ошибки администратора или разработчика! т.е. обычные резервные копии это не отменяет, но очень хорошо защищает от остальных проблем с оборудованием и связью).

    Для файловых систем существует так же онлайн репликация (кластерные файловые системы), они так же позволяют делать онлайн копию на соседней машине, создавая таким образом оперативную копию, с возможностью ввести ее в строй после сбоя основной практически мгновенно (не советую размещать файлы базы данных тут).

    Ну и конечно есть механизмы онлайн резервирования целой виртуальной машины, когда за резервирование системы в целом отвечает вииртуализация (заранее построенный отказоустойчивый распределенный кластер), возможно создание такой системы, что в момент сбоя даже не перестанет работать приложение, оно прозрачно и оперативно переедет на другую ноду в крастере.
    Ответ написан
    Комментировать
  • Есть ли нейросеть, которая выявляет закономерность?

    @rPman
    Есть открытые сетки, созданные исследователями, для получения информации об изображении (в т.ч. обратное миджорней), выглядит это либо на вход подается изображение, на выход в каком то виде либо список наименований объектов (видел проект где прямо с координатами и даже контурами) либо можно делать запрос к изображению - есть ли на нем такой то объект соответствующий тексту (а там может быть к примеру - 'девушка плачет'). Очень много выкладывает в опенсорс фейсбук.

    Искать например на huggingface

    Так же есть сети, выявляющие очень качественно контур объектов, если все это соединить, можно неплохо разобрать изображение на составляющее, как угодно это все переставлять, а с помощью stable diffusion painting собирать из кусков изображение, дополнив его текстом.

    Вот например
    Ответ написан
    Комментировать
  • Какую базу данных выбрать для поисковой системы?

    @rPman
    Все зависит от планируемых размеров (пределы) базы данных, т.е. количества данных, которые необходимо индексировать. Если нужно считанные десятки тысяч сайтов отслеживать, хватит абсолютно любой sql базы данных, миллионы страниц и fulltext индексы хоть postgres хоть mysql хоть самописные на файлах (пока индексы влезают в оперативную память).

    Проблемы начинаются когда индексы не влезают в оперативную память, когда база данных расползается по кластеру или когда скоростей интернет провайдера уже не хватает для прохода обновления базы поисковой системы и данные в поиске становятся неактуальными. Начиная с какого то (большого) объема данных, простого поиска по ключевым словам уже будет недостаточно. А чего стоят алгоритмы ранжирования (сортировки результата), ведь на любой запрос у тебя будет больше чем десяток страниц результатов. Потом борьба с сеошниками, фейковыми зонами интернета (когда сайты генерируют терабайты мусорных данных, и узнаешь ты про них когда место на диске кончится или процент их содержания в индексе превысит половину), интеллектуальная интерпретация данных (с этого в принципе нужно начинать, когда страница должна восприниматься не как просто текстовый документ, а набор информационных зон, их важность (реклама, навигация или статья), разделение (несколько статей на странице), проблема динамического интернета (благодаря 15-летним инструкциям люди до сих пор делают сайты в виде ленты с постраничной навигацией с конца, когда 10-ая страница уже завтра будет показывать не те статьи что были вчера) и вообще javascript в частности и тьма тьмущая других проблем.

    Конечно, можно шикануть и использовать последние веяния ИИ, когда по информационным блокам на странице, генерируются вектора, определяющие сам смысл содержания, такие, что можно искать по ним, вычисляя расстояние между ними и запросом пользователя, только когда осознаешь стоимость бота, который будет стороить такой индекс по страницам и проблемы монетизации результата, сразу передумаешь.
    Ответ написан
    1 комментарий
  • Нейросеть для получения информации из документа?

    @rPman
    нейросеть распознающую смысл текста
    на текущий момент этим занимаются Large Language Models, из открытых лучшие универсальные это opt и bloomz и они слабее даже llama но как основу их можно брать.

    Языковые модели fine-tuning на примерах (буквально, размечаешь десятки-сотни пар данных: текст - ответ), и затем такую обученную сеть или комбаин (есть peft, который позволяет тюнить не веса модели а веса запроса, я слушал лекцию от яндекса, ребята там говорили что это очень выгодно по ресурсам и удобно, не трогать веса модели).

    Если есть возможность и деньги, использовать chatgpt4, то она позволит простыми вопросами (почти такими же как к человеку, который решал бы твою задачу) решить задачу, еще не всем там доступен прямо ввод pdf документа но как я понял скоро будет доступен всем (кроме России само собой).

    p.s. я пробовал на процессоре крутить llama и основанные на ней модели типа open assistent (не бери llm меньше 30B) для похожей задачи (объем документа ограничен 2к токенов, примерно 1.5к слов, можно многоуровневыми запросами сначала отвечать на вопросы по абзацам, а затем итоговую выжимку собирать и обрабатывать отдельным запросом), с ней работать очень сложно, ответы нужно предварительно чистить от мусора и разрабатывать условия окончания генерации (со стоп токенами там проблема) и работает на процессоре медленно (минуты на запрос) но это самое дешевое решение на текущий момент, доступное оффлайн в принципе, само собой без разрешения facebook пользоваться этим нелегально (как минимум не для исследования)
    Ответ написан
    Комментировать
  • Fine-tuning опенсорсного LLM новому языку?

    @rPman
    Опенсорс llm-ки из более менее нормальных это opt и bloomz, доступны на huggingface. По качеству они хуже llama, которая чуть чуть не дотягивает до chatgpt3.5. (по ссылкам информация как обучать, тюнить и использовать с примерами кода и датасеты)

    Fine-tuning не добавляет знаний llm-кам, а.в лучшем случае позволяет качественно научить ее пользоваться уже имеющимся (читай про reinforcement learning human feedback, это кстати не одна модель а несколько вспомогательных).

    Требования тут к железу относительно просты - объем видеопамяти суммарно должен вмещать всю модель плюс небольшой запас, без квантизации и 16битных float (сама модель часть весов может так хранить). Увеличивая объем видеопамяти можно значительно увеличить скорость обучения (так как это уменьшает объем передаваемых через cpu и pci-e данных), к сожалению я не нашел бенчмарков для конкретных цифр, а платить сотни баксов как то не охото, плюс бесконечно это не масштабируется (точнее скорее всего понадобится править код, т.е. нужны еще и редкие специалисты, которых как пылесосом за последние 10 лет высосали крупные компании и уже выращивают их самостоятельно, как это делает facebook)

    Есть ещё peft, позволяет тюнинг весов запроса, не трогая модель. Оно умеет работать с 8бит квантизацией (а значит 3х-4х кратно ниже требования к ram видеокарт), сам не пробовал.

    Можно дообучить модель новым знаниям, но если смотреть на обычные нейронки, это требует заметно больше усилий чем если бы эти знания изначально добавляли в обучающую выборку. И есть нехорошие последствия из-за "катастрофического забывания", которые можно ослабить, добавляя примеров из исходной выборки, охватывая максимум знаний.

    Но если хочешь этим заниматься готовь тысячи видеокарт, иначе процесс затянется на годы. Стоимость сам прикинь.
    Ответ написан
    Комментировать
  • Как запусить Steam на ubuntu 22.04?

    @rPman
    Не удалось получить https://repo.steampowered.com/steam/dists/stable/I... Не удалось соединиться с repo.steampowered.com:443 (104.17.242.61). - connect (111: В соединении отказано) Невозможно инициализировать соединение с repo.steampowered.com:443 (2606:4700::6811:f23d). - connect (101: Сеть недоступна)
    разберись со своим провайдером или настрой vpn/proxy туда где проблем с соединениями нет
    Ответ написан
  • Как решить капчу?

    @rPman
    Если там только такая капча то она легко решается

    Однократно вручную определи края изображений по периметру белого круга для внешнего и внутреннего и считай, проходя по кругу, количество пар пикселов (внутренний внешний), отличающихся выше порогового или просто сумму разницы цветов (по каждому каналу, полученный вектор считать вектором в евклидовом пространстве), так как они должны быть почти одинаковыми, так как это продолжение линий, и так для всех возможных углов поворотов (можно решать так, сначала сделать шаг поворота не слишком большим, затем выбрать те углы, для которых сумма различий пикселов наименьшая, делишь шаг пополам, считаешь различия в обе стороны на этот шаг, таким образом перебирая все углы поворота)

    По уму тут можно решать уравнение но кодить это сложнее чем решение перебором.
    Ответ написан
    Комментировать
  • Как настроить диагональ монитора для нескольких мониторов?

    @rPman
    Похоже единственный вариант, подобрать разрешения на мониторах таким образом чтобы размер итогового пиксела соответствовал реальности.

    Недостаток - ужасное качество, так как изображение будет растянуто из растра, т.е. не будет соответствия пиксела изображения с пикселом на мониторе (мониторы обычно еще и замыливают результат). При просмотре изображений и видео это не заметно, при просмотре мелкого текста - сильно заметно. Попробуй, вдруг тебе этот недостаток не критичен.

    С точки зрения производительности это наилучший вариант, так как масштабированием чаще всего занимается сам монитор, да и видеокарты делают это максимально эффективно
    Ответ написан
    Комментировать
  • Как в Андроид 13 раздавать интернет с ПК на телефон по usb кабелю?

    @rPman
    По простому я поднимал socks прокси сервер на компьютере и настраивал его в браузере (firefox позволяет через about:config), socks прокси можно поднять на основе ssh сервера и клиента, подключенного к нему с ключом -Dip:порт где ip это локальный ip в локальной сети (если не указывать то будет доступно только localhost) и порт. Локальная сеть это та сеть, которую настроит операционная система при использовании такого подключения (на linux подключение можно отправить в сетевой мост с локальным сетевым устройством)

    как вариант сетевое подключение между телефоном и ПК вообще не нужно, adb позволяет по usb подключению настраивать перенаправление портов
    adb forward tcp:6123 tcp:7123
    #sets up forwarding of computer port 6123 to Android device port 7123
    Ответ написан
    Комментировать
  • Как запустить образ Windows 2000.vdi через Limdo PC Emulator?

    @rPman
    Загрузись в консоль восстановления эту win2k (можно и с компьютера в той же virtualbox) ее многие заранее ставили на диск рядом благо это десятки мегабайт всего, ну или загрузись с установочного диска, и отключи сервисы связанные с драйверами дискового контроллера, который был установлен в этой ос и включи штатный майкрософтовский (в принципе можно попытаться это сделать в safe mode, иначе драйвера автоматом включатся назад).

    К сожалению на память назвать их не смогу, но если загрузиться в ос и включить отображение скрытых устройств, это можно понять просто по названию и описанию.

    99% проблем с переносом windows между железом (а у тебя это virtualbox -> qemu, причем почти наверняка стоят дополнения ОС не совместимые с qemu, их лучше предварительно удалить) - это проблемы именно с дисковым контроллером, так же операционка не любит смену '1 ядерная машина' <-> 'многоядерная', там для этого разные драйвера/ядра использовались, но ошибка кажется будет другой.
    Ответ написан
    Комментировать
  • Как исправить ошибку при подключении БД Access к PHP?

    @rPman
    А если не использовать dsn а указать в настройках подключения путь до файла базы?
    p.s. https://www.php.net/manual/en/odbc.installation.php
    spoiler
    To avoid «[Microsoft][ODBC Driver Manager] Data source name not found and no default driver specified»:

    - Find the ODBC manager in Windows control panel and check the "Drivers" tab. Please note that 64 bit Windows has two different managers for 32 [1] and 64 bit drivers: drivers must match your PHP installation.

    - If the required driver doesn't show up there, you need to install it. The free "Microsoft Access Database Engine 2010 Redistributable" package [2] is one of the possibilities for Access and Excel.

    - When connecting with odbc_connect(), make sure you are using the exact driver name in the DRIVER parameter: 'Microsoft Access Driver (*.mdb)' will not work if your driver is called 'Microsoft Access Driver (*.mdb, *.accdb)'.

    [1] C:\Windows\SysWOW64\odbcad32.exe
    [2] www.microsoft.com/en-us/download/details.aspx?id=13255
    Ответ написан
    Комментировать
  • Лагает система, что делать?

    @rPman
    Путаница в терминологиях, иначе тебя не понять.

    Термин 'лагать' и 'лаги' соотносится к обычно проблемам, вызванным сетевыми ограничениями, это задержки и фризы, не связанные с производительностью. Проверь в момент лага скорость своего интернета (в т.ч. например со смартфона в той же локальной сети что и компьютер).

    'Лаги', вызываемые недостатком оперативной памяти обычно очень характерны, когда начинает интенсивно использоваться жесткий диск (а с ssd такое не сильно заметно) но у тебя 16гб, очень мало сценариев, когда этой памяти не хватает.

    Есть 'лаги', вызванные поддержкой драйверами, например проблемы nvidia на linux выглядят так - мышь начинает двигаться рывками, будто время замедлилось в сотню раз, все остальные приложения вообще не реагируют на кнопки или реагируют медленно, но если перезагрузить драйвер (ctrl+alt+f1..f8 переключив экран с консоли на xserver) иногда эту проблему решает (зависит от типа настройки графики, драйверов, версии ос и миллиона причин).

    Есть 'лаги', вызванные аппаратными проблемами, компьютер замирает на несколько секунд (мышь тоже не реагирует) но потом отмирает, я такое встречал, тогда идентифицировали глюк - проблемами с блоком питания (скорее всего питания не хватало видеокарте но она не перезагружалась, так как это заметно по миганию монитора).
    Ответ написан
  • Как оптимизировать Windows 7 на старом нетбуке?

    @rPman
    Некоторое время назад я ради спортивного интереса ковырял eeepc900 (машинка такого же уровня скорости но с поддержкой видеокарты по лучше), и пытался с помощью gentoo выжать из машины максимум (используя последние версии софта), что для 1гб ОЗУ уже квест.

    Так вот, основная проблема - плохая оптимизация софта, штатный видеоплеер спокойно играл xvid, HD720 видео вполне работало, но вот youtube браузер тратил большую часть процессорного времени на загрузку видео, не на декодирование. Были плагины, запускающие mplayer (думаю можно найти и прикрутить mpv) youtube как бы в отдельном окне, но возня с ними не стоила результата (это работает но неудобно, проще открывать видео по ссылке через yt-dlp или сразу в mpv).

    Так вот, если у тебя в принципе нет вариантов, настоятельно рекомендую найти сервер (или арендовать с почасовой оплатой) максимально близко с точки зрения ping, и использовать машину как тонкий клиент рабочего стола (настоятельно рекомендую x2go, клиент работает в windows), для мультимедиа настроить горячие клавиши и скрипты запуска удаленного видео локально (т.е. настроить монтирование диска по сети, причем в обе стороны, и в качестве плеера по умолчанию настроить свой скрипт запуска плеера уже локально на ноутбуке). В браузере в этом случае настоятельно рекомендуется блокиратор рекламы, так как рекламодатели все еще не поняли что мигающие и анимированные баннеры это не то что люди желают видеть в принципе, а вот для схемы удаленного управления эти анимации будут фатальны.

    Схема с удаленным управлением на сервер с почасовой оплаты на самом деле неплохая. Большую часть времени задачи можно, хоть и в ручном режиме, решать на медленной машине, например просмотр видео, чтение книг, с заметными ограничениями можно редактировать текст или даже презентацию (но более серьезную работу придется переносить на производительную машину), а это значит настроив скрипты включения и выключения удаленной машины на горячие клавиши можно работать почти привычно.
    Ответ написан
    Комментировать
  • Как восстановить Windows 10 с помощью Media Creation Tool без диска восстановления?

    @rPman
    Очень много ситуаций и причин неработоспособности и соответственно методов восстановления.
    Не существует простого метода и коротких инструкций сделать это универсально.

    Без специалиста на месте, который уже решал много различных проблем на windows, решить что либо без готовых инструментов - нереально. Да и специалист скорее всего будет использовать готовый набор инструментов, которые шире чем озвученный media creation tool.

    p.s. Диск восстановления (и вообще механизмы резервного копирования, о которых нужно думать заранее) - это та технология которая максимально приближает методы решения к универсальным.

    p.p.s. Со времен winxp и win7 сложилось мнение (и оно продолжает подкрепляться кучей ситуаций) когда переустановить операционную систему с ручным переносом программ и их настроек быстрее и проще чем пытаться понять что же сломалось здесь и как это починить.

    И да, переносить установленное приложение без установочной программы, реально только если это приложение простое,.. при наличии же установочной программы это универсально выполнимая задача (но требует ручной анализ и соответственно время), максимум будут проблемы со средствами контроля за лицензиями приложений (каждый придумывает свой паравоз и в общем случае перенести лицензию без ее наличия не получится)
    Ответ написан
    Комментировать
  • Что делать с экстремально дисбалансным датасетом?

    @rPman
    А задача в принципе решаема? На обучающих данных какие оценки дает? нет ли признака переобученности для классов 0 и 1? (т.е. для оубчающей выборки там будут большие значения а на тестовой маленькие). Уменьши размерность сети.

    Покажи отчет обучения на сокращенной выборке по классу 2 раза в 3 чтобы объем был сравним с другими классами.

    Еще вариант - определи веса class_weight для несбалансированного класса, чем больше размер тем меньше вес.

    Еще, не понимаю почему твои тесты имеют другое распределение, плюнь на текущее распределение train/test и случайно выбери из train распределения тестовую часть (или задай validation_split и shuffle=True) и заново проведи обучение. Соотношение примеров по каждым классом сделай равным (т.е. если количество примеров 2 в три раза больше чем для 1+0, значит то же самое и в тестовой выборке должно быть)

    p.s. еще гуглится (вернее сказать Бинго-чатится) MetaBalance, автоматически тюнит глобальные параметры и функцию потерь как раз на несбалансированные классы

    p.p.s. от себя добавлю, попробуй построй ансамбль сетей, обучи сетку которая ищет только два класса - это большой класс 2 и а другой класс - все остальные 0+1 (он уже будет не такой несбалансированный), затем отдельно обучи сетку на данных состоящих только из классов 0+1 на их выявление, т.е. вместо одной сети у тебя будет две - первая выделит несбалансированный класс, вторая на основе ее результата - будет уже выявлять подклассы 0-1
    Ответ написан
  • Как убрать Яндекс с пустой страницы Google Chrome?

    @rPman
    Для начала удостоверься что это точно google chrome, что запускается по ссылке.
    Затем запусти новый профиль браузера (или ОС, что тебе проще) чтобы проверить что причина не в одном из десятка расширений, установленных у тебя да и вообще настроек.

    p.s. Я уже давно гугл хромом не пользуюсь (использую chromium) поэтому не уверен, где там настройки что открывать при создании нового таба (гугли customize New Tab), возможно там прописан яндекс.
    Ответ написан
  • Debian и Intel GMA 3600. Нет пути или все же есть варианты?

    @rPman
    Тут пишут что fullhd можно играть с помощью штатного xorg и драйвера ядра uvesafb-dkms
    но как я понял статьи из гугла, будет очень грустно
    Ответ написан
    Комментировать