Задать вопрос
  • Как улучшить качество микрофона?

    @rPman
    Гугл сделали очень много ограничений, чтобы приложения на android не имели доступа к радиомодулю, даже для простой записи телефонного разговора нужен root доступ и использование особенностей конкретного производителя (т.е. не для каждого это еще и сработает), а уж модификация звука в канале как я понимаю и подавно напрямую не разрешена.

    В теории можно что то придумать при использовании bluetooth гарнитуры, при наличии root, можно пользоваться pulseaudio (первая же гугл статья для просто linux) но очевидно будет не просто
    Ответ написан
  • Как обработать ssh-вывод построчно с помощью Python?

    @rPman
    Не очень эффективный путь но простой - запускаешь ssh xxx@yyy cat /path/log/file > temp_file ждешь окончания и читаешь полученный файл temp_file. тут cat это программа на сервере, выводит в stdout содержимое файла, но можно прямо на сервере часть обработки запускать используя grep/sed/awk/..

    сложнее, берешь какой-нибудь модуль для работы с ssh или scp для python, я не пробовал но гуглится много, например, и работаешь с выводом ssh напрямую.

    Так же можно попробовать вызывая subprocess подключаться к потокам и обрабатывать вывод, не сохраняя (я так делал на php, есть подводные камни на windows машинах, если не wsl), вроде гуглится что не всегда все работает как хочется, но если просто подключиться и об
    Ответ написан
    Комментировать
  • Почему в некоторых мониторах 144 Гц?

    @rPman
    https://hi-news.ru/computers/pochemu-igrovye-monit...
    144 — это 24 умноженное на 6. Все текущие герцовки дисплеев делятся на 24: 120 Гц, 144 Гц, 240 Гц, 360 Гц.
    Ответ написан
    7 комментариев
  • Существует ли модель, обратная Stable Diffusion?

    @rPman
    https://github.com/mlfoundations/open_clip
    https://huggingface.co/laion/CLIP-ViT-H-14-laion2B...

    лучше гуглить сразу CLIP image classification, тьма моделей начиная с openai, разбираться долго

    p.s. еще про анализ объектов на изображении лучше начни копать от сюда или лучше segment-anything фейсбук много чего выкладывает
    Ответ написан
    Комментировать
  • Как при помощи yt-dlp скачать видео в оригинальном разрешении, ориентируясь на дату-время видео?

    @rPman
    yt-dlp -f xxx https://yyy --get-url
    полученную ссылку читаешь только заголовки
    curl -L -I http://zzzz | grep Last-Modified:
    там будет несколько редиректов, дата последнего скорее всего искомая
    % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                     Dload  Upload   Total   Spent    Left  Speed
      0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0
      0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0
      0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0
      0 3545k    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0
    Last-Modified: Wed, 02 May 2007 10:26:10 GMT
    Last-Modified: Wed, 02 May 2007 10:26:10 GMT
    Last-Modified: Wed, 02 May 2007 10:26:10 GMT
    Last-Modified: Fri, 03 Feb 2023 04:08:16 GMT

    как минимум для разных форматов она разная
    Ответ написан
    2 комментария
  • Что делать при зависании установки вин 10?

    @rPman
    Отключи интернет

    Попробуй перед апгрейдом сначала установить все обновления
    Так же неплохим вариантом может быть промежуточный апгрейд до 8, в которую для скорости интегрируй обновления с помощью ntlite
    Ответ написан
  • Какую нейросети актуальны в 2023 году для работы с русским языком?

    @rPman
    c открытой лицензией

    могла отвечать на вопросы

    из самых крупных открытых мультимодальных языковых моделей (именно они проявили способности близкие к интеллекту), что мне известна, это bloom, размер в 13b даже можно на потребительском железе запустить (следующий размер 170B и для его запуска придется городить кластер с десятками секунд на токен) и ее качество в разы (десятки процентов) ниже llama, а у llama хуже chatgpt35 (да на считанные проценты), и тут такое дело что каждый следующий процент - это почти вселенная. Этой моделью я не игрался, но как я понял она лучшая из открытых мультимодальных (бери с префиксом -mt, они мультиязычные).

    Еще есть facebook/opt

    Оцени модели на самом сложном бенчмарке MMLU, opt66b - 35, bloom175b - 39, llama65b - 68, gpt35 - 70, gpt4 - 86

    Настоятельно рекомендую освоить prompt/p-tuning, lora finetuning и т.п. (например peft) под свою задачу, именно таким образом у модели повышают качество работы на десяток другой процентов (сам я еще не дошел до практического применения, только изучаю). На худой конец используй OneShot/MultiShot (когда к запросу спереди добавляется один или несколько примеров вопрос-ответ, что сильно улучшает ответ но увеличивает нагрузку так как запрос увеличивается кратно).
    spoiler
    Само собой llama - лучшее из доступных решений, но не легальное. Бери минимум 30B лучше 65b, можешь взять оттененную версию от OpenAssistent, 8bit или 4bit quantization вполне себе здраво работает на процессоре с помощью llama.cpp, причем на столько что юзабилити его выше чем штатный питоновский код от huggingface, который мало того что заточен под серверные видеокарты, так еще и не оптимизирован (чего стоит чтение файла с моделью в кеш ОС вместо постоянной загрузки копированием, утилита запускается моментально и не нужно городить сервер с api как это надо в случае с питоном). 6-ядерный i5 12600 пережевывает например 1784b русский текст, а точнее 1981b запрос определить категорию - 239 сек (616.46 ms per token) + ответ в 31токен 32 сек (1055.86 ms per run), требуя для работы 47gb ram

    Что лучше openassistent или оригинальная llama сказать сложно, ассистент затюнен на вопрос ответ, т.е. как инструмент общения он предпочтителен, а у llama больше мусора в ответе, но у меня есть ощущение что finetuning ломает модель, я почти уверен что если ее прогнать по тестам, по которым прогоняли llama, значения будут хуже.
    Ответ написан
    4 комментария
  • Как отображать mp4 видео без ос?

    @rPman
    На текущий момент без операционной системы красиво (в смысле более менее есть поддержка железа) не получится, максимум простоты - пищать pc-speaker, на основе которого с ужасным качеством можно симулировать звуки (баловались еще этим во времена dos и помню был драйвер даже для win95/winnt4).

    Если проблема может быть решена дешевым аппаратным решением, напримерпри наличии LPT на материнке (их часто размещают на плате но не выводят на заднюю стенку) то можно из LPT и 16 резисторов сделать простейшую звуковую карту covox, ну а настроить частоту и выдавать нужный поток в lpt уже не сложно (само собой декодировать аудиоформаты самому, но код в опенсорсе есть по до все, наверное даже под чайники)

    EFI не имеет стека звуковых карт в стандарте, т.е. пилить все самому, можно доползти до звуковой карты, запилив поддержку конкретно твоего чипа (код брать из linux ядра само собой)

    Если я верно понял, какие то очень трудолюбивые ребята ковыряют мак и пилят открытый загрузчик, где в т.ч. есть поддержка звука. Так вот гуглится старый проект (который переехал в этот opencorepkg) который в отдельности умеет работать с intel hd, т.е. взяв его за основу, если твое железо совместимо, и делай.
    ----------------------------------------------
    Ну и правильный подход - нет нужды заниматься такими извращениями, когда есть linux, а точнее ядро а не сама ОС на его основе. К примеру файлы initramfs, которые лежат в /boot каталоге загрузчика, это полноценная операционная система, загружаемая ядром сразу после запуска, так вот там можно уже работать со звуком, причем чуть ли не штатно вкомпилировать туда необходимые компоненты, консольный плеер и что угодно, получив рабочее решение за считанные мегабайты.
    Ответ написан
    Комментировать
  • Можно ли строить шумбокс из дерева, и насколько это безопасно?

    @rPman
    Дерево плохой шумоизолятор, нужны плотные плоды дерева или многослойные ДСП. Тонкая фанерка низкочастотные шумы кулеров никак не заглушит.

    Охлаждение прямотоком не получится, я читал что надо пробовать строить сложный лабиринт в воздушном канале, как я понял результат нулевой. Это значит нужен посредник, например металлический радиатор снаружи или даже весь корпус металлический толстые стенки, при необходимости закрепить радиаторы как внутри так и снаружи и пустить дополнительные циркуляции чтобы проходили внутри по стенкам . Больше пары киловатт так не отвести, точнее зависит от размера.

    Хорошо решением бесшумной сборки может стать жидкостное охлаждение, начиная с блока питания. Жёсткие диски в теории можно в отдельный бокс засунуть, их проще охлаждать
    Ответ написан
    Комментировать
  • Xen. Как задать права доступа пользователей к виртуальным машинам в ubuntu для xen?

    @rPman
    через sudo, либо пропиши все используемые пользователями команды либо заверни все в скрипт и его разреши запускать только определенным пользователячм
    Ответ написан
  • Нейросеть для юристов существует?

    @rPman
    В мире не так много мультимодальных языковых моделей, проявляющих новые свойства, похожих на интеллект.

    Самая мощная только одна - chatgpt4 и даже с ней нужно правильно составлять запросы чтобы она работала более менее верно. И даже она будет галлюцинировать, такова природа языковой модели и с этим можно бороться, создавая ансамбль контекстов (каждый контекст - новый чат с ИИ, можно начать с разными запросами, скармливая одну и ту же информацию разными способами) и сравнивая итоговые их ответы, если они одинаковые - значит вероятность верного ответа выше.

    Бессмысленно спрашивать нейросеть напрямую, как минимум нужно формировать OneShot запрос, в котором в начале приводится пример ситуации, которую ты у модели запрашиваешь с ответами, плюс нужно выдать ей в контекст обновленную информацию по делу, по текущим изменениям законодательства и кучи других моментов... и контекст не резиновый. На текущий момент он 8 тысяч токенов, это очень мало (у llama, лучшей нейросети из доступных локально, и ее использование без разрешения meta нелегально, контекст в 2к токенов и ее уровень сравним с прошлой версии chatgpt35).

    В интерфейсе chatgpt этой функции нет, но если вызывать модели из api то контекст там создается простым помещением всего диалога начиная с самого начала в тело запроса, это значит можно 'откатывать контекст' на любой момент, в результате вместо попытки подсунуть сети сразу всю информацию, сеть можно спрашивать, что ей не хватает, получать ответ, откатывать контекст на момент до этого вопроса и добавлять нужну информацию, повторяя до тех пор пока сеть не даст добро.
    Ответ написан
    Комментировать
  • Как последовательно передавать данные из вектора для обучения нейронной сети?

    @rPman
    Гигабайты в виде одномерного массива в памяти?
    Если оно в памяти то какие проблемы, пишешь что то типа mas[pos:pos+size] и получаешь подмассив
    это сработает и с numpy массивами

    если в файле, то вычисляешь позицию нужного элемента, делаешь туда file.seek и читаешь (чтобы легко было вычислять позицию, пиши фиксированными блоками на строку, дополняя пробелами ну или бинарными форматами)
    Ответ написан
  • Не работает локализация setlocale в PHP?

    @rPman
    функция date умеет только англоязычные названия (формат 'F'). Для русских подменяй сам, заведи константу массив (нулевой элемент пустой, так как нумерация месяцев с нуля) типа $month_names=['','Январь','Февраль',... и для вывода пользуйся $month_names[$mon]

    Формат в date для месяца бери 'n', он выдаст номер без дополнительного символа 0 в начале (если оставишь 'm' то в массиве имен не будут найдены значения по ключу '01'...)

    p.s. есть strftime, оно умеет разные языки, но русский не умеет (хотя в системе все прописано и настроено)
    Ответ написан
    2 комментария
  • Как преобразовать массив чисел который возвращается функцией model.predict в нормальный вид?

    @rPman
    дико интересно, что это за задача в которой размерность на выходе сети - 26 (когда как рукописные буквы это весь русский алфавит - 33 и цифры - 10, сверху еще знаки препинания неплохо бы докинуть)

    В подавляющем большинстве случаев распознавание строится по принципу - каждый элемент выходного вектора = искомый объект (т.е. в данной задаче символ) а значение - вероятность (значение от 0 до 1, где 1 - это 100%, сумма всех вероятностей не 1) того что соответствующий объект был подан на вход.

    В данном случае судя по всему это символ в позиции 14 с вероятностью 9.9334598e-01 (она тут максимальная)

    Ответ на твой вопрос - смотри как формировалась обучающая выборка, как выходы определялись.
    Ответ написан
  • Переходы на сайт с диапазонов Гугла с одним и тем же браузером Mozilla/5.0 (Linux; Android 10; K), спам или нет?

    @rPman
    Гугловские ip адреса - это, например гугловский режим сжатия трафика в браузерах android и гугл хром на десктопе, попробуй сам включи ее и зайди на сайт, что увидит твой сайт

    Рефером стоит всегда сам Google.
    google.com или google.com?....? это ключевой вопрос, с поисковой системы к тебе приходят или как? Просто так с сайта google.com легальные пользователи зайти не смогли бы, там нет ссылки на твой сайт.

    Сам факт того что кто то заходит на одну страницу и больше ничего не делает это плохо. Режим прокси не убирает реферер. Если у тебя кто то кликает (ссылка клика с уникальным id надеюсь) сидя с гугловского диапазона следующую страницу открывает (ты же говорил что у тебя такие вообще по сайту не ходили, а появилась 'капча' сразу пошли) уже не нормальное поведение.

    Проведи эксперимент с гугловским браузером в режиме сжатия трафика... если это его поведение то можешь убрать беспокойство, иначе это левые заходы. Вопрос только зачем кому то ходить на твой сайт кроме как накрутки посещений (подумай, кому это выгодно)
    Ответ написан
    1 комментарий
  • Pyrogram поддерживает HTTP-прокси?

    @rPman
    тебе ясно сказали нужна либо socks прокси либо http с поддержкой connect tunnel
    наверное твоя прокси это не поддерживает

    p.s. socks прокси автоматом поднимается если подключаешься по ssh к удаленному серверу, добавив ключ -D1080, будет поднять локальный socks proxy localhost:1080 на удаленный сервер
    Ответ написан
    Комментировать
  • Какой вариант организации домашней виртуализации выбрать?

    @rPman
    Зачем? очень важный вопрос, зачем платить ресурсами (память, процессор, накладные расходы дает даже паравиртуализация lxc) да еще и устраивать многоуровневые системы для хранения данных?

    Все активно забывают, что доступ к файлам по сети в домашних конфигурациях (это 1гбит) - медленно, больше сотни мегабайт в секунду не получится, плюс заметный оверхед на протоколы (самба дает заметный, особенно это видно когда с мелкими файлами работаешь), плюс нагрузка на процессор NAS (например iscsi выше нагружает чем простой nbd).

    Вторая неприятность, большие системы виртуализации типа xen могут вообще не давать удобного (т.е. штатного интерфейса) механизмы работы с локальными образами или с образами nbd (т.е. работать можно но только как ручные настройки, т.е. возвращает в ковыряние в конфигах вместо того чтобы в интерфейсе выбрать что либо).

    Как это ни странно, самая удобная система виртуализации для домашнего пользователя (нет кластера и его фишек) - это VirtualBox

    Так же штатный libvirt имеет свой интерфейс и он так же рекомендуется как основной инструмент виртуализации (к нему доустанавливаются поддержка lxc а так же сетевых накопителей и становится совсем неплохо), так же для домашнего использования без кластера и его фишек
    Ответ написан
    Комментировать
  • У меня 2 жёстких диска, на них установлено по виндовсу, как удалить одну из них оставив важные файлы на этом диске?

    @rPman
    Для начала работай с файлами не в проводнике а в нормальных файловых менеджерах, типа Far Commander или Total Commander, позволяющих работать со скрытыми и системныви каталогами, корректно обрабатывающих символические ссылки и просто удобнее чем проводник.

    * пользовательские файлы в:
    \Users\ - все тут можно удалять кроме твоих файлов, их нужно переместить в другой каталог на этом же диске (операция быстрая не требующая копирования), один из подкаталогов - имя твоего пользователя (или несколько, если специально их создавали), например MyUser
    \Users\All Users, Default, Default User, Public, Все пользователи, desktop.ini - смело удалять
    \Users\MyUser\Desktop, Documents, Downloads, Music, OneDrive, Pictures, Saved Games, Videos - обычно тут хранятся пользовательские файлы
    Остальные каталоги можно удалить но в зависимости от установленных приложений лучше перепроверить, к примеру в \Users\MyUser\.ssh могут храниться сертификаты ssh и настройки беспарольной авторизации
    \Users\MyUser\AppData и LocalData - тут хранятся настройки (и даже сами приложения, устанавливаемые без требования администраторского доступа), обычно их можно смело удалить но держать в голове это нужно, бывает нужные файлы там
    * без вопросов удалить:
    \windows
    \program files и \program files x86 - в этих двух каталогах находятся файлы устанавливаемых приложений, во времена winxp (а такие приложения еще встречаются но их сразу заметно они для работы требуют администраторский доступ) настройки и даже пользовательские файлы могли храниться тут
    \ProgramData - очень очень редко программы сюда складывают пользовательские данные (например файлы лицензий, тот же SketchUp к примеру, т.е. не напрямую файлы а как производная от работы приложения)
    \PerfLog
    \Boot
    \Recovery - осторожно, windows может при отсутствии места на диске C создавать такие каталоги на других дисках, т.е. ты можешь удалить файлы восстановления текущей системы
    \$WinREAgent
    \$Recycle.Bin - корзина, в этом каталоге хранится как удаленные в проводнике файлы в старой системе так и в новой, но в интерфейсе будут видны только новые файлы, а старые нет, имеет смысл удалить, предварительно убедившись что в новой корзине нет нужных файлов
    \System Volume Information - то же самое что и корзина, тут могут храниться точки восстановления как новой так и старой системы, но удалить так просто не получится, нужно сначала в интерфейсе отключить поддержку точек восстановления на диске, а затем удалить (после этого включить обратно)
    Ответ написан
    1 комментарий
  • Почему скрипт не понимает, что данные в MySql изменились?

    @rPman
    код, который обновляет данные случайно не начал транзакцию и не завершил ее?
    Ответ написан
  • Что сделать после обучения нейронной сети?

    @rPman
    Нейросеть это функция, которая на входной вектор выдает выходной вектор.

    Использовать ее нужно буквально как обучал, на вход подаешь данные того же типа, что были во входных векторах обучающей выборки, а на выходе ожидай тот же тип данных, что были как выходные данные в той же выборке.

    Внимание, с входными данными в твоем приложении калькуляторе нужно делать то же самое, что ты делал с данными, подаваемыми когда формировал обучающую выборку, например нормализация, с теми же параметрами и тем же алгоритмом что были в использованы в подготовке обучающей выборки (или когда ее данные подсовываются на вход сети). Так как ты как то собирал обучающие данные, этот код и нужно использовать.

    Так же нужно подготовить и сконвертировать сохраненную сеть к формату, используемому конечным приложением. Очень часто обучают сетку на питоне а используют к примеру на javascript или c++, вот пример

    p.s. после обучения сетки нужно оценить ее параметры, прогнать ее на тестовой выборке (данные, которых не было в обучающей выборке), так же в процессе обучения необходимо собирать различные метрики, оценивать скорость с которой меняются результаты прохождения тестовой выборки, чтобы выявить момент, когда сеть станет переобучаться
    Ответ написан
    Комментировать