Задать вопрос
  • Выключение компьютера?

    @rPman
    на место подключения кабеля электропитания к блоку питания, в дешевых там стоит разъем, который пошевели, теряет контакт.
    Ответ написан
    1 комментарий
  • Как уменьшить потребляемость озу на Windows 10?

    @rPman
    (на правах шутки)
    * Сделать последовательный даунгрейд до 8 -> 7 версии
    * Установить linux

    Я помню сильно корежил систему, останавливая почти все службы, вручную (можно настроить их в режим disabled), так же можно пройтись по всем задачам в task scheduler и отключить их все (может пару другую оставить), и через пару недель, с каким-нибудь обновлением все вернется назад.

    осторожно, есть службы, которые нужны, к примеру для работы настроек, не очивидные названия, гуглить назначение сложно, понять какая нужна а какая нет не просто... борьба с ветряными мельницами.
    Ответ написан
    Комментировать
  • Где найти обучение нейронки для сравнения лиц?

    @rPman
    плохо искал, гуглить face recognition model make own python
    почти первый же результат полный гайд
    Ответ написан
  • Почему не удается подключиться к виртуалке по SSH?

    @rPman
    с сетью NAT
    зачем создал себе проблем?
    настрой сеть как сетевой мост между своей сетевой картой, тогда для всей твоей локальной сети (если она есть) виртуальная машина будет еще одна, с полным доступом.

    если локальной сети нет, то ее придется создать, например добавив loopback драйвер фиктивной сети на хост системе и настроить уже к нему сетевой мост.
    Ответ написан
    Комментировать
  • Как создать систему, которая позволит мне выгружать видео в поток, воспроизводимый на 70 разных компьютерах и менять при надобности?

    @rPman
    Самое простое - torrent
    vlc умеет их скачивать и проигрывать, даже на лету (есть плагин есть сторонние версии, можно не vlc наконец). Так же никто не мешает загружать торент отдельным приложением.

    Можно использовать плеер без поддержки торент, настройках торент клиента ищи опции, автоматически перемещающие загруженный файл в соответствующую директорию (проигрывание продумай сам как запускать), а так же автоматически запускающие загрузку при появлении файла в нужном каталоге, таким образом даже без использования web-ui api (есть в большинстве торент клиентах) можно настроить инфраструктуру через простое копирование файлов по любому протоколу.

    Достоинство torrent - максимально эффективный способ копирования большого файла на огромное (тысячи и сотни тысяч компьютеров) с учетом проблем провайдеров и т.п.

    p.s. webtorrent, расширение протокола (добавлено в libtorrent), поддерживается нормальными торент клиентами, в т.ч. консольными (те что можно запускать на сервере без GUI, точнее с веб-интерфейсом типа deluge), позволяет не только загружать и просматривать торенты в браузере, само собой поддерживается проигрывание на лету
    Ответ написан
    2 комментария
  • Как нужно собирать датасет для модели бинарной классификации?

    @rPman
    Обязательно нужно собирать посты на ВСЕ тематики, точнее все, которые могут быть поданы на вход твоего алгоритма.

    Если твоя модель не будет большой языковой, чтобы не тратить время зря, вычищай данные, например вычищай пунктуацию, чтобы после точки и запятой к примеру следовал один пробел (или вообще убери), выявляй строки кода и текста (в каком то смысле это ты и так будешь делать чтобы автоматизировать разметку большинства IT тематики, код на большинстве языков программирования формализуется очень хорошо и код для определения строки как код на языке программирования написать не сложно, хотя есть нюансы), скорее всего текст с кодом и так будет it тематикой, а значит сам код не нужно подавать в модель, но вот обрамляющий его текст лучше подать с пометкой - it.

    p.s. модель llama, точнее openassistent 30b, неплохо читает новости и отвечает на вопросы, в т.ч. по категории (очень сложно составить правильный запрос), на десктопном процессоре 60 русскоязычных постов по ~7кб она читает примерно 4 часа. Так как модель прекрасно знакома с кодом, ответить на вопрос она сможет.

    ~/llama.cpp/main -t 4 -m /d/OpenAssistant/oasst-sft-6-llama-30b-22042023-q4_0.bin -n 64 --temp 0 -f prompt.txt
    ### Input:
    
    Классификация
    Как нужно собирать датасет для модели бинарной классификации?
    Я хочу создать модель, которая бы выявляла посты из соцсетей на IT-тематику. Какой подход для этого нужно выбрать -
    1) собрать как можно больше постов из соцсетей, в том числе на IT-тематику,
    2) или собрать только посты на IT-тематику?
    Если нужен первый подход, то в каком соотношении надо брать посты на IT-тематику и остальные?
    
    ### Question:
    
    Тема этого сообщения IT или нет? ответь да или нет.
    
    ### Answer:
    
    Да [end of text]
    58 секунд
    ### Input:
    
    Биолог Зоя Зорина о трактовках сознания, способности к самоузнаванию у дельфинов и экспериментах по выявлению сознания у животных
    Сознание — одно из сложнейших проявлений психики человека, которое трактуют по-разному представители разных наук. До недавнего времени его рассматривали только как «высшую, свойственную лишь человеку форму отражения объективной действительности, способ его отношения к миру и самому себе… Сознание представляет собой единство психических процессов, активно участвующих в осмыслении человеком объективного мира и своего собственного бытия. Оно… неразрывно связано с языком» и «со способностью идеального воспроизведения действительности в мышлении» (БЭС, 1996). Есть и еще более отвлеченное представление о сознании как о явлении, не сводимом только к работе мозга, как о «со-знании», совместном знании нескольких индивидов. Вполне очевидно, что искать этот уровень сознания у животных не приходится, и считалось, что в процессе эволюции психики животные останавливаются на стадии интеллекта, а стадии сознания достигает только человек (Леонтьев, 1952).
    
    ### Question:
    
    Тема этого сообщения IT или нет? ответь да или нет.
    
    ### Answer:
    
    Нет [end of text]
    119 секунд
    Ответ написан
    Комментировать
  • Как перенаправить звонок в виртуальную машину?

    @rPman
    Попробуй установить приложение на реальном железе, завершить регистрацию, а затем перенести в виртуальное окружение через backup/restore (к сожалению доступно только гугловское), при наличии root файлы приложения можно будет тупо скопировать
    Ответ написан
    Комментировать
  • Хруст матрицы на ноутбуке, плохо ли?

    @rPman
    Производители 'специально' дешевое потребительское оборудование делают хлипким из пластика без усиления металлом или предварительно напряженными композитами, это одновременно и экономия на материаллах (очень и очень копеечная, что бы вам не говорили) и запланированное устаревание (вероятность не гарантийной поломки выше).

    У меня была попытка усилить слабый пластиковый корпус планшетного компьютера композитом из стекловолокна (стеклоткань + эбоксидка + опционально стальные спицы по периметру или диагонали), к сожалению в процессе сломал саму матрицу (криворукий я) но идея очень даже здравая. Красивым такое покрытие сделать не просто, зато прочность в разы повышается, без заметного повышения массы.
    Ответ написан
  • Как сделать, чтобы AI меньше фантазировал в своих ответах?

    @rPman
    Известные большие языковые модели не обучались (я не слышал чтобы кто то это делал) с учетом достоверности результата. Т.е. единственное что они умеют делать - это притворяться человеком, писать правильные тексты, как если бы их писал человек. Потому что во время обучения, единственным критерием правильности был текст из обучающего примера. А туда попадает все что угодно. Странно то, что они стали проявлять дополнительные свойства, очень похожие на интеллект...

    А еще для генерации текста алгоритмы обычно используют вероятностную модель (есть разные алгоритмы, ищи параметры типа температура top_k, или еще вот алгоритм - mirostat. Весь смысл в том что если поставить температуру 0 то сеть будет выбирать наилучший следующий токен, а иначе по какому то алгоритму сможет перескакивать на альтернативы

    Чтобы компьютер вместе с текстом тебе выдавал ссылки и вообще какие то корректные данные, необходимо чтобы кто то заранее тебе проиндексировал (классическая база данных) интернет, а вот поиск по этой базе завернул бы через ИИ, чтобы поиск по ней производился не поиском по тексту а по смыслу. Чтобы что то скачать себе на комп и поиграть я такого не видел, на гитхабе есть проекты на основе как chatgpt так и llama, но как я понимаю все это на зачаточном уровне.

    p.s. посмотри perplexity.ai
    а еще посмотри майкрософтовского чат бота (работает только не из россии, только в браузере edge)
    Ответ написан
    2 комментария
  • BIOS журналирует события?

    @rPman
    Серверное железо скорее всего да, но как и где - читать в документации, все делают по разному
    Потребительское оборудование с вероятностью 99.(9)% - нет, либо это спрятали далеко далеко.

    Если тебе нужно контролировать машину - блокируй доступ в биос паролем, на сколько я знаю при включенном secure boot изменение конфигурации не позволит загрузиться. Не самое дешевое (скорее всего gaming серии) потребительские материнские платы позволяют даже свои ключи подписи загрузчика добавить (не уверен, можно ли удалить тот что есть, чтобы нельзя было загружаться в livecd linux и winpe, пописанных глобально)
    Ответ написан
    Комментировать
  • Как правильно перенести систему с HDD на SSD?

    @rPman
    Перенос нужно делать специализированными инструментами и не из под рабочей системы, собственно из-за этого у тебя не завелось

    Скорее всего у тебя получилось следующее - система подключила диск как S и запомнила что этот диск надо монтировать на S, затем ты сделал копию системы с этой информацией и попытался с нее загрузиться, система не нашла диска C и обломилась (это можно починить вручную но объяснять лень, тем более это только предположение).

    Настоятельно рекомендую не искать себе проблем, установить на флешку clonezilla (или любой linux и из него запустить ее как утилиту или вручную создать разделы и склонировать с помощью partclone.xxx). Интерфейс простой и понятный, при этом есть такие возможности, которые не снились и платным утилитам.

    Загружаешься с нее, выбираешь клонирование, исходный диск, целевой, перепроверяешь что не напутал ничего и все.
    Ответ написан
    Комментировать
  • С какой частотой следует обращаться к истории сообщений канала в Pyrogram, чтобы не получить блокировку?

    @rPman
    не надо опрашивать, нужно просто подписаться на обновления и не придется запрашивать историю, кроме как при запуске приложения
    https://docs.pyrogram.org/start/updates
    Ответ написан
    Комментировать
  • Какой pet проект создать, чтобы выделиться?

    @rPman
    На правах шутки - используй то что сейчас на слуху, большие нейронные сети, языковые модели и т.п. Тем более там как раз питон.

    Если же говорить про что могло бы быть максимально эффективным - запили что то из области своего будущего работодателя.
    Ответ написан
    Комментировать
  • Какой силы должен быть магнит?

    @rPman
    Есть неодимивые магниты с усилием отрыва 100кг, они по экспериментам начинают влиять на другие магниты на расстоянии десяток-другой сантиметров.

    Считать через размер магнита, его толщину, на 1 толщине магнита сила X, на двух - в 2^2=4 раза меньше, на 3-ех в 9 раз меньше, при размере в 2см на расстоянии в 4см он будет притягивать с усилием в 20кг

    На самом деле считать надо сложнее, зависит от того, как именно намагничен магнит и какой он формы и как взаимонаправлены (например два прямоугольных магнита направленные противоположными полюсами попарно друг к другу, будут притягиваться почти в два раза сильнее чем если их повернуть одним из их полюсов, так как второй полюс такого магнита работать будет хуже, в 4 раза хуже, а если магниты длиннее то в квадрат разницы их расстояния, т.е. будет работать только половина магнита)

    Я настоятельно рекомендую купить маленький магнит и провести эксперименты в меньшем масштабе. Результаты будут масштабироваться, если считать в размерах магнитов.

    p.s. Я так понимаю тебе нужно не просто удерживать но еще и возекать туда сюда, устроив мытье стекла, вот тут все будет зависеть от силы трения. Без экспериментов теории будет недостаточно
    Ответ написан
    Комментировать
  • Парсер OZON выдает пустой список в таблицу Excel, в чем проблема кода?

    @rPman
    Проверь, что тебе вернул BeautifulSoup, есть ли в его ответе нужные div и a.
    Вполне возможно что наименования классов изменились, или в ответе нет в принципе товаров, например стоит защита от таких парсеров либо код html формируется в браузере скриптом а не на сервере и т.п.

    Настоятельно рекомендую не мучиться, и работать с полноценным браузером (например selenium или инжектить скрипт в обычный браузер плагином типа greasemonkey) а не такими примитивными техниками как BeautifulSoup, тогда тебе будет не важно, как защищается площадка (почти, существуют способы защиты и от этого), в конечном счете ты должен будешь симулировать поведение обычного пользователя на обычном браузере, выдерживать паузы, возекать и кликать мышкой и прочее.
    Ответ написан
    Комментировать
  • Как извлечь текст книги из apk файла?

    @rPman
    Apk файл это zip архив, переименуй и открой

    Посмотри все файлы поиском по тексту, 1-2 слова, осторожнее с пробелами. Это будет легко, если разработчики не собирались мешать это делать, иначе от невозможно до очень сложно.

    Как вариант, ее в файле нет и книга скачивается и складывается в приватную область приложения, до которой можно добраться только с помощью рут доступа, в исключительных случаях можно сделать локальный бакап с помощью adb и уже покопаться в его файлах.

    Ну и универсальная классика, написать простой кликер, с помощью того же adb и наделать скринов
    Ответ написан
    Комментировать
  • Возможно ли разметить жёсткий диск с установленным Linux?

    @rPman
    Виртуализация, фактически любые другие способы это нарушение, точнее то требование в операционной системы astra linux .

    Я правильно понимаю проблему, нельзя менять загрузчик?

    Если уж очень хочется то установи на внешний диск windows. В качестве продолжении истории, на вашем носителе тебе нужен только загрузчик - efi boot раздел, а саму систему склонировать на раздел, отьев его у linux.

    Мало того, если машина uefi, а они все сейчас такие, можно попытаться настроить загрузку без загрузочного разделов, сложив файлы на ntfs системный раздел вин, обычно они это умеют хотя не обязаны.

    Ну в догонку, linux grub умеет запускать вин, точно помню при необходимости можно было даже в рам диск все сложить, если хватит
    Ответ написан
    Комментировать
  • Как реализовать отображение чертежей в winForms?

    @rPman
    Вне зависимости от использования библиотек или фреймворка общая идея ускорения вывода большого количества примитивов или просто сложные объекты, есть разные подходы:
    * кешировать результат, в твоем случае можно в памяти создать битмап и отрисовывать в него, тогда при перемещении окна просмотра в него перерисовывать объекты не понадобится
    недостаток - при большом размере холста (в пикселах) будут повышенные требования к оперативной памяти
    * частично кешировать результат, чем то таким занимаются разработчики/движки игр, когда далекие сцены, внешний вид которых не меняется при локальных перемещениях игрока, заменяются на заранее отрендеренный битмап (текстуру) и рисуют простой спрайт
    В общем это перераспределение нагрузки между процессором и оперативной памятью, либо ты постоянно перерисовываешь все объекты на сцене либо ты это делаешь реже но хранишь все в памяти
    * воспользоваться видеоускорителем, красивого решения именно для c# у тебя не будет, это вообще не подходящий инструмент. Смысл в том что современные видеоускорители, даже если это оффисный, встроенный в процессор, способны отрисовывать миллионы примитивов, но разработка приложения будет похожа на разработку игры, и готовые фрейамворки либо ограничат тебя в возможностях либо из-за того что используешь неподходящий инструмент, ты будешь тратить время на переходы от managed разработки до нативной
    погугли .net using gpu acceleration
    если ты готов к вендорлоку nvidia посмотри на их движок
    Ответ написан
    Комментировать
  • Есть ли в свободном доступе законный аналог ChatGPT?

    @rPman
    Как только в сети появятся адекватные и вылизанные датасеты обучающей выборки, так сразу.

    Оказалось нормальный ИИ это не только про большое количество весов (и это кажется не так актуально, например гугловский palm 540B сравним c llama 65B и хуже chatgpt35 и тем более 4 которые порядка сотни-двух) но и большая обучающая выборка.

    Сейчас кажется большинство крупных компаний, задумавшихся о ИИ в срочном порядке каждый сам себе набирает датасеты (вместо того чтобы всем миром объединиться и сделать 10x круче)
    Ответ написан
    Комментировать
  • Есть ли переводчик нейросеть, которую можно установить к себе на компьютер?

    @rPman
    Не хуже гугло переводчика это шутка да? компания наверное миллиарды в эти алгоритмы вбросила, а ты хочешь повторить это забесплатно?

    Но наверное все же есть решение.
    Благодаря сливу фейсбуковской llama наверное такой переводчик можно дообучить (если openassistent всего за 10 часов на одной машине с 4 видеокартами дообучили ее почти до уровня раннего chatgpt), т.е. на каком то открытом датасете дообучаешь сетку, оформив это в виде какого-нибудь запроса типа
    ### Instruction:
    
    translate input to russian.
    
    ### Input:
    
    текст
    
    ### Output:
    Совет, используй 65G или 30G, меньшие модели - баловство, к тому же их обучающие датасеты менее мультиязычные.

    Достоинство llama в том что благодаря ggreganov эту сетку можно очень шустро использовать (к сожалению не обучать, надеюсь кто-нибудь это допилит) на обычной и дешевой десктопной машине без видеокарты.

    Инструкции как это делать можно почерпнуть из интернета, вот на хабре была подробная статья по файнтюнингу, задача иная но какая разница, когда имеешь дело с общим ИИ ;).

    p.s. результат будет хаотичным! зависящим от того, как совпадет обучающая выборка с твоей задачей. Т.е. оно будет работать но изредка галюцинировать, вот бы научиться эти моменты прогнозировать как то.

    upd. ничего не обучая, вот пример
    The repository provides code for running inference with the SegmentAnything Model (SAM), links for downloading the trained model checkpoints, and example notebooks that show how to use the model.

    для openassistent 30b:
    Репозиторий предоставляет код для запуска инференса с Моделью "Сейчас-что-угодно" (SAM), ссылками на загрузку обученных моделей и примерами нотбуков, которые показывают как использовать модель. [end of text]

    для llama 65b:
    Репозиторий предоставляет код для выполнения вывода с моделью SegmentAnything (SAM), ссылки на загрузку тренированных точек перехода, и примеры тестовых книг, которые показывают, как использовать модель.

    гугл транслейт:
    Репозиторий содержит код для выполнения вывода с помощью модели SegmentAnything (SAM), ссылки для загрузки контрольных точек обученной модели и примеры записных книжек, демонстрирующих, как использовать модель.


    Экспериментально выставил temp 0.1, по уму дефолтно все работает, само собой в ответе будет мусор, что то сетка от себя добавит, это нужно понимать, тюнить стоп слова и т.п.
    Ответ написан
    4 комментария