Ответы пользователя rPman — Хабр Q&A

Задать вопрос

Ответы

Что сделать после обучения нейронной сети?

rPman @rPman

Нейросеть это функция, которая на входной вектор выдает выходной вектор.

Использовать ее нужно буквально как обучал, на вход подаешь данные того же типа, что были во входных векторах обучающей выборки, а на выходе ожидай тот же тип данных, что были как выходные данные в той же выборке.

Внимание, с входными данными в твоем приложении калькуляторе нужно делать то же самое, что ты делал с данными, подаваемыми когда формировал обучающую выборку, например нормализация, с теми же параметрами и тем же алгоритмом что были в использованы в подготовке обучающей выборки (или когда ее данные подсовываются на вход сети). Так как ты как то собирал обучающие данные, этот код и нужно использовать.

Так же нужно подготовить и сконвертировать сохраненную сеть к формату, используемому конечным приложением. Очень часто обучают сетку на питоне а используют к примеру на javascript или c++, вот пример

p.s. после обучения сетки нужно оценить ее параметры, прогнать ее на тестовой выборке (данные, которых не было в обучающей выборке), так же в процессе обучения необходимо собирать различные метрики, оценивать скорость с которой меняются результаты прохождения тестовой выборки, чтобы выявить момент, когда сеть станет переобучаться

Ответ написан более двух лет назад

Комментировать

Комментировать
Выключение компьютера?

rPman @rPman

на место подключения кабеля электропитания к блоку питания, в дешевых там стоит разъем, который пошевели, теряет контакт.

Ответ написан более двух лет назад

1 комментарий

1 комментарий
Как уменьшить потребляемость озу на Windows 10?

rPman @rPman

(на правах шутки)
* Сделать последовательный даунгрейд до 8 -> 7 версии
* Установить linux

Я помню сильно корежил систему, останавливая почти все службы, вручную (можно настроить их в режим disabled), так же можно пройтись по всем задачам в task scheduler и отключить их все (может пару другую оставить), и через пару недель, с каким-нибудь обновлением все вернется назад.

осторожно, есть службы, которые нужны, к примеру для работы настроек, не очивидные названия, гуглить назначение сложно, понять какая нужна а какая нет не просто... борьба с ветряными мельницами.

Ответ написан более двух лет назад

Комментировать

Комментировать
Где найти обучение нейронки для сравнения лиц?

rPman @rPman

плохо искал, гуглить face recognition model make own python
почти первый же результат полный гайд

Ответ написан более двух лет назад

2 комментария

2 комментария
Почему не удается подключиться к виртуалке по SSH?

rPman @rPman

с сетью NAT
зачем создал себе проблем?
настрой сеть как сетевой мост между своей сетевой картой, тогда для всей твоей локальной сети (если она есть) виртуальная машина будет еще одна, с полным доступом.

если локальной сети нет, то ее придется создать, например добавив loopback драйвер фиктивной сети на хост системе и настроить уже к нему сетевой мост.

Ответ написан более двух лет назад

Комментировать

Комментировать
Как создать систему, которая позволит мне выгружать видео в поток, воспроизводимый на 70 разных компьютерах и менять при надобности?

rPman @rPman

Самое простое - torrent
vlc умеет их скачивать и проигрывать, даже на лету (есть плагин есть сторонние версии, можно не vlc наконец). Так же никто не мешает загружать торент отдельным приложением.

Можно использовать плеер без поддержки торент, настройках торент клиента ищи опции, автоматически перемещающие загруженный файл в соответствующую директорию (проигрывание продумай сам как запускать), а так же автоматически запускающие загрузку при появлении файла в нужном каталоге, таким образом даже без использования web-ui api (есть в большинстве торент клиентах) можно настроить инфраструктуру через простое копирование файлов по любому протоколу.

Достоинство torrent - максимально эффективный способ копирования большого файла на огромное (тысячи и сотни тысяч компьютеров) с учетом проблем провайдеров и т.п.

p.s. webtorrent, расширение протокола (добавлено в libtorrent), поддерживается нормальными торент клиентами, в т.ч. консольными (те что можно запускать на сервере без GUI, точнее с веб-интерфейсом типа deluge), позволяет не только загружать и просматривать торенты в браузере, само собой поддерживается проигрывание на лету

Ответ написан более двух лет назад

2 комментария

2 комментария

Как нужно собирать датасет для модели бинарной классификации?

rPman @rPman

Обязательно нужно собирать посты на ВСЕ тематики, точнее все, которые могут быть поданы на вход твоего алгоритма.

Если твоя модель не будет большой языковой, чтобы не тратить время зря, вычищай данные, например вычищай пунктуацию, чтобы после точки и запятой к примеру следовал один пробел (или вообще убери), выявляй строки кода и текста (в каком то смысле это ты и так будешь делать чтобы автоматизировать разметку большинства IT тематики, код на большинстве языков программирования формализуется очень хорошо и код для определения строки как код на языке программирования написать не сложно, хотя есть нюансы), скорее всего текст с кодом и так будет it тематикой, а значит сам код не нужно подавать в модель, но вот обрамляющий его текст лучше подать с пометкой - it.

p.s. модель llama, точнее openassistent 30b, неплохо читает новости и отвечает на вопросы, в т.ч. по категории (очень сложно составить правильный запрос), на десктопном процессоре 60 русскоязычных постов по ~7кб она читает примерно 4 часа. Так как модель прекрасно знакома с кодом, ответить на вопрос она сможет.

~/llama.cpp/main -t 4 -m /d/OpenAssistant/oasst-sft-6-llama-30b-22042023-q4_0.bin -n 64 --temp 0 -f prompt.txt

### Input:

Классификация
Как нужно собирать датасет для модели бинарной классификации?
Я хочу создать модель, которая бы выявляла посты из соцсетей на IT-тематику. Какой подход для этого нужно выбрать -
1) собрать как можно больше постов из соцсетей, в том числе на IT-тематику,
2) или собрать только посты на IT-тематику?
Если нужен первый подход, то в каком соотношении надо брать посты на IT-тематику и остальные?

### Question:

Тема этого сообщения IT или нет? ответь да или нет.

### Answer:

Да [end of text]

58 секунд

### Input:

Биолог Зоя Зорина о трактовках сознания, способности к самоузнаванию у дельфинов и экспериментах по выявлению сознания у животных
Сознание — одно из сложнейших проявлений психики человека, которое трактуют по-разному представители разных наук. До недавнего времени его рассматривали только как «высшую, свойственную лишь человеку форму отражения объективной действительности, способ его отношения к миру и самому себе… Сознание представляет собой единство психических процессов, активно участвующих в осмыслении человеком объективного мира и своего собственного бытия. Оно… неразрывно связано с языком» и «со способностью идеального воспроизведения действительности в мышлении» (БЭС, 1996). Есть и еще более отвлеченное представление о сознании как о явлении, не сводимом только к работе мозга, как о «со-знании», совместном знании нескольких индивидов. Вполне очевидно, что искать этот уровень сознания у животных не приходится, и считалось, что в процессе эволюции психики животные останавливаются на стадии интеллекта, а стадии сознания достигает только человек (Леонтьев, 1952).

### Question:

Тема этого сообщения IT или нет? ответь да или нет.

### Answer:

Нет [end of text]

119 секунд

Ответ написан более двух лет назад

Комментировать

Комментировать

Как перенаправить звонок в виртуальную машину?

rPman @rPman

Попробуй установить приложение на реальном железе, завершить регистрацию, а затем перенести в виртуальное окружение через backup/restore (к сожалению доступно только гугловское), при наличии root файлы приложения можно будет тупо скопировать

Ответ написан более двух лет назад

Комментировать

Комментировать
Хруст матрицы на ноутбуке, плохо ли?

rPman @rPman

Производители 'специально' дешевое потребительское оборудование делают хлипким из пластика без усиления металлом или предварительно напряженными композитами, это одновременно и экономия на материаллах (очень и очень копеечная, что бы вам не говорили) и запланированное устаревание (вероятность не гарантийной поломки выше).

У меня была попытка усилить слабый пластиковый корпус планшетного компьютера композитом из стекловолокна (стеклоткань + эбоксидка + опционально стальные спицы по периметру или диагонали), к сожалению в процессе сломал саму матрицу (криворукий я) но идея очень даже здравая. Красивым такое покрытие сделать не просто, зато прочность в разы повышается, без заметного повышения массы.

Ответ написан более двух лет назад

2 комментария

2 комментария
Как сделать, чтобы AI меньше фантазировал в своих ответах?

rPman @rPman

Известные большие языковые модели не обучались (я не слышал чтобы кто то это делал) с учетом достоверности результата. Т.е. единственное что они умеют делать - это притворяться человеком, писать правильные тексты, как если бы их писал человек. Потому что во время обучения, единственным критерием правильности был текст из обучающего примера. А туда попадает все что угодно. Странно то, что они стали проявлять дополнительные свойства, очень похожие на интеллект...

А еще для генерации текста алгоритмы обычно используют вероятностную модель (есть разные алгоритмы, ищи параметры типа температура top_k, или еще вот алгоритм - mirostat. Весь смысл в том что если поставить температуру 0 то сеть будет выбирать наилучший следующий токен, а иначе по какому то алгоритму сможет перескакивать на альтернативы

Чтобы компьютер вместе с текстом тебе выдавал ссылки и вообще какие то корректные данные, необходимо чтобы кто то заранее тебе проиндексировал (классическая база данных) интернет, а вот поиск по этой базе завернул бы через ИИ, чтобы поиск по ней производился не поиском по тексту а по смыслу. Чтобы что то скачать себе на комп и поиграть я такого не видел, на гитхабе есть проекты на основе как chatgpt так и llama, но как я понимаю все это на зачаточном уровне.

p.s. посмотри perplexity.ai
а еще посмотри майкрософтовского чат бота (работает только не из россии, только в браузере edge)

Ответ написан более двух лет назад

2 комментария

2 комментария
BIOS журналирует события?

rPman @rPman

Серверное железо скорее всего да, но как и где - читать в документации, все делают по разному
Потребительское оборудование с вероятностью 99.(9)% - нет, либо это спрятали далеко далеко.

Если тебе нужно контролировать машину - блокируй доступ в биос паролем, на сколько я знаю при включенном secure boot изменение конфигурации не позволит загрузиться. Не самое дешевое (скорее всего gaming серии) потребительские материнские платы позволяют даже свои ключи подписи загрузчика добавить (не уверен, можно ли удалить тот что есть, чтобы нельзя было загружаться в livecd linux и winpe, пописанных глобально)

Ответ написан более двух лет назад

Комментировать

Комментировать
Как правильно перенести систему с HDD на SSD?

rPman @rPman

Перенос нужно делать специализированными инструментами и не из под рабочей системы, собственно из-за этого у тебя не завелось

Скорее всего у тебя получилось следующее - система подключила диск как S и запомнила что этот диск надо монтировать на S, затем ты сделал копию системы с этой информацией и попытался с нее загрузиться, система не нашла диска C и обломилась (это можно починить вручную но объяснять лень, тем более это только предположение).

Настоятельно рекомендую не искать себе проблем, установить на флешку clonezilla (или любой linux и из него запустить ее как утилиту или вручную создать разделы и склонировать с помощью partclone.xxx). Интерфейс простой и понятный, при этом есть такие возможности, которые не снились и платным утилитам.

Загружаешься с нее, выбираешь клонирование, исходный диск, целевой, перепроверяешь что не напутал ничего и все.

Ответ написан более двух лет назад

Комментировать

Комментировать
С какой частотой следует обращаться к истории сообщений канала в Pyrogram, чтобы не получить блокировку?

rPman @rPman

не надо опрашивать, нужно просто подписаться на обновления и не придется запрашивать историю, кроме как при запуске приложения
https://docs.pyrogram.org/start/updates

Ответ написан более двух лет назад

Комментировать

Комментировать
Какой pet проект создать, чтобы выделиться?

rPman @rPman

На правах шутки - используй то что сейчас на слуху, большие нейронные сети, языковые модели и т.п. Тем более там как раз питон.

Если же говорить про что могло бы быть максимально эффективным - запили что то из области своего будущего работодателя.

Ответ написан более двух лет назад

Комментировать

Комментировать
Какой силы должен быть магнит?

rPman @rPman

Есть неодимивые магниты с усилием отрыва 100кг, они по экспериментам начинают влиять на другие магниты на расстоянии десяток-другой сантиметров.

Считать через размер магнита, его толщину, на 1 толщине магнита сила X, на двух - в 2^2=4 раза меньше, на 3-ех в 9 раз меньше, при размере в 2см на расстоянии в 4см он будет притягивать с усилием в 20кг

На самом деле считать надо сложнее, зависит от того, как именно намагничен магнит и какой он формы и как взаимонаправлены (например два прямоугольных магнита направленные противоположными полюсами попарно друг к другу, будут притягиваться почти в два раза сильнее чем если их повернуть одним из их полюсов, так как второй полюс такого магнита работать будет хуже, в 4 раза хуже, а если магниты длиннее то в квадрат разницы их расстояния, т.е. будет работать только половина магнита)

Я настоятельно рекомендую купить маленький магнит и провести эксперименты в меньшем масштабе. Результаты будут масштабироваться, если считать в размерах магнитов.

p.s. Я так понимаю тебе нужно не просто удерживать но еще и возекать туда сюда, устроив мытье стекла, вот тут все будет зависеть от силы трения. Без экспериментов теории будет недостаточно

Ответ написан более двух лет назад

Комментировать

Комментировать
Парсер OZON выдает пустой список в таблицу Excel, в чем проблема кода?

rPman @rPman

Проверь, что тебе вернул BeautifulSoup, есть ли в его ответе нужные div и a.
Вполне возможно что наименования классов изменились, или в ответе нет в принципе товаров, например стоит защита от таких парсеров либо код html формируется в браузере скриптом а не на сервере и т.п.

Настоятельно рекомендую не мучиться, и работать с полноценным браузером (например selenium или инжектить скрипт в обычный браузер плагином типа greasemonkey) а не такими примитивными техниками как BeautifulSoup, тогда тебе будет не важно, как защищается площадка (почти, существуют способы защиты и от этого), в конечном счете ты должен будешь симулировать поведение обычного пользователя на обычном браузере, выдерживать паузы, возекать и кликать мышкой и прочее.

Ответ написан более двух лет назад

Комментировать

Комментировать
Как извлечь текст книги из apk файла?

rPman @rPman

Apk файл это zip архив, переименуй и открой

Посмотри все файлы поиском по тексту, 1-2 слова, осторожнее с пробелами. Это будет легко, если разработчики не собирались мешать это делать, иначе от невозможно до очень сложно.

Как вариант, ее в файле нет и книга скачивается и складывается в приватную область приложения, до которой можно добраться только с помощью рут доступа, в исключительных случаях можно сделать локальный бакап с помощью adb и уже покопаться в его файлах.

Ну и универсальная классика, написать простой кликер, с помощью того же adb и наделать скринов

Ответ написан более двух лет назад

Комментировать

Комментировать
Возможно ли разметить жёсткий диск с установленным Linux?

rPman @rPman

Виртуализация, фактически любые другие способы это нарушение, точнее то требование в операционной системы astra linux .

Я правильно понимаю проблему, нельзя менять загрузчик?

Если уж очень хочется то установи на внешний диск windows. В качестве продолжении истории, на вашем носителе тебе нужен только загрузчик - efi boot раздел, а саму систему склонировать на раздел, отьев его у linux.

Мало того, если машина uefi, а они все сейчас такие, можно попытаться настроить загрузку без загрузочного разделов, сложив файлы на ntfs системный раздел вин, обычно они это умеют хотя не обязаны.

Ну в догонку, linux grub умеет запускать вин, точно помню при необходимости можно было даже в рам диск все сложить, если хватит

Ответ написан более двух лет назад

Комментировать

Комментировать
Как реализовать отображение чертежей в winForms?

rPman @rPman

Вне зависимости от использования библиотек или фреймворка общая идея ускорения вывода большого количества примитивов или просто сложные объекты, есть разные подходы:
* кешировать результат, в твоем случае можно в памяти создать битмап и отрисовывать в него, тогда при перемещении окна просмотра в него перерисовывать объекты не понадобится
недостаток - при большом размере холста (в пикселах) будут повышенные требования к оперативной памяти
* частично кешировать результат, чем то таким занимаются разработчики/движки игр, когда далекие сцены, внешний вид которых не меняется при локальных перемещениях игрока, заменяются на заранее отрендеренный битмап (текстуру) и рисуют простой спрайт
В общем это перераспределение нагрузки между процессором и оперативной памятью, либо ты постоянно перерисовываешь все объекты на сцене либо ты это делаешь реже но хранишь все в памяти
* воспользоваться видеоускорителем, красивого решения именно для c# у тебя не будет, это вообще не подходящий инструмент. Смысл в том что современные видеоускорители, даже если это оффисный, встроенный в процессор, способны отрисовывать миллионы примитивов, но разработка приложения будет похожа на разработку игры, и готовые фрейамворки либо ограничат тебя в возможностях либо из-за того что используешь неподходящий инструмент, ты будешь тратить время на переходы от managed разработки до нативной
погугли .net using gpu acceleration
если ты готов к вендорлоку nvidia посмотри на их движок

Ответ написан более двух лет назад

Комментировать

Комментировать
Есть ли в свободном доступе законный аналог ChatGPT?

rPman @rPman

Как только в сети появятся адекватные и вылизанные датасеты обучающей выборки, так сразу.

Оказалось нормальный ИИ это не только про большое количество весов (и это кажется не так актуально, например гугловский palm 540B сравним c llama 65B и хуже chatgpt35 и тем более 4 которые порядка сотни-двух) но и большая обучающая выборка.

Сейчас кажется большинство крупных компаний, задумавшихся о ИИ в срочном порядке каждый сам себе набирает датасеты (вместо того чтобы всем миром объединиться и сделать 10x круче)

Ответ написан более двух лет назад

Комментировать

Комментировать

Самые активные сегодня

Константин
- 3 ответа
- 0 вопросов
Ярослав
- 1 ответ
- 1 вопрос
Pavel Designer
- 2 ответа
- 0 вопросов
rinatoptimus
- 0 ответов
- 2 вопроса
Dupych
- 2 ответа
- 0 вопросов
GotYouGently
- 1 ответ
- 1 вопрос