Ответы пользователя rPman — Хабр Q&A

Задать вопрос

Ответы

Мессенджер, не требующий для входа номера телефона/e-mail, и не заблокированный в РФ?

rPman @rPman

talky.io
месседженер создан как пример webrtc аудио и видео чата в браузере, без регистрации (твоя комната - это ссылка)

По поводу абстрактной 'безопасности', таких не существует, тот кто хостит чат, имеет доступ к сообщениям и информации о пользователе, но если что то opensource, поднятое на собственных серверах, то может быть

Ответ написан более года назад

Комментировать

Комментировать
Какой существует софт для копирования одного диска на другой?

rPman @rPman

У qnap/snapshots есть свои же механизмы резервного копирования, зачем колхозить сверху что то ещё?:

Ответ написан более года назад

13 комментариев

13 комментариев
Как создать интранет без Linux?
rPman @rPman
Для работы локальной сети intranet требуется:

Физически подключить машина друг к другу.
Например с помощью сетевых карт и специального сетевого роутера или по проще - коммутатора, который зовут свитч (так как сейчас для подключения используется топология звезда, т.е. требуется устройство в центре, к которому все подключаються, есть протоколы, которые позволяют от этого уйти но они либо устарели и неудобны/не безопасны, либо медленные, например сети на основе коаксиального провода 10мбит или wifi ad hoc...).
Сетевой роутер это по факту коммутатор плюс linux/unix машина с необходимым софтом и gui к нему.
Для малого количества машин можно использовать по две сетевые карты на машину (точнее 2*n-2 где n - количество машин), соединяя каждую следующую машину с двумя соседними, например для трёх машин: [eth1] - [eth2+eth3] - [eth4], а две сетевые карты на одной машине можно сделать коммутатором программно, создав сетевой мост/bridge, в пару кликов мыши в win)

Настройка имён и ip адресов, либо специальной программами dns (для имен) и dhcp (для адресов) как часть роутера, либо вручную (это называют статические адреса в настройках сетевого адаптера, а имена прописывать в текстовом файле \windows\system 32\drivers\etc\hosts на каждой машине). Для децентрализованной раздачи имён в win сетях раньше был сервис wins, но начиная с 10 версии windows Майкрософт много что сломала, что бы покупали их сервер.
Ip адреса должны быть в одной подсети, например 192.168.0.xxx/24 (24 это префикс, количество бит единиц слева, в старой нотации это 255.255.255.0 которые показывают что в адресе номер сети а нули, номер машины в ней)

Сети конечно бывают сложнее, но для трёх машин иногда можно не усложнять.

Ответ написан более года назад

Комментировать
Комментировать
Какие существуют средства автодокументации кода Python для недокументированного кода?
rPman @rPman
Топовые ИИ могут это сделать (openai o1/gpt4o, anthropic claude opus/sonet, google gemini pro, qwen 2.5 72b, llama3.2 70b,.. изучи lmsys арену lmarena.ai там можно выбрать домен задачи), у тебя не очень большой объем кода.

Главная ошибка - пытаться одним промптом решить задачу (хотя o1 может быть близок к этому). Поиграй с промптами, твоя задача собрать описание работы твоего кода, опиши все что знаешь сам, напиши запрос, которым можно собрать информацию по функционалу, информацию по структуре кода,.. если есть время, попробуй разобрать код на структурные элементы, хотя бы 3 уровня (например модули - классы - методы) и задавать ИИ один и тот же вопрос, собрав в контексте весь код, структурное описание и в конце задавай вопрос о назначении конкретного элемента, и так повторить для каждого. Собирай ответы в один большой запрос, который уже в последствии можно передать o1 на итоговый анализ (можно и без нее, внутри o1 по уму делает именно это, но так как openai на столько закрытая что готова жестоко наказывать любого, кто попытается узнать этот алгоритм).

Я помню мне хватило одной модели claude sonet и с десяток запросов, чтобы проанализировать исходный код чужого проекта и понять, на сколько ограничен или нет его функционал, при этом я спрашивал у модели итеративно, какой файл исходников ему нужен, в твоем случае все влезет за раз.

Помни что чем больше размер контекстного окна, тем сильнее llm теряет информацию в нем (случайно), но повторение этой информации наоборот увеличивает ее значимость для нее, т.е. исходный код + описание этого кода облегчает для модели анализ. Есть и недостатки, даже топовые модели - переобучены (это болезнь всех нейронок), и какое-нибудь неосторожное ключеове слово или название может заставить модель думать не так как надо а как было написано в обучающих данных, тупой пример - если я хочу написать проект, работающий с api openai, и модель научена на ней, то мне было невероятно сложно заставить модель не генерировать сложный метод формирования api запроса, вместо вызова одной строчки (как я требовал в промпте) curl, прописанной в конфиге... но как только я убрал везде упоминание openai и подробно описал требования, так все прошло на ура. Поэтому, экспериментируй, изучай, перепроверяй все что тебе сгенерирует ИИ. Современный ИИ это не замена, а очень мощный инструмент помощник, который возьмет на себя скучную рутину.

p.s. рекомендую лайфхак
когда тебе нужен короткий ответ на твой вопрос, следуй следующему сценарию (особенно если используешь слабые модели, но работает для нетиповых задач и у топовых), в виде чат-сессии:

{твой вопрос} {добавь текст: 'глубоко вдохни и подумай шаг за шагом'/'take a deep breath and think step by step'} [получи ответ, читать его не обязательно но оставь его в контекстном окне] {задай вопрос: 'а если подумать еще раз'/'but if you think about it again'} [получи еще один ответ, читать его так же не обязательно но оставь его в контекстном окне] {задай окончательный вопрос: 'Итак, какой будет твой ответ?'/'So, what will be your answer?', тут можно определить, в каком виде нужен ответ} [получи окончательный ответ]

По поводу 'take a deep breath' была исследовательская работа, которая показала что эта просьба повышает качество моделей очень значительно, а мои исследования показали что просьба 'подумать еще раз' позволяет модели сомневаться в предыдущем тексте и искать альтернативные варианты, обычно это исправляет ошибки, если это в принципе возможно.

Еще странный совет - попробуй решить задачу на разных языках, не только на английском, сравни ответ, тебя может это удивить.

Ответ написан более года назад

7 комментариев
7 комментариев
Можно ли писать на хабре об opensource проекте над которым работаю?

rPman @rPman

Теплый ламповый дух хабра подразумевает что статьи пишут полезными и интересными для читателей.

Ты разрабатываешь какой то проект? он решает какую то проблему? до тебя ее решали по другому? ты придумал что то интереснее? - вот об этом и напиши. Зачем для этого создавать какую то сущность в соцсети, если достаточно интересующимся просто подписаться на тебя.

А если ты написал проект, решающий уже решенную до тебя задачу, причем большим количеством, тривиальным методом, и главное об этом никому не интересно читать, т.е. единственная цель - это именно пиар, то добро пожаловать делать это за деньги?

p.s. это мое мнение как читателя хабра

Ответ написан более года назад

Комментировать

Комментировать
Какую прошивку ставить на микросхему программатором?

rPman @rPman

https://openwrt.org/docs/guide-user/installation/s...

sysupgrade это бинарник, который запускают на самом устройстве уже из запущенного linux, он однозначно не подходит для прошивки программатором

Ответ написан более года назад

6 комментариев

6 комментариев
Низкая скорость скачивания торрентов при гигабитном интернете?

rPman @rPman

Пальцем в небо, но например дешевые сетевые контроллеры (те что в материнки встраивают например, типа реалтека) не позволяют утилизировать гигабитный канал не на синтетических данных, там тупо процессор не справляется, и даже iperf до соседней машины больше 900мбит не даст (а видел даже 700мбит)... если бы речь шла про локальную сетку и какой-нибудь не шибко сложный софт, то увеличив тот же mtu у соединения можно было бы увеличить скорость, но torrent протокол очень сложный, и его работа зависит от тех у кого ты скачиваешь в большей степени чем от твоих настроек, поэтому с твоей стороны, если причина аппаратная, ты решить проблему скорее всего не сможешь.

Попробуй уменьшить или увеличить количество одновременных подключений в torrent клиенте. Смени клиент на что то по проще. Проведи эксперимент в linux (так исключишь особенности настройки qos в windows, резервирующий заметный процент канал и который отключить целый квест). Так же протестируй связь в локальной сети между двумя машинами (без роутера, напрямую), как торентом (буквально один раздает другой скачивает, для чистоты эксперимента можно без интернета) так и синтетическими тестами типа iperf.

p.s. а ты уверен что скачиваемый торент в принципе может быть отдан лично тебе на такой скорости? может там личеров три с половиной калеки на adsl?

Ответ написан более года назад

Комментировать

Комментировать
Возможно-ли сделать рут на устройстве где доступен только system раздел?

rPman @rPman

Ищи джейлбрейки на прошивки на совместимое железо и скорее всего это бесперспективное занятие, xiaomi костьми лягут но не дадут перепрошить свое устройство, чтобы не отключилось их запланированное устаревание (может по другим причинам)

p.s. https://4pda.to/forum/index.php?showtopic=928322 тут пишут что рута нет и не предвидится

Ответ написан более года назад

1 комментарий

1 комментарий
Какую и как дообучить модель машинного перевода?

rPman @rPman

Не разбираюсь в вопросе, но когда читал про это, самое простое что можно сделать, взять обученную сетку у фейсбука, и изучить документацию по повторению их результата но уже на своих данных
https://github.com/facebookresearch/fairseq/tree/m...

Ответ написан более года назад

5 комментариев

5 комментариев
Как правильно бэкапить в этом случае?
rPman @rPman
ACL - во всех современных linux дает дополнительный слой прав поверх привычных chown/chmod.

Можно с помощью setfacl выдать дополнительные права на файловую систему специально созданному пользователю backup и тогда rsync с удаленной машины сможет залогиниться под этим пользователем и скопировать файлы.
Типа так:
sudo setfacl -R -m u:backup:rx /
а копирование с удаленной машины типа так:

rsync -aAXv --exclude={"/dev/*","/proc/*","/sys/*","/tmp/*","/run/*","/mnt/*","/media/*","/lost+found"} backup@remote:/ /path/to/destination

дополнительно нужно будет настроить без парольную аутентификацию под пользователем backup на эту машину

p.s. резервное копирование больших объемов данных, особенно если файлы большие или, к примеру, во время резервного копирования могут быть записаны, потребует заморозку файловой системы с помощью снапшотов, выбор технологии которых накладывает различные ограничения, например LVS кратно роняет скорость работы файловой системы, на которой создан снапшот. Я бы рекомендовал cow файловые системы btrfs/zfs, у них из коробки максимально эффективная система снапшотов (на основе которой можно создать инкрементальные бакапы на порядок удобнее и быстрее чем с помощью rsync) но они роняют (десятки процентов на hdd) скорость работы баз данных в принципе... в общем нужно думать и правильное решение - исключить файлы баз данных из резервного копирования и настройка этого копирования уже средствами базы данных.

В общем полностью абстрагироваться от клиентских машин не получится, что то на них настраивать придется

Ответ написан более года назад

1 комментарий
1 комментарий
Как вывести элементы списка через запятую?

rPman @rPman

Если отвечать на сформулированный вопрос, то чтобы превратить массив строк в строку, где элементы через запятую, то можно использовать implode.

По коду ты пытаешься сформировать json строку, для этого лучше использовать json_encode, которая любой объект (строки, массивы, многоуровневые объекты) превратит в соответствующий json, ведь в строках например может понадобится экранировать всякие ковычки, слеши и другие непечатные символы

Ответ написан более года назад

6 комментариев

6 комментариев
BSOD при стресс тестах, может ли быть он связан со статит. напряжением или электр. пробоями?

rPman @rPman

В первую очередь нужно убрать любой разгон компонентов (оперативная память, процессор, видеокарта).

Установи OpenHardwareMonitor, он показывает больше информации по датчикам и позволяет делать логирование (советую на сетевой диск, тогда данные не будут потеряны из-за bsod).

Скорее всего проблема с южным мостом на материнской плате, отвечает за все коммуникации с дисками и сетевыми картами. Второй кандидат - дисковый контроллер. Третий - блок питания (но тогда проблему бы могла вызывать нагрузка на процессор и видеокарту).

Для выявления нужно создать синтетическую нагрузку на определенные компоненты по отдельности. Например нагрузка на процессор но не на диск и не на оперативную память (нужно подобрать числодробилку). Нагрузку на оперативную память легко организовать тестом памяти. Нагрузку на диск/контроллер - тестом диска (хватит на чтение, кстати pcie nvme диски не используют южный мост, они подключены напрямую к cpu). Можно отдельно потестировать сетевую карту (каким-нибудь iperf).

Самый надежный тест - последовательная замена компонентов сборки на заведомо рабочие, но это потребует их наличие, что обычно возможно только в сервисном центре.

Ответ написан более года назад

1 комментарий

1 комментарий
Как на данный момент можно работать на Access?

rPman @rPman

Не нужно ms access.
Скачивайте microsoft visual studio community легально бесплатно и создавай приложения баз данных, с использованием wfp или win forms.

Саму базу данных создавай в бесплатных инструментах типа db forge community, выбрав бесплатную базу данных типа mysql, postgres, sqlite,...

Ответ написан более года назад

6 комментариев

6 комментариев
С помощью какой AI модели можно локально обработать аудио-файлы (русский голос)?

rPman @rPman

whisper от openai (apache2.0 лицензия) и его производные, на текущий момент лучшая модель общего назначения. Лицензия позволяет пользоваться этим но при включении его в тиражируемые продукты, лицензия на исходный код этих производных продуктов так же должен быть открыт.

Так же модели по работе со звуком есть у всех топовых компаний, например у мозиллы deepspeech и у фейсбука, и у гугла, и у китайского qwen и т.п. но под вопросом качество русского языка, полистай, осторожно тут все в кучу свалено, не только прямая трансляция но и к примеру токенизаторы, векторизаторы и т.п.

Ответ написан более года назад

Комментировать

Комментировать
Нейросеть для обработки фото?

rPman @rPman

либо ты берешь готовый функционал, ограниченный его разработчиком, либо используешь саму сетку напрямую, но придется делать лишние телодвижения (по факту программировать)

Лучший из доступных это comifyui, отвратительный интерфейс но зато максимальный функционал, workflow это по факту программа в GUI в виде графа, готовые с некоторых сайтов инструкций можно получить буквально перетянув изображение с примером в окно программы, и получишь пример, в котором максимум подправить имя файла с весами нейронки (а вот найти и загрузить которые придется вручную). Есть огромное количество плагинов, которые проще устанавливать не вручную а с помощью comifyui-manager

Следующий, более user frendly - stable diffusion webgui, очень удобный, функциональный, но весь функционал заморожен тем что предлагает сам gui или его расширения.

Твоя задача не очень понятна, но могу предположить что тебе нужен режим inpaint, который позволяет указав часть изображения маской, дорисовывать его, очень мало открытых нейронок, дают такой функционал, собственно из доступных только stable diffusion 1.5 inpaint (догадываюсь что спецы могут сделать и другие, в т.ч. с lora но нужно копать эту тему очень глубоко), с соответствующим качеством

Ответ написан более года назад

Комментировать

Комментировать
Почему модель llama предсказывает только один класс?

rPman @rPman

вставь вывод отладочной информации или в отладчике посмотри, значение result[0] в методе classify_with_tokenization

p.s. если речь идет о классификации с помощью llm instruction, это отвратительный способ, его качество будет очень низким (за исключением топовых моделей)... попробуй в системный промпт добавить примеры, чем больше тем лучше, в идеале, чтобы каждый пример использовал максимально отличный от других вариант (в твоем случае это примеры похвалы, эмоций, отношения к человеку, к товару, и т.п.)

Правильно - обучить свою модель, на базе предобученной (не думаю что тебе потребуется большая модель, даже гугловская gemma 2g подойдет), но обучающая выборка должна содержать сотни и тысячи примеров.

Ответ написан более года назад

Комментировать

Комментировать
Какое разрешение правильное на MacOS?

rPman @rPman

Нативное разрешение матрицы 2880x1864, если ты выставляешь любые другие разрешения, то видекарта (или чип перед дисплеем, по разному бывает) будет производить масштабирование изображения.

Любой алгоритм масштабирования, отличный от 1 исходный пиксел в четыре 2х2, вносит искажения, в простонародье называемое - замыливание. При высоких исходных разрешениях, этот эффект не так заметен. Сильно это будет видно на регулярных резких переходах, размером с размер пиксела (например серия черно-белых полос), вместо ожидаемого ровного фона будет видна регулярная картина светло серых полос. Так же это замыливание влияет на текст (но есть люди, кому такое замыливание букв нравится). Очень хорошо это будет видно при плавном сдвиге объектов, четкие границы будут как бы мигать, меняя яркость граничных пикселов в зависимости от четной/нечетной стала координата.

Отсюда, рекомендованные для экрана разрешения 2880x1864 или 1440x932.

Настоятельно рекомендую выставлять нативное разрешение матрицы, а размеры текста изменять настройками масштабирования.

Ответ написан более года назад

Комментировать

Комментировать
Как проверить 500 000 файлов word,exel,pdf ,txt что они не битые?

rPman @rPman

Макросы msword, их даже с нуля писать не придется, так как там есть механизм записи макроса - запускаешь запись, делаешь какие то действия, останавливаешь - он показывает сгенерированный код макроса, выполняющий эти действия, добавляешь в код проверки на ошибку, заворачиваешь в цикл и готово - код простейший - взять следующее имя файла из списка, открыть файл, проверить на ошибку, закрыть файл, повторять до окончания списка.

Так же можно делать все то же самое из любого другого языка программирования, я помню делал что то похожее на c# в visual studio, это удобнее чем писать на vbscript.
https://learn.microsoft.com/ru-ru/dotnet/csharp/ad...

Ответ написан более года назад

2 комментария

2 комментария
Из-за чего показания спидтеста в 10р выше ограничения?

rPman @rPman

По умолчанию speedtest проверяет скорость до ближайшего сервера вашего провайдера, с высокой вероятностью до буквально того, к которому подключена ваша линия, например у меня на ростелекоме с тарифом 200мбит, скорость speedtest 900мбит (показывает сервер в моем городе но в другой его части).

Чтобы оценить 'реальную' скорость, нужно выбрать целевой сервер (кнопка change server) по ближе к тому месту, где размещены ваши 'скачиваемые приложения'.

Ну и помним, что ширина линии между городами и странами значительно меньше той, которая у вашего провайдера до вас или по вашему городу. Условно 'весь город' может сидеть на 40мбитах 'наружу', когда как по городу легко будет давать гигабит.

Ответ написан более года назад

Комментировать

Комментировать
Почему скорость NVME диска такая же как и SATA в proxmox?

rPman @rPman

Xeon L5630
жуть какие тормозные (в singlethread они как типовая машина уровня 2013г ~1000 попугаев, когда как современное железо дает 3000-4000), а еще контроллер nvme у тебя небось китайский нонейм, плюс у тебя виртуализация proxmos дает накладные расходы (минус 30%-90% cpu, именно так) плюс ты же виртуальный контроллер создаешь, он именно на мелких операциях так же даст накладные расходы.

Хочешь реальную скорость, тестируй из нативно запущенной ОС.

Полагаю именно это показывает разницу в скорости IOPS между домашней машины и 'сервером'.

Ответ написан более года назад

4 комментария

4 комментария

Самые активные сегодня

rPman
- 3 ответа
- 0 вопросов
VoidVolker
- 3 ответа
- 0 вопросов
SmeliyR
- 0 ответов
- 2 вопроса
Adamos
- 1 ответ
- 0 вопросов
Nejiola
- 0 ответов
- 1 вопрос
Денис Бирюков
- 1 ответ
- 0 вопросов