Задать вопрос
  • Можно ли обучать нейросеть на базе книг?

    @rPman
    Василий Банников, в сложных вопросах лезут в случившуюся практику, всем лень думать, просто в некоторых странах это возведено в абсолют (в смысле достаточно раз где то всплыть то все, решение копируется, хотя как я понимаю там тоже есть лазейки)

    еще по поводу нейронки, всем абсолютно очевидно, что качество ИИ (того что на основе языковых моделей) - однозначно определяется собранными обучающими данными, а значит преграды на использование информации любыми конкурентами существующих моделей будут использоваться, вот увидите америка первая запретит всем и вся это делать. Само собой компании, которые успели собрать такие датасеты и обучить нейронки будут во всю этим пользоваться, имя непреодолимое преимущество перед новичками (например не публично уже существующая нейронка может собирать легальный датасет, делая это дешевле на пару порядков чем делать это будут люди, я не про генерацию текстов а именно анализ информации).

    Напоминаю, абсолютна вся движуха по aligment/responsible innovation ИИ, создана не для защиты населения от террористов или самого ИИ, смешно даже, как манипулируют страхами, а для того чтобы знания, предоставляемые доступными публично ИИ не позволили другим странам и компаниям получить буст в развитии (а он может быть значительным), отличным примером является мой запрос к chatgpt4 на сугубо техническую тему поведения вещества при сверхвысоких ультразвуковых воздействиях (всего то спрашивал какая максимальная частота ультразвука доступна на текущий момент ради абстрактного обсуждения), чат стал настойчиво интересоваться зачем это мне и отказывался давать ответ потому что это может нанести кому то вред.
  • Можно ли обучать нейросеть на базе книг?

    @rPman
    по поводу нейросетей нет еще законодательной базы и прецедентной практики
  • Можно ли обучать нейросеть на базе книг?

    @rPman
    в api есть механизмы fine tuning
    правда для gpt4 пока не доступны (цен нет)
  • Можно ли обучать нейросеть на базе книг?

    @rPman
    Василий Банников,
    создания и публикации производного произведения
    нет, я спокойно, к примеру могу, используя кулинарную, книгу готовить блюда и снимать об этом видео.

    теперь найди в законе упоминание границы, в пределах которых можно трактовать 'производный продукт' как нарушение

    я допускаю, что создатель книги может указать эти границы буквально в самой книге, но по умолчанию они не определены

    p.s. свобода распространения информации уже давно проиграла эту битву, когда этими границами стали рулить правообладатели, вылезают высеры вида - запись пения птиц банится на ютубе как нарушение прав владельца кого то с треком с птичьим пением.
  • Как улучшить качество микрофона?

    @rPman
    через гарнитуру с шумодавом
    это и есть аппаратное шумоподавление, android тут ничего не делает, все на уровне гарнитуры

    я и говорю, ты можешь взять устройство с поддержкой linux, и сделать из него микрофон, т.е. микрофон подключается к этому устройству проводом (или используется его штатный), затем оно симулирует bluetooth наушники и подключается к твоему смартфону (схема сложная но она точно позволит влиять на двук, который уходит в линию телефона, только через такой блютус хак есть полноценный доступ к аудио треку радиомодуля, именно так из android делают сервер телефонии)

    Удобство такой схемы сомнительно, нужно носить два android устройства, но вместо него можно использовать любое другое хоть минималинку, проблема дальше с софтом, linux для всего даст инструменты но итоговый софт придется писать, маловероятно что такой будет в готовом виде
  • Можно ли обучать нейросеть на базе книг?

    @rPman
    + Ещё учитывай, что просто взять текст произвольной книги и использовать для обучения нейросети - это преступление
    пока в этой области много неоднозначностей.

    чем отличается использование рецептов из книги на сайте и использование этих же рецептов для обучения нейросети? и там и там какой то алгоритм и в обоих случаях публикуется не сама книга а ее производные, почему в одном случае нужно запрещать а в другом разрешать?

    ответ зависит от того, со стороны кого ты находишься.
  • Может ли корпоративный HTTP-прокси мешать запуску юзербота на Pyrogram?

    @rPman
    Открой исходники и смотри что там не так, тебе указано где смотреть и по каким номерам строк. Добавь логирование если этого будет недостаточно.
  • Как при изготовлении деталей по 3d моделям обеспечивать определенные квалитеты точности?

    @rPman
    опытным путем высоких квалитетов не достичь
    с другой стороны, значения уже уровня 0.01 и лучше - это прерогатива дорогих железок.

    Напоминаю, если у тебя система позиционирования с такой точностью но шпиндель гуляет на миллиметр, то высоких значений ты не получишь,

    Еще вариант, шпиндель стоит криво, т.е. может он гуляет в допустимых пределах но закреплен чуть левее, это значит изделие будет точным но со сдвигом в одну сторону, вот такие вещи можно калибровкой решать
  • Как при изготовлении деталей по 3d моделям обеспечивать определенные квалитеты точности?

    @rPman
    не знаю ответ но:
    написал программу обработки
    требует знание (точное в числах) точности обработки станком, не только позиционирование инструмента (сверла/сопло 3d принтера), но и используемый шпиндель (он может колебаться в пределах своего качества), сверла (от длины и формы зависит его колебания), скорость работы (на качество влияент не только у 3d принтеров но и у токарных станков, понятно что там часто в инструмент упирается, т.е. по максимуму усложняют), материал и его прочность/вязкость и т.п. При смене сверла скорее всего смотреть нужно на параметры финишной обработки.

    именно это определит погрешность и ее направление (например ошибка может быть в какую то одну сторону), форму и прочее прочее,
  • Как запретить перенос ACL при перемещении папок и файлов в Linux?

    @rPman
    на сколько я знаю это поведение как windows так и linux, при перемещении файлов в пределах контейнера (раздела) файл переносится как был, со всеми правами, атрибутами

    тоже интересно, можно ли это поведение изменить именно для linux сервера и windows машин, подключенных к нему, так как именно samba такие вещи должна позволять
  • Как создать систему, которая позволит мне выгружать видео в поток, воспроизводимый на 70 разных компьютерах и менять при надобности?

    @rPman
    это вопрос не программирования

    тебе нужно настроить возможность подключения к машине по сети, любым доступным способом
    * например машина к которой подключаешься может быть в той же локальной сети что и ты, соединенная с помощью vpn (на выбор та машина подключается к твоей сети, к серверу в твоей сети, либо твоя машина к сети где находится торрент, без разницы)
    * если у машины (или роутера в сети где стоит торент) есть выделенный ip адрес, то удаленное подключение настраивается на этом роутере (или же если это отдельно стоящая машина то ничего не надо настраивать, максимум если используется фаервол - разрешить входящие подключения на определенные протоколы)

    Какие протоколы позволят тебе решить задачу, на выбор:
    * штатный WEB GUI торент клиента, почти все его используют, правда каждый свой т.е. в настройках торент включаешь веб интерфейс, указываешь с какого ip адреса (точнее подсеть или 0.0.0.0 для всех) которую будет слушать интерфейс, настраиваешь логин пароль и управляешь удаленно по интернет
    * почти все торент клиенты умеют автоматически закачивать (ищи в настройках) торенты, мониторя указанный каталог на появление в нем торент файла, т.е. каким-угодно способом, удобным тебе (например ssh scp, работает штатно на всех vps-ках без доп настроек) ты отсылаешь файл на сервер где запущен торент... я помню кто то настраивал месседженер (не помню но уверен почти все так можно настроить, телеграм точно можно) на автоматическое скачивание файлов, приходящих в приват, соответственно указываешь каталог куда они скачиваются в настройках торент

    не умеешь сам - учись, не хочешь - найди того кто тебе все настроит за деньги.
  • Xen. Как задать права доступа пользователей к виртуальным машинам в ubuntu для xen?

    @rPman
    Доступ к виртуализации организовать через утилиты, т.е. не давать никакого доступа кроме списка действий через скрипты, которые для запуска будет требовать пароль или настройки sudo
  • Что делать при зависании установки вин 10?

    @rPman
    отключи интернет выдернув кабель
    ну и иначе перезагружай компьютер по reset, надеюсь у тебя были сделаны резервные копии перед этой сомнительной процедурой?
  • Какую нейросети актуальны в 2023 году для работы с русским языком?

    @rPman
    chatgpt4 пока доступны только 8к токенов, обещают 32к (я так понял это вместе с картинкой, как считать картинку хз)

    по поводу контекста, дели текст на части, каждую часть прогоняй запросом, вытягивая какую то выжимку, нужную. для решения, и вставляй ее в следующем запросе, для следующего куска текста

    p.s. помни еще есть алгоритмы зашумливания ответа, когда каждый следующий токен выбирается не самый лучший а случайный из приблизительно лучших, я раскрашивал ответ llama, было видно что в моменты когда сеть сомневается, количество вариантов становится резко больше. --temp у llama.cpp можно поставить в 0, тогда будет всегда строго (по умолчанию 0.8)
  • Какую нейросети актуальны в 2023 году для работы с русским языком?

    @rPman
    нету мануалов
    и мне кажется их даже исследователям не дали

    типовой способ использования llama и openassistent, запрос вида
    ### Instruction:
    
    инструкции
    
    ### Input:
    
    данные или просто текст
    
    ### Output:
    Пред instruction можно добавить описание, определяющее поведение модели, что то типа 'ты переводишь с японского на русский литературные тексты'. В данном примере в Input будет исходный текст а после output сетка выдаст перевод. В instruction можно добавлять инструкции типа - персонаж такой то - женского рода, переводить так то.

    Так же по тому как модель галлюцинирует мусором в ответе можно понять что у нее много управляющих ключевых слов типа ### Question: ### Answer: ### Explanation: ### Comment и т.п. советую экспериментировать с запросами. Так же мне кажется сетка понимает эти ключевые слова на русском, т.е. можно писать ### Инструкции: ### Ответ. Есть типовой вариант использования в виде чата, где строка начинается с имени собеседника, типа AI:, User: сеть способна поддерживать разговор сразу нескольких человек. К сожалению контекст в 2к токенов очень мал (запрос не может превысить этот размер, иначе сеть не увидит его начало)
  • Какой дистрибутив пойдёт на мою рухлядь?

    @rPman
    Intel celeron 1.10 GHZ 2 ядра
    максимально неинформативно, целеронов пруд пруди от самых отстойных до неплохих современных чипсетов

    берешь последнюю lts версию ubuntu или mint, если можешь запустить ее livecd то ей и пользуйся, 4Gb более чем нормально

    если 64-бит системы не запускаются, то сочувствую, единственный твой путь это совсем старые версии linux (ubuntu 16 lts кажется, не поддерживается но если поковыряться и прописать зеркала то ок) либо собирать из исходников, что то типа arch или gentoo (последний очень простой и можно получить современный софт на старом железе при этом так что и потребление оперативки будет минимальное и работать будет нормально, но каждое обновление будет болью - компиляция затянется на часы)
  • Где найти нормальный ноутбук в связке AMD (проц + дискретка)?

    @rPman
    у тебя слишком завышенные требования, металл + дискретка + удобная клавиатура.. да тут без 'фак ю' туда же идти придется
    p.s. на яндекс маркете гуглятся начиная с dell от 50т.р. удобство клавиатур и адекватность начинки сам ищи
  • Какой system_prompt использовать для ChatGPT, чтобы тот писал лишь HTML тегами?

    @rPman
    Константин Гусев, ответь на вопрос пожалуйста
    каким промптом ты собираешься выделить 'Как дела?' да еще и ожидаешь от сильно галлюцинирующего ИИ строго формировать html