• Какая модель LLama лучше для использования в telegram?

    @rPman
    Какая? llama3-70b наилучшая из открытых (те что можно запустить у себя), или command r+. Так же хорошие открытые модели основанные на mixtral (mixtral-8x22b). llama3-8b тоже не плохая для своего размера (запустится на 8-16Gb десктопных видеокартах).
    https://chat.lmsys.org/?leaderboard

    Llama это модель, она ничего не может, это файл на диске. Для того чтобы модель работала тебе нужна программа, например с гитхаба официальный пример на python (он очень простой, там буквально 5-10 строчек)

    Не рекомендую прямо в боте telegram вставлять работу с gpt, т.е. это можно и даже будет работать но помятуя что у gpt высокие требования к железу (оперативная память) это будет не эффективно.

    Готовый сервер идет в поставке с llama.cpp (запросы api по http), он же умеет обрабатывать одновременно несколько запросов (по умолчанию 10 одновременных потоков кажется) так же есть возможность самому собирать запросы в пакет и отправлять одним запросом в сервер, он все обработает и вернет, и по скорости это будет быстрее чем каждый по отдельности (особенно когда работа на gpu).

    Программирование ботов gpt - это придумывание запросов на естественном языке, которые дополняются данными от пользователей или еще какими (например обычный запрос в классическую базу, вываливая в промп тупо текстом, к примеру csv форматом). У тебя ограниченное количество ресурсов, маленькое окно контекста (у llama это 8к токенов) и в попытке все туда уместить и приходится что то поверх городить. тупой пример - если ты будешь весь чат пихать в контекст, уже через 20-30 сообщений он переполнится, и нужно будет принимать решение что и как выкидывать.

    А еще llama любит отвечать лишнее, т.е. ты ее просишь ответь числом, а оно отвечает - ваш ответ 3... вот эти 'ваш ответ' нужно как то выявлять. А еще модели лучше работают, если просить их по рассуждать, она тебе даст рассуждения, тебе они нафиг не нужны, как из них результат вычленить? Иногда можно отделить мусор от ответа, попросив его дать в каком то формате, например дай ответ в формате json, а так как запрос к gpt это часть беседы в форме чата, можно дать часть ответа прямо в промпте, например "...assitent: {" тогда у модели не останется варианта как сразу фигачить json.

    Но чем больше ограничений ты даешь модели тем хуже ее качество ответов.

    У llama.cpp есть механизмы задания gramma формата ответа, какие токены предпочтительнее и в каком формате, говорят не идеально реализовано (например не получится задать варианты ответов списком слов типа отвечай только название цвета 'красный', 'зеленый', 'желтый', 'другое',..)
    Ответ написан
    Комментировать
  • Нужна ли нам вся эта безопасность?

    @accountnujen
    Интел, Intel vdt, Intel ppt, от Microsoft, Device Guard и т.д. Вопрос, а нужно ли мне все это?

    маркетологам нужно. вам - нет.
    под предлогом заплатки уязвимости/безопасности можно урезать процентов 30-40% производительности. Этим страдает и intel, и amd. Этакий лёгкий способ заставить юзера купить новое оборудование. Если вы думаете, что избавиться от этого можно лишь установить Windows без этих обновлений, то вы очень сильно ошибаетесь. Все процессорные обновления необратимы. Если взять два старых процессора: один из коробки, а второй из системы после обновления, то они покажут разную производительность на чистой старой системе.

    если грубо говоря, производитель выпускает какой-нибудь tmp и говорит: новая windows работать без него не будет. Хочешь новую - покупай новый ПК. Тоже самое и с другими средствами защиты: хочешь защититься - покупай новый ПК, иначе всё будет лагать.
    Ответ написан
  • Как асинхронно создать QR код?

    Vindicar
    @Vindicar
    RTFM!
    Потому что создание QR-кода - это вычислительная операция, а не операция ввода/вывода. Вычислительные операции не имеет смысла делать асинхронными. Если создание QR-кода занимает у тебя достаточно длительное время, чтобы это было проблемой для остальной программы - засунь этот код в поток через run_in_executor(). Тогда у тебя будет асинхронный future-объект, который можно awaitить как обычно.
    Ответ написан
    4 комментария
  • Что за файлы и как с ними жить дальше?

    Alex_Geer
    @Alex_Geer Автор вопроса
    System Engineer
    Ни кто не хочет писать ответ, напишу сам. В общем через команду file можно убедится что это действительно дампы процесса. Нашел ошибки в логах LibreOffice когда файлы удаляются ранее чем преобразовались в PDF, процесс зависает и система его убивает. Возможно эта информация будет кому то полезна.
    Ответ написан
    1 комментарий
  • Почему в наутилусе папка распаковывается за 1 секунду, а в Windows 1 минуту?

    vabka
    @vabka
    Токсичный шарпист
    Потому что в винде zip очень древний и неоптимизированный.
    Лучше использовать winrar или 7zip для распаковки - тогда тоже будет быстро.
    Ответ написан
  • Какие модули есть в Python для целей анализа, форматирования, вывода текста?

    @shut0vby
    python, js, html&css
    Привет. Советую глянуть библиотеку ReportLab, создаёт pdf на основе данных, возможно это то что тебе нужно. Для поиска совпадений слов, знаков препинаний: модули re, collenctions, как-то так
    Ответ написан
    1 комментарий
  • Какую книгу порекомендуете для изучения auditd Linux?

    r1412s
    @r1412s
    Если люди будут писать книги на каждую утилиту сисадмина то не знаю...
    Есть man auditd,есть статейки неплохие https://habr.com/ru/articles/553036/
    Ответ написан
    Комментировать
  • Виндовс бут менеджер стоит на одном диске, а сама винда на другом?

    @rPman
    Да, такое возможно.
    Самое простое - восстановить загрузчик с помощью загрузочного установочного диска windows (его версия и битность должны совпадать с установленной), выбрать восстановление -> командная строка... советую погуглить как восстановить загрузчик, инструкций вагон. Вам понадобится дополнительный раздел, примерно 200мб.

    Настоятельно рекомендую на время этих манипуляций физически отключить остальные диски, будет проще и меньше возможностей ошибиться.
    Ответ написан
    Комментировать
  • Где можно посмотреть официальную статистику популярности операционных систем Linux?

    Sanes
    @Sanes
    Их всего два. Debian и Rhel образные. Что для сервера, что для десктопа. Остальные для тех, кому заняться нечем.
    1. Ubuntu/Mint/Debian
    2. Fedora/Centos/Alma/Rocky
    Ответ написан
  • Как установить самый новый совместимый firefox для ubuntu 8.10?

    @rPman
    Настоятельно не советую ковыряться со старыми версиями linux, тем более на столько старыми, там начнутся проблемы уже поиском рабочих репозитарий, поиском инструкций, настройкой сертификатов и т.п.

    Самый свежий софт для старых компьютеров настоятельно рекомендую собирать из исходников с помощью gentoo. Там это автоматизировано до пары телодвижений, как бы не говорили что gentoo это сложно, если ты дошел до ситуации, когда нужно компилировать - то это лучший. Еще говорят arch хорош, но не для слабых и старых компьютеров. Я собирал себе минисборку для eepc900 с 1gb ram (DE - awesome), оно в запущенном состоянии с GUI потребляло 50мб ram (притом что пустой ubuntu требует больше 300мб и для браузера уже на остается), т.е. оставался весь гигабайт для браузера (но учти современный интернет очень ресурсоемкий, осознаешь на сколько криворукие программисты заполонили мир, банально youtube все ресурсы затрачивает на просто загрузку видео, и их не хватает на проигрывание, когда как скачанное проигрывает в 480p без проблем а с оговорками и 720p что для 15-летней давности железа очень даже хорошо)

    Само собой для ускорения сборки нужно использовать быстрые машины, в gentoo для этого запилили целую инфрастуктуру с помощью distcc (пара телодвижений в конфиге) можно направить компиляцию на кластер, который запустить можно на тех же облачных vps-ках (тебе считанные часы работы обойдутся в сотню рублей). Советую сначала разобраться и попробовать на своем железе и только потом направлять на арендованное железо.

    Еще совет, не заморачивайся с компиляцией ядра - это нужно тем кто тюнит сборку для совсем отбитого железа интернета вещей. Бери готовое ядро, которое идет с их livecd.
    Ответ написан
    Комментировать
  • Как установить самый новый совместимый firefox для ubuntu 8.10?

    @Everything_is_bad
    никак
    Ответ написан
    Комментировать
  • Как уменьшить размер PDF на сервере?

    Vvvyg
    @Vvvyg
    Был админом, сейчас в ТП
    В постановке задачи не указано, что за система на сервере. Для Windows - FileOptimizer.
    Ответ написан
    Комментировать
  • Как уменьшить размер PDF на сервере?

    AshBlade
    @AshBlade
    Просто хочу быть счастливым
    Можно вот таким скриптом на bash
    find . -name '*.pdf' | xargs -I % sh -c 'gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=%.tmp %; mv %.tmp %'

    Он находит все файлы, оканчивающиеся на .pdf в текущей директории и для каждого создает новый сжатый и по окончании заменяет старый новым сжатым.

    Но необходимо установить ghostscript - sudo apt install ghostscript
    Ответ написан
    1 комментарий
  • Как печать PDF из Microsoft EDGE с авто выбором источника бумаги под размер страницы?

    Adamos
    @Adamos
    Во-первых, нет смысла упираться в Edge, который все равно - перекрашенный Chrome, и исследовать вопрос имеет смысл по нему - элементарно больше ответов найдется.
    Во-вторых, продвинутой работы с принтером из браузера нет и быть не может - он из соображений безопасности сильно ограничен даже в информации о принтерах, не то что в настройках. Шаг влево, шаг вправо - сразу надо переключаться в "печатать, используя системный диалог", и смотреть уже там. А вот то, что там, зависит в первую очередь от драйвера принтера.
    Ответ написан
    Комментировать
  • Где арендовать сервер в Hetzner?

    @psiklop
    Получал письмо от Hetzner недавно, лавочка закрыта абсолютно для России. Для чего? Хороший хостинг, ну и что с того. Если же никак иначе, нужно современное железо или сверхнадежность - тогда вперед пользоваться всякими посредническими недо-сервисами которых на почве санкций открыли. Но теперь нужны уже не только карта, но и гражданство.

    И тут теряется преимущества хетзнера, хороший хостинг + дерьмовый посредник = дерьмовый хостинг
    Ответ написан
    4 комментария
  • Как переустановить windows рядом с linux?

    SignFinder
    @SignFinder
    Wintel\Unix Engineer\DevOps
    Загрузчик Linux затрется. Нужно будет загрузиться с диска с Linux и восстановить загрузчик
    Ответ написан
    Комментировать
  • Как спарсить данные с TrandingView?

    @rPman
    Данные там лежат в огромном json прямо встроенном в саму страницу, которая грузится без каких либо особенностей, тупо wget-ом, очень странное решение но
    <script type="application/prs.init-data+json">{"FYBZHq":{"context":{"request_context":{"user":{"is_authenticated":true,"is_...}}</script>
    пример FYBZHq►data►news►data►items►0►
    id	:	prime:0273264f867b8:0
    title	:	Результаты торгов акциями в секторе основных торгов Московской биржи
    storyPath	:	/news/prime:0273264f867b8:0/
    sourceLogoId	:	prime
    published	:	1701792002
    source	:	ПРАЙМ
    urgency	:	2
    permission	:	headline
    provider	:	prime
    Ответ написан
    Комментировать
  • Какой дистрибутив linux выбрать для мегатормозного ноута?

    @Vlad_hex
    Arch + Openbox. Я ставил на допотопный компьютер с 512мб оперативной памяти. Все работало в том числе и приложения виндовые Wine. На старте потребляло какие то крохи оперативной памяти и был потенциал для еще большей оптимизации. Но это путь не для слабых духом нужно много курить манов в том числе и на английском ну и сам Arch не для совсем новичков и способен подкинуть проблем.
    Ответ написан
    2 комментария