Задать вопрос
  • Деление внешнего носителя для файлов и для linux, как это сделать?

    @rPman
    сделать ровно то что ты написал

    разбить диск на несколько разделов (это можно будет сделать во время установки linux, выбрав ручное разбиение диска в самом начале), когда спросят с какого диска загружаться - укажи этот новый диск, тогда для запуска linux будешь выбирать меню загрузки биос и загрузчики не подерутся (майкрософт затирает linux по разным поводам)

    в зависимости от того какой способ загрузки в биосе выбран и какая разметка диска (mbr и gpt видны и там и там):
    * efi загрузка требует/рекомендует gpt разметка, legacy - mbr
    * если выбрана gpt разметка но legacy режим то потребуется 1мб раздел biosboot
    * если выбран efi режим, то нужен раздел ~100мб efiboot (отформатировать в обычный fat но с пометкой что он efi)
    * если выбран legacy режим загрузки и mbr разметка, то для linux хватит 1 раздела /
    (иногда требуется /boot раздел, обывателю это не нужно, это актуально для нетипичных конфигураций файловых систем)

    Итого 1-2 раздела для linux и 1 раздел ntfs для windows, который прекрасно виден и в windows и в linux, без каких либо настроек.

    Но есть совет, windows начиная с 8.1 версии и по сей день по умолчанию включает hibernate режим и использует его даже когда ты выбираешь обычное выключение компьютера (оно делает logout, закрывая все приложения, и включает гибернацию) - чтобы показывать рекорды моментального включения компьютера. К сожалению в этом режиме файловые системы на флешках и дисках считаются некорректно извлеченными, и в редких случаях работа с таким 'некорректно отключенным' диском из linux (любой другой ОС, тут важен факт гибернации) может привести к повреждению данных

    Поэтому рекомендую отключить гибернацию, если важно постоянно переключаться между ОС.
    Ответ написан
    4 комментария
  • Почему нет установщика пакетов на Ubuntu?

    r1412s
    @r1412s
    А если открыть терминал и выполнить команду: sudo apt install gdebi то потом можно будет на Вашем хроме ПКМ и установить пакет
    Ответ написан
    Комментировать
  • Откуда появляется обложка в MP3-файле?

    nokimaro
    @nokimaro
    Меня невозможно остановить, если я смогу начать.
    Конкретно в tg обложка приходит с серверов tg как мета-информация о загруженном файле
    https://core.telegram.org/api/files#downloading-we...
    ищите на странице "cover"

    То есть после того как вы залили файл на сервера tg он проходит обработку и сервер для файла находит обложку. Через какой сервис делается поиск обложки для mp3 - неизвестно.
    Раньше десктопный тг-клиент делал это втупую используя iTunes Search API, теперь tg-сервер делает поиск обложки после загрузки mp3 и отдаёт это как мета-информацию в клиент. Естественно оригинальный файл никак не изменяется и обложка внутрь файла не пишется.
    Если в загруженном mp3 есть файл с обложкой в id3-тегах то будет использоваться он. Поэтому если не устраивает обложка которую находит ТГ - зашейте нужную картинку через id3-теги.

    сам автор песни был в шоке от содержимого

    Да там тупой поиск хоть чего-нибудь по названию трека, автора, альбома из тегов или имени файла. Картинка не всегда может быть корректной.
    Ответ написан
    Комментировать
  • Как скачать целую ветку форума 4pda и скормить нейросети?

    @rPman
    4pda основан на ip.board, все загружается без танцев с бубном, только осторожно, без авторизации получаются другие страницы чуть в ином формате. Вот пример кода на основе simple_html_dom:
    <?php
    include('simple_html_dom.php');
    
    // ссылка на первую страницу темы
    define('START_URL','https://4pda.to/forum/index.php?showtopic=1084129');
    // количество страниц &st= из ссылки » в навигаторе по страницам
    define('PAGES_CNT',580);
    
    @mkdir('data');
    
    for($i=0;$i<=PAGES_CNT;$i+=20)
    {
    	// формируем url
    	$url=START_URL.($i==0?'':'&st='.$i);
    	// имя кеш файла чтобы не загружать повторно
    	$cache_fn='data/'.md5(START_URL).'.'.$i.'.html';
    	if(!file_exists($cache_fn))
    	{
    		// Загружаем страницу
    		$data=file_get_contents($url);
    		// сохраняем страницу в кеше
    		file_put_contents($cache_fn,$data);
    		// пауза между запросами к серверу для защиты его от ddos
    		sleep(1);
    	} else
    	{
    		// читаем из кеша
    		$data=file_get_contents($cache_fn);
    	}
    
    	$html=str_get_html($data);
    	$num=0;
    	foreach($html->find('div[class]:not([class=""]') as $post)
    	{ // перебираем посты в теме
    		// пропускаем первый пост темы, он дублируется на каждой странице
    		if($num++==0) continue;
    		// выводим пост на экран
    		$post_html=$post->find('div.post_body',0)->text();
    		echo $post_html.PHP_EOL;
    	}
    	// вставляем разделитель между постами
    	echo '<hr/>'.PHP_EOL;
    	$html->clear();
    }
    ?>

    вернет на экран посты указанные в START_URL, мне лень было вычислять конец треда автоматически, бери количество постов вручную из навигатора постов.

    Страницы можешь вручную указать for($i=0;$i<=PAGES_CNT;$i+=20) вместо 0 - начальный (с шагом 20) и PAGES_CNT конечный пост.

    Вместо текстового представления $post_html=$post->find('div.post_body',0)->text(); можешь сложнее структуру сообщения анализировать, выявляя цитирования и к примеру исключая их из текста (они занимают большую часть всего, дублируя многократно информацию).

    Конкретно этот пример не влезет в контекстное окно бесплатного claude - это 70к токенов. Поэтому дели на куски.
    Ответ написан
  • Какие есть инструменты для написания интерфейса для терминала?

    C++

    Rust

    Это из того, что у меня в закладках. Так-то ищите по тэгу TUI (text user interface, в оппозицию к GUI) - и будет вам счастье.
    Ответ написан
    Комментировать
  • Какая модель LLama лучше для использования в telegram?

    @rPman
    Какая? llama3-70b наилучшая из открытых (те что можно запустить у себя), или command r+. Так же хорошие открытые модели основанные на mixtral (mixtral-8x22b). llama3-8b тоже не плохая для своего размера (запустится на 8-16Gb десктопных видеокартах).
    https://chat.lmsys.org/?leaderboard

    Llama это модель, она ничего не может, это файл на диске. Для того чтобы модель работала тебе нужна программа, например с гитхаба официальный пример на python (он очень простой, там буквально 5-10 строчек)

    Не рекомендую прямо в боте telegram вставлять работу с gpt, т.е. это можно и даже будет работать но помятуя что у gpt высокие требования к железу (оперативная память) это будет не эффективно.

    Готовый сервер идет в поставке с llama.cpp (запросы api по http), он же умеет обрабатывать одновременно несколько запросов (по умолчанию 10 одновременных потоков кажется) так же есть возможность самому собирать запросы в пакет и отправлять одним запросом в сервер, он все обработает и вернет, и по скорости это будет быстрее чем каждый по отдельности (особенно когда работа на gpu).

    Программирование ботов gpt - это придумывание запросов на естественном языке, которые дополняются данными от пользователей или еще какими (например обычный запрос в классическую базу, вываливая в промп тупо текстом, к примеру csv форматом). У тебя ограниченное количество ресурсов, маленькое окно контекста (у llama это 8к токенов) и в попытке все туда уместить и приходится что то поверх городить. тупой пример - если ты будешь весь чат пихать в контекст, уже через 20-30 сообщений он переполнится, и нужно будет принимать решение что и как выкидывать.

    А еще llama любит отвечать лишнее, т.е. ты ее просишь ответь числом, а оно отвечает - ваш ответ 3... вот эти 'ваш ответ' нужно как то выявлять. А еще модели лучше работают, если просить их по рассуждать, она тебе даст рассуждения, тебе они нафиг не нужны, как из них результат вычленить? Иногда можно отделить мусор от ответа, попросив его дать в каком то формате, например дай ответ в формате json, а так как запрос к gpt это часть беседы в форме чата, можно дать часть ответа прямо в промпте, например "...assitent: {" тогда у модели не останется варианта как сразу фигачить json.

    Но чем больше ограничений ты даешь модели тем хуже ее качество ответов.

    У llama.cpp есть механизмы задания gramma формата ответа, какие токены предпочтительнее и в каком формате, говорят не идеально реализовано (например не получится задать варианты ответов списком слов типа отвечай только название цвета 'красный', 'зеленый', 'желтый', 'другое',..)
    Ответ написан
    Комментировать
  • Нужна ли нам вся эта безопасность?

    @accountnujen
    Интел, Intel vdt, Intel ppt, от Microsoft, Device Guard и т.д. Вопрос, а нужно ли мне все это?

    маркетологам нужно. вам - нет.
    под предлогом заплатки уязвимости/безопасности можно урезать процентов 30-40% производительности. Этим страдает и intel, и amd. Этакий лёгкий способ заставить юзера купить новое оборудование. Если вы думаете, что избавиться от этого можно лишь установить Windows без этих обновлений, то вы очень сильно ошибаетесь. Все процессорные обновления необратимы. Если взять два старых процессора: один из коробки, а второй из системы после обновления, то они покажут разную производительность на чистой старой системе.

    если грубо говоря, производитель выпускает какой-нибудь tmp и говорит: новая windows работать без него не будет. Хочешь новую - покупай новый ПК. Тоже самое и с другими средствами защиты: хочешь защититься - покупай новый ПК, иначе всё будет лагать.
    Ответ написан
  • Как асинхронно создать QR код?

    Vindicar
    @Vindicar
    RTFM!
    Потому что создание QR-кода - это вычислительная операция, а не операция ввода/вывода. Вычислительные операции не имеет смысла делать асинхронными. Если создание QR-кода занимает у тебя достаточно длительное время, чтобы это было проблемой для остальной программы - засунь этот код в поток через run_in_executor(). Тогда у тебя будет асинхронный future-объект, который можно awaitить как обычно.
    Ответ написан
    4 комментария
  • Что за файлы и как с ними жить дальше?

    Alex_Geer
    @Alex_Geer Автор вопроса
    System Engineer
    Ни кто не хочет писать ответ, напишу сам. В общем через команду file можно убедится что это действительно дампы процесса. Нашел ошибки в логах LibreOffice когда файлы удаляются ранее чем преобразовались в PDF, процесс зависает и система его убивает. Возможно эта информация будет кому то полезна.
    Ответ написан
    1 комментарий
  • Почему в наутилусе папка распаковывается за 1 секунду, а в Windows 1 минуту?

    Потому что в винде zip очень древний и неоптимизированный.
    Лучше использовать winrar или 7zip для распаковки - тогда тоже будет быстро.
    Ответ написан
  • Какие модули есть в Python для целей анализа, форматирования, вывода текста?

    @shut0vby
    python, js, html&css
    Привет. Советую глянуть библиотеку ReportLab, создаёт pdf на основе данных, возможно это то что тебе нужно. Для поиска совпадений слов, знаков препинаний: модули re, collenctions, как-то так
    Ответ написан
    1 комментарий
  • Какую книгу порекомендуете для изучения auditd Linux?

    r1412s
    @r1412s
    Если люди будут писать книги на каждую утилиту сисадмина то не знаю...
    Есть man auditd,есть статейки неплохие https://habr.com/ru/articles/553036/
    Ответ написан
    Комментировать
  • Виндовс бут менеджер стоит на одном диске, а сама винда на другом?

    @rPman
    Да, такое возможно.
    Самое простое - восстановить загрузчик с помощью загрузочного установочного диска windows (его версия и битность должны совпадать с установленной), выбрать восстановление -> командная строка... советую погуглить как восстановить загрузчик, инструкций вагон. Вам понадобится дополнительный раздел, примерно 200мб.

    Настоятельно рекомендую на время этих манипуляций физически отключить остальные диски, будет проще и меньше возможностей ошибиться.
    Ответ написан
    Комментировать
  • Где можно посмотреть официальную статистику популярности операционных систем Linux?

    Sanes
    @Sanes
    Их всего два. Debian и Rhel образные. Что для сервера, что для десктопа. Остальные для тех, кому заняться нечем.
    1. Ubuntu/Mint/Debian
    2. Fedora/Centos/Alma/Rocky
    Ответ написан
  • Как установить самый новый совместимый firefox для ubuntu 8.10?

    @rPman
    Настоятельно не советую ковыряться со старыми версиями linux, тем более на столько старыми, там начнутся проблемы уже поиском рабочих репозитарий, поиском инструкций, настройкой сертификатов и т.п.

    Самый свежий софт для старых компьютеров настоятельно рекомендую собирать из исходников с помощью gentoo. Там это автоматизировано до пары телодвижений, как бы не говорили что gentoo это сложно, если ты дошел до ситуации, когда нужно компилировать - то это лучший. Еще говорят arch хорош, но не для слабых и старых компьютеров. Я собирал себе минисборку для eepc900 с 1gb ram (DE - awesome), оно в запущенном состоянии с GUI потребляло 50мб ram (притом что пустой ubuntu требует больше 300мб и для браузера уже на остается), т.е. оставался весь гигабайт для браузера (но учти современный интернет очень ресурсоемкий, осознаешь на сколько криворукие программисты заполонили мир, банально youtube все ресурсы затрачивает на просто загрузку видео, и их не хватает на проигрывание, когда как скачанное проигрывает в 480p без проблем а с оговорками и 720p что для 15-летней давности железа очень даже хорошо)

    Само собой для ускорения сборки нужно использовать быстрые машины, в gentoo для этого запилили целую инфрастуктуру с помощью distcc (пара телодвижений в конфиге) можно направить компиляцию на кластер, который запустить можно на тех же облачных vps-ках (тебе считанные часы работы обойдутся в сотню рублей). Советую сначала разобраться и попробовать на своем железе и только потом направлять на арендованное железо.

    Еще совет, не заморачивайся с компиляцией ядра - это нужно тем кто тюнит сборку для совсем отбитого железа интернета вещей. Бери готовое ядро, которое идет с их livecd.
    Ответ написан
    Комментировать
  • Как установить самый новый совместимый firefox для ubuntu 8.10?

    @Everything_is_bad
    никак
    Ответ написан
    Комментировать
  • Как уменьшить размер PDF на сервере?

    Vvvyg
    @Vvvyg
    Был админом, сейчас в ТП
    В постановке задачи не указано, что за система на сервере. Для Windows - FileOptimizer.
    Ответ написан
    Комментировать
  • Как уменьшить размер PDF на сервере?

    AshBlade
    @AshBlade
    Просто хочу быть счастливым
    Можно вот таким скриптом на bash
    find . -name '*.pdf' | xargs -I % sh -c 'gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=%.tmp %; mv %.tmp %'

    Он находит все файлы, оканчивающиеся на .pdf в текущей директории и для каждого создает новый сжатый и по окончании заменяет старый новым сжатым.

    Но необходимо установить ghostscript - sudo apt install ghostscript
    Ответ написан
    1 комментарий