Комментарии пользователя rPman — Хабр Q&A

Задать вопрос

Комментарии

Как через запросы искать информацию в гугле?

rPman @rPman

Ну скачивать сайт мне не к чему или я чего-то не понимаю.
не попытавшись пройти по ссылке (как минимум загрузить его заголовки) ты не сможешь понять, файл для загрузки это или еще одна страница. Так же не загрузив страницу ты не сможешь понять по каким ссылкам идти дальше

Алгоритм должен быть примерно следующим - у тебя есть список ссылок (изначально в нем 1 строка с сайтом), для каждой ссылки ты пытаешься ее загрузить, смотришь заголовки, если тип в Content-type соответствует text/html (еще есть text/xml, советую по изучать что еще есть) а так же проходя по редиректам Location, ты принимаешь решение дальше качать файл или пропустить, закачав файл ты должен его распарсить как html (для xml нужно применить стили xslt, указанные в нем), найти все ссылки и добавить в список ссылок на загрузки. Параллельно набираешь список ссылок которые уже загрузил, точнее которые нужно пропустить (изначально загружаешь туда robot.txt сайта) и соовтетственно прежде чем добавлять ссылку проверяешь на ее наличие в нем.

Для javascript сайтов все то же самое, но вместо загрузки - симуляция кликов (и нужно будет что то сделать с загрузками файлов, я почему предложил сделать свой браузер на основе webkit, там загрузка файлов не реализована и можно прописать свою логику на тип файлов, чтобы не грузить лишнее).

p.s. определить тип сайта однозначно нельзя, но по именам файлов, наличию

Написано более двух лет назад
Как корректно управлять и воспроизведить медиа на приставке android?

rPman @rPman

зачем ставить vlc если он уже есть на машине, найди куда он установлен (правда есть шансы что он установлен в приватную область приложения), в общем find / -name vlc

Написано более двух лет назад
Как поменять функцию each, удаленную в PHP 8?

rPman @rPman

AlbinaA , откуда ты взял этот код
видно что это javascript а $ в нем используется как сокращенное название стартового объекта JQuery
each в jquery никуда не исчезал, но могу предположить что пор какой то причине вместо правильной версии библиотеки jquery подключена какая то модифицированная, в которой есть $ но она несет другую функцию

Написано более двух лет назад
Не скачиваются драйвера wifi в линукс манжаро?

rPman @rPman

с твоим подходом к выдачи информации тебе никто не сможет помочь

Написано более двух лет назад
Не скачиваются драйвера wifi в линукс манжаро?

rPman @rPman

на этом сайте принято показывать команды которые пишешь и сообщения об ошибках, которые получаешь
информация об оборудовании
lspci (а если это usb устройство то lsusb)

например топать сюда где в зависимости от модели сказано что делать

Написано более двух лет назад
Почему команды man и sudo не найдены?

rPman @rPman

установи man-db

Написано более двух лет назад
Почему команды man и sudo не найдены?

rPman @rPman

что у тебя там за кастрированная машина
ты совсем не умеешь с linux?
ну просто ls -l /usr/bin/man что покажет?

ты до сих пор не показал свой PATH
echo $PATH

Написано более двух лет назад
Почему сортировка вставкой работает быстрее сортировки выбором в самом сложном случае?

rPman @rPman

да но N+N+N это константы, их опускают при подсчете сложности

Написано более двух лет назад
Владения небольшой сетью с автономной системой и на сколько это законно?

rPman @rPman

По такому закону получается нельзя поднимать vpn к своей сети (речь не о доступе к сети интернет) потому как система автономная, управляемая и находится в интернете.

Мне кажется абсурдность и противоречивость законов в стране компенсируется их выборочным исполнением.

Академические цели скорее всего не попадают под эти выборочные случаи. Плюс, чтобы начать кого то волновать, нужно чтобы чьи то интересы были задеты.

Написано более двух лет назад
Почему команды man и sudo не найдены?

rPman @rPman

file /usr/bin/man

Написано более двух лет назад
Почему сортировка вставкой работает быстрее сортировки выбором в самом сложном случае?

rPman @rPman

оба твоих алгоритма O(N^2), да N*(N-1)/2
insert вынужден двигать весь массив по одному (записи), а select только ищет максимальное число (чтения) что быстрее даже по техническим причинам

Написано более двух лет назад
Почему команды man и sudo не найдены?

rPman @rPman

Повторю вопрос:
что лежит в /usr/bin/sudo и /usr/bin/man (это файлы а не каталоги), проверить например file /usr/bin/sudo
что показывает echo $PATH

Написано более двух лет назад
Почему команды man и sudo не найдены?

rPman @rPman

это текстовый файл, его надо отредактировать любым редактором, например nano или vim.tiny, так же его можно тупо заменить через cat>sources.list (только сначала сделай бакап копию)

Написано более двух лет назад
Почему команды man и sudo не найдены?
rPman @rPman
видно что у тебя только security патчи в списке репозиториев
например смотри сюда, твой /etc/apt/sources.list должен содержать что то типа такого:

deb http://deb.debian.org/debian bullseye main deb-src http://deb.debian.org/debian bullseye main deb http://deb.debian.org/debian-security/ bullseye-security main deb-src http://deb.debian.org/debian-security/ bullseye-security main deb http://deb.debian.org/debian bullseye-updates main deb-src http://deb.debian.org/debian bullseye-updates main

посмотри каких строк у тебя нет и добавь (можно еще non-free-firmware добавить)

после жми apt update и уже тогда apt install xxx

Написано более двух лет назад
Почему команды man и sudo не найдены?

rPman @rPman

что пишет apt update
что лежит в /usr/bin/sudo и /usr/bin/man
что показывает echo $PATH

Написано более двух лет назад
Стоит ли добавлять index для полей таблицы EAV?

rPman @rPman

на сегодняшний день является лучшим решением для хранения Attribute и Attribute Value значений
колонки в таблицах

это лучшее решение, реляционные базы данных для этого и создавались

Написано более двух лет назад
Стоит ли добавлять index для полей таблицы EAV?

rPman @rPman

любое поле таблицы с большим количеством данных (наверное больше десятков записей), которое будет использоваться в where, order by и group by (а так же в агрегирующих функциях) - нужно добавлять в индекс

если несколько полей используется одновременно в order by и where то рекомендуется создавать составной индекс (но EAV часто этому препятствует), иначе в таких запросах обычные не будут использоваться

p.s. про meilisearch понятия не имею что это такое, гуглить умею... я считаю, что лучше сначала решать задачу имеющимися инструментами, прежде чем из-за незнания примитивов бежать и покупать готовое решение, надеясь что оно все проблемы решит, а не создаст новые

Написано более двух лет назад
Стоит ли добавлять index для полей таблицы EAV?

rPman @rPman

осторожно с json, объединять так данные лучше те что по типу работы с данными сгруппированы и так или иначе используются скопом

Написано более двух лет назад
Стоит ли добавлять index для полей таблицы EAV?

rPman @rPman

это главная проблема EAV - очень низкая производительность и очень сложная оптимизация, вырождающаяся в правильное решение - одна запись в таблице = один объект с кучей полей

Написано более двух лет назад
Как распознать текст, что написан нейросетью?

rPman @rPman

технологии chatgpt три месяца, а ты хочешь здесь и сейчас идеальное решения против нее?

Технологии генерации были и до нее но не на столько качественные, в частном порядке такие как амазон с такими успешно боролись (были публикации, в т.ч. на хабре о том как человек генерировал мусорные тексты сервису продажи книг и обворовывал сервис, запуская читающих ботов на них же), логично что никто отдавать это в свободный доступ не будет, так как это тут же позволит найти обходные пути против них.

Написано более двух лет назад

Самые активные сегодня

rPman
- 3 ответа
- 0 вопросов
TheIrishMan
- 2 ответа
- 1 вопрос
Steel_Balls
- 2 ответа
- 0 вопросов
Drno
- 2 ответа
- 0 вопросов
Кот Абсолютный
- 2 ответа
- 0 вопросов
getl
- 1 ответ
- 0 вопросов