В чём особенность парсинга с помощью Beautiful Soup?
Доброго времени суток ! Подскажите, в чём преимущество парсинга с помощью Beautiful Soup ? Отличие в расширенном функционале по сравнению со стандартными методами ? Отличие в скорости парсинга ? Или может он для сложного парсинга предназначен, а для простого можно обойтись стандартными методами ?
Например есть страница сайта, я могу обычным способом её сохранить, затем получить содержимое файла в текстовом виде и осуществить поиск через стандартный строковый метод find(). В чём этот способ проигрывает решению этой же задачи с использованием Beautiful Soup ?
Вот зачем ты задаешь такой вопрос, на которые можно было самостоятельно найти ответ?
- задал, потому что не нашёл ответа.
хочу и комментирую
- я только рад ответам с аргументами, но ваши первые два комментария аргументов не содержат, только субъективное мнение. Я новичок, вы (возможно) имеете некий опыт и знания, вы нашли время, чтобы оставить свой комментарий, но посчитали выше своего достоинства привести аргументы ? Меня это удивляет.
пример простейшего задания - есть список товаров, получить название, цену, ссылку и если есть, картинки. Список содержится в блоке с классом products, кроме этого в этом же блоки есть ссылки не на товары, их игнорировать.
- вот это уже аргументированный ответ, почему нельзя было так сразу написать ? В пояснении к своему вопросу я предположил, что может быть одно из отличий Beautiful Soup в том, что он предназначен именно для сложных задач. Спасибо, что привели пример, который подтвердил мою догадку.
Soul1, jна простая хотя бы потому что решена до вас миллион раз. и то, что вы не можете воспользоваться результатами коллективного разума, говорит не о том, что задача сложная. еще раз: она решена, неоднократно и разными путями. вы же говорите "ох, какие трудные пути, по ним ходить надо", забывая, что пути эти протоптаны, заасфаьтированы и освещены. но да, ходить по ним надо самому.
Сергей Ильин, нет, она сложная в сравнении с теми целями, которые сейчас передо мной стоят, а именно - спарсить всего лишь текстовые данные, а не данные разных типов. Всё что я хотел узнать: целесообразно ли использование сложных инструментов наподобие Beautiful Soup для этой задачи и будет ли, например, выигрыш в скорости по сравнению с поиском через стандартный строковый метод find. Потому что на изучение библиотеки нужно время, а через find я уже спарсил данные, там код в несколько строк (но это может понадобиться сделать ещё раз). Вот пока человек выше не написал пример мне даже не пришло в голову, что можно парсить разные типы данных, для меня html страница это набор текста. Я совсем новичок. Как видите знаний маловато даже для формулировки вопроса )
Soul1, это говорит не в вашу пользу, потому как перед тем, как задать вопрос, стоит почитать, что о нем пишут. И да, прироста по скорости не будет. но будет вменяемое удобство. вы же еще не сталкивались с регулярками?