Задать вопрос

Олег Захаров

22

вклад
0

вопросов
37

ответов
38%

решений

Ответы пользователя по тегу Python

Как извлечь текст статьи из html-страницы?

Олег Захаров @blazenn12

Берем bs4 и пишем парсер под каждый сайт

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как установить модуль pymqi?

Олег Захаров @blazenn12

решение

Ответ написан более трёх лет назад

1 комментарий

1 комментарий

Как правильно сделать вложенный цикл for?

Олег Захаров @blazenn12

Если в общем виде, то примерно так:

from pprint import pprint
from urllib import request
from urllib.error import URLError

from bs4 import BeautifulSoup


def get_html_from_url(target_url):
    try:
        html = request.urlopen(target_url).read().decode('UTF-8')
        return html
    except URLError:
        print('Не могу открыть url')


def parse_events(html_events):
    events = list()
    for item in html_events:
        events.append({
            'Событие': item.h3.a.string,
            'Дата': item.p.time['datetime'],
            'Место': item.find('span', {'class': 'event-location'}).string
        })
    return events


if __name__ == '__main__':
    url = "https://www.python.org/events/python-events"

    raw_html = get_html_from_url(url)
    soup = BeautifulSoup(raw_html, 'html.parser')
    item_list = soup.find('ul', attrs={'class': 'list-recent-events menu'})
    python_events = parse_events(item_list.find_all('li'))
    pprint(python_events)

Ответ написан более трёх лет назад

Комментировать

Зависимости Python?

Олег Захаров @blazenn12

Возможно и будет работать, но привязка к определенной версии либы не просто так делают.
Лучше всего установить рекомендуемые версии

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как в mongodb добавить записи только если они не существуют?
Олег Захаров @blazenn12
Здесь мы сравниваем по конкретному полю
for item in DATA2: yamaha.update({'title': item['title']}, {'$set': item}, upsert=True)

Если нужно сравнить по всему документу
for item in DATA2: search_result = yamaha.find_one(item) if search_result is None: yamaha.insert(item)

Ответ написан более трёх лет назад

Комментировать
Комментировать

Самые активные сегодня

Drno
- 5 ответов
- 0 вопросов
DenisYahnovec
- 5 ответов
- 0 вопросов
Василий Банников
- 3 ответа
- 0 вопросов
VoidVolker
- 2 ответа
- 0 вопросов
Уставшая Вишенка
- 0 ответов
- 2 вопроса
Кот Абсолютный
- 2 ответа
- 0 вопросов

Как извлечь текст статьи из html-страницы?

Как установить модуль pymqi?

Как правильно сделать вложенный цикл for?

Зависимости Python?

Как в mongodb добавить записи только если они не существуют?

Войдите на сайт