Почему не работает цикл while?

Question

Markus-Zeyfert @Markus-Zeyfert

Почему не работает цикл while?

Нужно чтобы программа следила за самым свежим объявлением на сайте. Написал вот такой код (опытные, сразу простите за вырвиглазность, программирование второй день изучаю).
В моей теории функция refrash() должна выполняться до тех пор, пока данные, полученные в переменную new, не перестанут быть равны данным переменной item.
Но чёт видимо не так делаю...

import requests
from bs4 import BeautifulSoup

URL = 'https://www.avito.ru/novosibirsk/kvartiry/prodam-ASgBAgICAUSSA8YQ?cd=1&f=ASgBAQICAUSSA8YQAUCQvg0Ulq41&proprofile=1&s=104'
HEADERS = {'user-agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36', 'accept': '*/*'}
HOST = 'https://www.avito.ru'

item = ''
new = ''

def get_html(url, params=None):
    r = requests.get(url, headers=HEADERS, params=params)
    return r

def get_content(html):
    soup = BeautifulSoup(html, 'html.parser')
    global item
    item = soup.find('div', class_='item__line')
def parse():
    html = get_html(URL)
    if html.status_code == 200:
        get_content(html.text)
    else:
        print('Error')

parse()

def refrash():
    def get_html(url, params=None):
        r = requests.get(url, headers=HEADERS, params=params)
        return r
    def get_content(html):
        soup = BeautifulSoup(html, 'html.parser')
        global new
        new = soup.find('div', class_='item__line')
    def parse():
        html = get_html(URL)
        if html.status_code == 200:
            get_content(html.text)
        else:
            print('Error')
    parse()

while new== item:
    refrash()

Вопрос задан более трёх лет назад
347 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 5

3 комментария

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Почему не работает pydantic-settings SettingsConfigDict(yaml_file)?
- 1 подписчик
- 18 часов назад
- 40 просмотров
2

ответа
Python

Простой
В чем ошибка при вызове import requests?
- 1 подписчик
- 20 часов назад
- 60 просмотров
1

ответ
Python

+1 ещё

Средний
Как наводить прицел точно на персонажа?
- 2 подписчика
- вчера
- 381 просмотр
2

ответа
Python

Простой
Еxe файл не воспроизводит музыку. Как решить проблему?
- 2 подписчика
- 19 июн.
- 429 просмотров
1

ответ
Python

Простой
Как ловить exceptions в библиотеке которую я не использую напрямую?
- 1 подписчик
- 18 июн.
- 131 просмотр
2

ответа
Python

+1 ещё

Простой
Имеет ли жизнеспособность идея нового игрового движка на Python?
- 2 подписчика
- 17 июн.
- 4009 просмотров
11

ответов
Python

Простой
Как указать модификатор S в re.sub python?
- 1 подписчик
- 17 июн.
- 78 просмотров
2

ответа
Python

+1 ещё

Простой
Парсинг с помощью библиотеки requests для Python. Как указать параметр из API если в нем заключается недопустимое значение с точками?
- 1 подписчик
- 16 июн.
- 162 просмотра
2

ответа
Python

+2 ещё

Средний
Что взять за основу (электрика) для колонки с ИИ?
- 1 подписчик
- 16 июн.
- 246 просмотров
3

ответа
Python

+2 ещё

Простой
Почему происходит Блокировка доступа при использовании Selenium для парсинга?
- 2 подписчика
- 16 июн.
- 159 просмотров
3

ответа
Показать ещё Загружается…

backend developer (Python) intern

BCraft

от 500 до 1 500 $

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python разработчик

ITK academy • Саратов

от 75 000 ₽

Answer 1 · 2020-10-29 11:22:36

MorganDusty @MorganDusty

refrash говоришь?)

P.S: В КОДЕ "REFRASH" ИЗМЕНИ НА "REFRESH"

Ответ написан более трёх лет назад

3 комментария

Answer 2 · 2020-10-29 11:27:18

Непонятно, конечно, зачем у вас продублированы функции, и функции лежат в функциях, ну да ладно

Все правильно, цикл работает пока new == item. Выполнилась функция parse(), записала новый контент в переменную item, в то же время переменная new осталось старой и равна пустой строке. В итоге item != new и цикл не выполнился и ваш рефраш никогда не выполнялся

Answer 3 · 2020-10-29 11:23:05

Elvis @Dr_Elvis Куратор тега Python

В гугле забанен

Правильно не работает.
У вас ещё ДО того как дойдёт код до while уже в item не пусто.

Ответ написан более трёх лет назад

1 комментарий

Answer 4 · 2020-10-29 11:24:22

Потому что к моменту когда код добирается до цикла, new не равен item. Также зачем тебе повторяющийся код, удали функции которые до "refrash"

Answer 5 · 2020-10-29 11:36:22

Вам в refrash не нужно переобъявлять функции get_html, get_content и parse

import requests
from bs4 import BeautifulSoup

URL = 'https://www.avito.ru/novosibirsk/kvartiry/prodam-ASgBAgICAUSSA8YQ?cd=1&f=ASgBAQICAUSSA8YQAUCQvg0Ulq41&proprofile=1&s=104'
HEADERS = {'user-agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36', 'accept': '*/*'}
HOST = 'https://www.avito.ru'

item = ''
new = ''

def get_html(url, params=None):
    r = requests.get(url, headers=HEADERS, params=params)
    return r

def get_content(html):
    soup = BeautifulSoup(html, 'html.parser')
    item = soup.find('div', class_='item__line')
    return item
def parse():
    html = get_html(URL)
    if html.status_code == 200:
        item = get_content(html.text)
        return item
    else:
        print('Error')

def refrash():
    new = parse()
    return new

item = parse()

while refrash() == item:
    refrash()

Я тут ещё поменял кое-что. В refrash Вы по-сути делаете то же самое, что и в parse. Можно сделать один раз parse, а потом проверять с результатом refrash(хоть и без неё можно обойтись):

import requests
from bs4 import BeautifulSoup

URL = 'https://www.avito.ru/novosibirsk/kvartiry/prodam-ASgBAgICAUSSA8YQ?cd=1&f=ASgBAQICAUSSA8YQAUCQvg0Ulq41&proprofile=1&s=104'
HEADERS = {'user-agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36', 'accept': '*/*'}
HOST = 'https://www.avito.ru'

item = ''
new = ''

def get_html(url, params=None):
    r = requests.get(url, headers=HEADERS, params=params)
    return r

def get_content(html):
    soup = BeautifulSoup(html, 'html.parser')
    item = soup.find('div', class_='item__line')
    return item
def parse():
    html = get_html(URL)
    if html.status_code == 200:
        item = get_content(html.text)
        return item
    else:
        print('Error')

item = parse()

while parse() == item:
    parse()

Почему не работает цикл while?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт