Парсю сайт, ламоды. надо сохранить в html, а далее json.
Я СТАРАЮСЬ СОХРАНИТЬ СРАЗУ 2 СТРАНИЦЫ САЙТА пробовал менять разные значения в поле сайта. Все рано сохраняется не все. Вот сайт,кому интересно
https://www.lamoda.ru/c/5972/shoes-muzhkedy/?sitel...
мой код
import json
import requests
from bs4 import BeautifulSoup
headers ={
"accept": "*/*",
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36" ,
}
def get_page(url):
req = requests.get(url,headers = headers)
src =req.text
#print(src)
with open("lamoda5.html", "w") as file:
file.write(src)
soup = BeautifulSoup(src,"lxml")
cards = soup.find_all("a", class_="x-product-card__link x-product-card__hit-area")
all_categories_dict ={}
for card in cards:
card_text = card.text
card_href = "https://www.lamoda.ru/" + card.get('href')
#print(card_href)
all_categories_dict[card_text] = card_href
with open ("resutllamoda1.json", "w") as file:
json.dump (all_categories_dict, file, indent=4, ensure_ascii=False )
def main():
get_page(url="https://www.lamoda.ru/c/5972/shoes-muzhkedy/?sitelink=topmenuM&l=4&brands=1061,1163,4035,2047,1107&is_sale=1&sort=discount")
if __name__ == "__main__":
main()