Ответы пользователя lcd1232 по тегу «Python»

Задать вопрос

Ответы пользователя по тегу Python

Правильно ли я сделал парсер?

lcd1232 @lcd1232

Почитайте про scrapy. Он делает всю грязную работу за вас, так что никаких проблем не будет.

Ответ написан более трёх лет назад

3 комментария

3 комментария
Как создать цикл, на каждой итерации которого создается список с новым именем?
lcd1232 @lcd1232
file_names = ['a.txt', 'b.txt', 'c.txt'] files = [] for file_name in file_names: with open(file_name, 'r') as file: files.append(file.readlines())

Ответ написан более трёх лет назад

Комментировать
Комментировать
Как вывести поле из MySQL без скобок и запятых?

lcd1232 @lcd1232

Потому что MySQLdb выводит ответ либо в list(dict()), либо в list(list()). Попробуйте вывести тип этой переменной.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Меры предосторожности при парсинге на Python?

lcd1232 @lcd1232

Для теста данные библиотеки подходят, но если действительно хотите парсить большие сайты, то надо использовать scrapy.
- Если предстоит спарсить несколько тысяч страниц, какие меры безопасности нужно предпринимать, чтобы не быть забаненым?
Если нет авторизации, то можно использовать: user-agent rotation, proxy rotation, random delay.
- Вероятно. если поставить паузы между запросами можно не попасть в бан? (и как вообще "разведывается" обстановка, чтобы понять: здесь можно спокойно парсить, а здесь тебе покажут сложную каптчу после первых 3 запросов).
Просто пишешь парсер без пауз, если все парсится, то защиты нет. По моему опыту могу сказать, что очень мало сайтов имеют защиту от множества запросов, в основном крупные проекты.
- Стоит ли парсить с десктопа (как делал автор)?
Конечно.
- Достаточно ли отправить заголовки похожие на те, что отправляет мой же браузер?
Тут надо смотреть на защиту, в основном хватает user-agent'а.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Python: множественная замена из списка, состоящего из RegExp. Как использовать нумерацию групп и флаги компиляции?
lcd1232 @lcd1232
def add(): result = text for pattern, replacement in SUBS: result = re.sub(pattern, replacement, result) return result

Ответ написан более трёх лет назад

3 комментария
3 комментария

Почему программа не выводит ничего в cmd?

lcd1232 @lcd1232

phrases={'hi':'hello','how are you?':'fine thanks','goodbye':'see you'}


def get_answer(key,phrases):
	return phrases.get(key)


def ask_user(phrases):
	while True:
		try:
			user_input=str(input('Введите сообщение:'))
			talk=get_answer(user_input,phrases)
			print(talk)
			if user_input=='goodbye':
				break 
		except KeyboardInterrupt:
			return "Уже уходите?"	
ask_user(phrases)

Все выводит. Может ты пишешь слово с большой буквы? Тогда можно использовать метод lower()

Ответ написан более трёх лет назад

3 комментария

Как перевести строку в условие?

lcd1232 @lcd1232 Автор вопроса

Нашел. Нужно использовать eval().

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Почему запрос не отправляется?

lcd1232 @lcd1232 Автор вопроса

Решил вопрос, оказывается надо отправлять следующий запрос в callback'е.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как в Xpath найти все элементы больше 1?

lcd1232 @lcd1232 Автор вопроса

Вопрос решен. Нужно использовать оси.
.//table[@id='RealDataGrid']/tbody/tr[1]/following-sibling::tr

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

VoidVolker
- 4 ответа
- 0 вопросов
Роман
- 3 ответа
- 0 вопросов
MVV
- 2 ответа
- 0 вопросов
shupike
- 0 ответов
- 2 вопроса
Zettabyte
- 2 ответа
- 0 вопросов
GavriKos
- 2 ответа
- 0 вопросов

Войдите на сайт