Ответы, понравившиеся пользователю alexpy5

Задать вопрос

Лайки

Какой SSD m.2 будет работать на этой материнке?

Drno @Drno

Будет на сниженной скорости. Главное что разъём подходил

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как синхронизировать несколько CRM?

Константин @fosihas
Автоматизации учета на 1С.

В поиске наберите «Шина данных» изучите информацию и решения. Как платные так и бесплатные

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как синхронизировать несколько CRM?

Dimonchik @dimonchik2013
non progredi est regredi

првильно думаешь, так и делай - через третью базу

ну а совсем по нормальному, конечно, отказаться от одной cRM
синхронизировать все, и отказаться

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как лучше настроить Sublime Text для работы на Python и какие пакеты лучше скачать?

dicem @dicem

https://techcave.ru/posts/103-nastroika-sublime-te...

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как получить доступ к Ajax контенту во время парсинга?

nirvimel @nirvimel

В общем случае, при помощи парсинга html, не возможно получить страницу в том виде в который ее приводят ее собственные джаваскрипты при загрузке потому, что парсер - не браузер, он не исполняет джаваскрипты.
В частных случаях можно вынуть из текста скрипта все urlы по которым идут ajax запросы, производить все эти запросы в своем коде и парсить результаты. Тут куча подводных камней - во-первых, параметры ajax запроса могут быть спрятаны в коде каким-нибудь не тривиальным образом, во-вторых нужно правильно выставить все заголовки запроса со всеми куками (которыми скрипты со страницы так же могут манипулировать), потом не забыть правильно задать referrer. В общем случае у скриптов на странице всегда остается возможность, используя какие-нибудь динамически меняющиеся параметры, запутать свою работу так, что для такой страницы создать парсер будет невозможно.
Радикально иной вариант - использовать настоящий браузер (через Sillentium, например), который исполняет все скрипты и, с точки зрения противоположной стороны, неотличим от живого пользователя. Это решает все проблемы с хитрыми ajax-ами. Но это уже совсем другой порядок объемов потребляемых ресурсов и скорости. Если, например, на самом дешевом vps (с 128 Мб памяти) на гигабитном канале можно парсить в 50-100 потоков. Даже из расчета по несколько секунд на ожидание + обработку каждой страницы получаем 10-20 расперсенных страниц в секнду. Теперь если перейти на Sillentium + Webkit, то 128 Мб уже не хватает для запуска даже одного потока. Если даже запускать все это на своем домашнем десктопе с гигабайтами памяти (с vps в качестве прокси), то можно получить максимум несколько расперсенных страниц в секунду. То есть парсинг через полноценный браузер не конкурент парсерам типа lxml + requests/liburl.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

VoidVolker
- 3 ответа
- 0 вопросов
rPman
- 2 ответа
- 0 вопросов
Sergynya
- 1 ответ
- 1 вопрос
Елисей Константинов
- 0 ответов
- 2 вопроса
Антон Антон
- 2 ответа
- 0 вопросов
15432
- 2 ответа
- 0 вопросов

Какой SSD m.2 будет работать на этой материнке?

Как синхронизировать несколько CRM?

Как синхронизировать несколько CRM?

Как лучше настроить Sublime Text для работы на Python и какие пакеты лучше скачать?

Как получить доступ к Ajax контенту во время парсинга?

Войдите на сайт