@RomanGorbatko
PHP, Python, NodeJS, Swift

Как правильно парсить Facebook?

Всем салют ✌️

Есть люди кто умеет парсить Facebook?

Задача:
доставать с фб фоточки по ключевикам

Мой инструментарий:
Protractor + ChromeWebDriver
после логина храню куки, сбрасываю их рандомно в диапазоне 10-15 дней

Lifecycle ботa:
0. протрактором открываю хром
1. иду на главную фб
2. если нету куков – логинюсь, если есть – иду в страницу профиля
3. в поиске пишу нужный ключевик
4. перехожу на вкладку "фото"
5. указываю параметры фильтра (локейшн, дата)
6. жду пока загрузится результат
7. скороллю результат в саммый низ (что бы собрать все фотки за указанную дату)
8. выгребаю ссылки
9. закрываю хром

Проблемы:
1. новые, свежие аккаунты блочит практически сразу
2. оставил свой личный аккаунт, сначала ругалось, мол "вы зашли отуда-то, вы ли это?", но это длилось не оч долго, пару раз заапрувил и прекратилось. спустя неделю поиск у меня тупо перестал работать. на любой запрос пишет "not found", думаю, мне локнули поиск, временно или не – хз. написал в саппорт, дал тикет в комьюнити, пока что жду ответа.

Идеи/мысли:
1. думаю, нужно делать бота "живым", т.е., помимо того, что он просто должен ходить по поиску, нужно его пускать гулять по ленте новостей, мб, лайкать что-то, мб, добавлять друзей и т.д.
2. мой бот работает, примерно, каждые 20 минут. т.е., в стуки он запускается примерно 24 * (60/20) = 72 раза. что важно: на каждый процесс открывается новое окно хрома (считай, новая сессия) и после сбора всего нужного – закрывается. думаю уменьшить число запросов, примерно в 2 раза, в пределах 30-40 оставить. к тому же, попробовать сделать всю работу в одном окне браузера и не закрывать его. каждый новый процесс открывать в новой вкладке, после ее закрывать.

Собственно, что я и ищу и почему пишу:
хочу обсудить моего зверька с людьми которые делали что-то подобное, мб, не обязательно для фесбука с целью получить информацию о каких-то скрытых возможностях, хаках, лучших практиках.

Предварительно, спасибо!
  • Вопрос задан
  • 3074 просмотра
Пригласить эксперта
Ответы на вопрос 2
@megastudio
Есть решения онлайн-типа, такие как: Улитка, fb-parser.com, aparser.com и.т.п. Если вам не нужны файлы excel формата с контактами из FB, то рекомендую использовать API, которое, правда было лишь у Улитки. На данный момент доволен вторым сервисом из выше перечисленных.
Ответ написан
Комментировать
dimonchik2013
@dimonchik2013
non progredi est regredi
отпечаток браузера

но вообще у ФБ сильный ML, у вконтактов всяких тоже,но другие задачи

поэтому с ФБ / Инстой сложно
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы