How to use Scrapy with AWS Lambda?

Question

febarabash @febarabash

Amazon Web Services

How to use Scrapy with AWS Lambda?

There are 2 applications: on flask, and on scrapy. Each of them is flooded into a separate lambda through zappa. The application faces have 3 endpoints, each of which is through SQS tiggerit scrap lambda. The trigger itself works fine, but there are 3 questions:

1) Is it possible to somehow remove the limit on the performance of lambda on scrapie? (I found an opportunity to increase the limit to only 15 minutes, during this time scrapy does not have time to collect all items)

2) Is it possible to flush through this sqm lambda without API Gateway through SQS, and whether it is possible to flood the application through zappa so that the api gateway is not created. Or do I need to fill in scrapes manually?

3) If you cannot trigger lambdas without API Gateway, then how can I return the correct response?

Now I have the following function:

def lambda_event(event, context):
  try:
    data = json.loads(event['body'])
    scrapy_settings = get_project_settings()
    scrapy_settings['ITEM_PIPELINES'] = {
      'sunbiz_spiders.pipelines.DynamodbPipeline': 300,
    }
    scrapy_settings['DOWNLOAD_DELAY'] = 0.5
    process = CrawlerProcess(settings=scrapy_settings)
    if data['spider_name'] == 'SearchByPersonSpider':
      spider = SearchByPersonSpider
    elif data['spider_name'] == 'GetDetailSpider':
      spider = GetDetailSpider
    else:
      spider = SearchByNameSpider
    process.crawl(spider, search_params=data['spider_name'])
    process.start()
  except Exception:
    pass

  return {
    'statusCode': 200,
    'body': json.dumps('All done.'),
  }

Config zappa:

{
    "production": {
        "app_function": "main.lambda_event",
        "aws_region": "us-east-1",
        "profile_name": "default",
        "project_name": "sunbiz-search-s",
        "runtime": "python3.6",
        "s3_bucket": "zappa-envjkpiz6"
    }
}

And when prompted I get list index out range werkzeug / test.py line 1146

Вопрос задан более трёх лет назад
345 просмотров

2 комментария

Подписаться 1 Средний 2 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Amazon Web Services

+1 ещё

Простой
Где NATятся адреса в кубернетесе?
- 1 подписчик
- 19 июн.
- 124 просмотра
2

ответа
Django

+1 ещё

Простой
Как проверять файлы в S3 хранилище?
- 3 подписчика
- 02 июн.
- 2409 просмотров
4

ответа
Amazon Web Services

Простой
Как оплачивать услуги AWS?
- 1 подписчик
- 21 апр.
- 255 просмотров
1

ответ
Amazon Web Services

Простой
Как завершить cервис на AWS?
- 1 подписчик
- 08 апр.
- 121 просмотр
1

ответ
Amazon Web Services

Простой
В чём может быть проблема при скачивании файла с S3 storage AWS?
- 1 подписчик
- 01 апр.
- 66 просмотров
1

ответ
Amazon Web Services

Средний
Какое техническое решение позволяет хранить неограниченный объём, но размер «объекта» — до 5Тб, откуда такое число?
- 1 подписчик
- 15 мар.
- 110 просмотров
2

ответа
Amazon Web Services

Средний
Как отредактировать процедуру в Amazon Redshift?
- 1 подписчик
- 24 янв.
- 23 просмотра
0

ответов
Системное администрирование

+2 ещё

Средний
Есть ли готовое решения для инкрементного резервное копирования бакетов s3 и если нет, то почему это никому не нужно?
- 2 подписчика
- 08 янв.
- 404 просмотра
3

ответа
Python

+1 ещё

Простой
Почему minio.error.S3Error: S3 operation failed; code: AccessDenied?
- 1 подписчик
- 08 дек. 2024
- 206 просмотров
1

ответ
Хранение данных

+1 ещё

Средний
Какой s3 сервис лучше для хранения часто используемых ресурсов для сайта?
- 1 подписчик
- 04 нояб. 2024
- 198 просмотров
1

ответ
Показать ещё Загружается…

Менеджер по корпоративным продажам (Cloud)

Wanted • Москва

До 200 000 ₽

LLMOps-инженер

ИННЕРАЙЗ • Москва

До 420 000 ₽

Ведущий инженер/архитектор по инфраструктуре

Wanted

До 300 000 ₽

Answer 1 · 2019-07-17 13:25:15

1. No, u can't increase time limit. Maybe u ok with increasing lambda memory? Or can u separate your lambda via AWS StepFunctions?
2. U do not need use zappa at all and u really can use sqs and lambda without api gateway
3. I have not got enough python expertise. Sorry

How to use Scrapy with AWS Lambda?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт