Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Андрей
@aoberon
Database Developer
Сетевое администрирование
Ruby
Crawling
Есть ли альтернатива обычным TCP сокетам для мультипоточного парсера?
Задача: максимально быстро собирать информацию о ~100 млн. страниц на разных доменах через метод HEAD.
Сейчас парсер написан на ruby, использует HTTPClient и многопоточность.
Может, есть более быстрые библиотеки для таких задач?
Вопрос задан
более трёх лет назад
14873 просмотра
Комментировать
Подписаться
4
Оценить
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
2
Станислав
@crackedmind
web-developer
1) Запустить на jruby/rubinius чтобы получить настоящую многотредовость для распределения потоков по ядрам, а то GIL мешает
2) Запустить несколько процессов
Ответ написан
более трёх лет назад
Комментировать
Нравится
2
Комментировать
Facebook
Вконтакте
Twitter
Сергей Протько
@Fesor
Full-stack developer (Symfony, Angular)
Ну начнем с того что HTTP в качестве транспорта использует TCP (во всяком случае со стороны сервера), так что... нет.
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Компьютерные сети
+1 ещё
Средний
Как роутер использовать как ПРОКСИ?
2 подписчика
27 мар.
2580 просмотров
4
ответа
Компьютерные сети
+1 ещё
Простой
Настройка подсети, проблемы с соединением между устройствами?
2 подписчика
24 мар.
2115 просмотров
1
ответ
Сетевое администрирование
+1 ещё
Простой
Причина потери доступа в интернет по Ethernet через Keenetic Hopper?
2 подписчика
22 мар.
134 просмотра
3
ответа
Сетевое администрирование
+1 ещё
Средний
Нарисованная дверь с динамическим ip, или почему пакеты не приходят ко мне?
1 подписчик
22 мар.
218 просмотров
5
ответов
Linux
+3 ещё
Средний
Как обойти блокировку 80 и 443 порта Ростелеком?
1 подписчик
20 мар.
1021 просмотр
8
ответов
Сетевое администрирование
+1 ещё
Средний
Как правильно организовать вывод сервисов в мир?
2 подписчика
17 мар.
915 просмотров
2
ответа
Сетевое администрирование
+3 ещё
Средний
Как настроить Mikrotik + AD CS для работы IKEv2?
2 подписчика
12 мар.
759 просмотров
2
ответа
Сетевое администрирование
+1 ещё
Простой
Как правильно настроить в режиме удалённого моста Cronyx e1-l?
2 подписчика
12 мар.
103 просмотра
1
ответ
Компьютерные сети
+2 ещё
Средний
Как избавиться от потерь при организации моста на сетевых адаптерах?
1 подписчик
10 мар.
2267 просмотров
2
ответа
Сетевое администрирование
+1 ещё
Простой
Как принимать запросы от яндекс форм у себя на сервере?
3 подписчика
08 мар.
350 просмотров
0
ответов
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Системный инженер с базовыми навыками DevOps
Эмитех
•
Санкт-Петербург
от 170 000 ₽
Программист 1С
Wanted.
До 180 000 ₽
Инженер по администрированию автоматизированной системы оптимизации радиосети
Quickly Search
•
Нижний Новгород
До 150 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама