Как лучше хранить промежуточные данные парсера? NoSQL или файлы?

Question

Ваня Зюзгин @site2life

Как лучше хранить промежуточные данные парсера? NoSQL или файлы?

Добрый день!

Сразу хочу сказать, что вопрос возможно глупый, так как с noSQL никогда не работал и задал этот вопрос только из-за того, что NoSQL сейчас восходящий тренд, на который сложно не обращать внимание разработчику.

Есть идея написать небольшой парсер для себя. Работа парсера будет сводиться в просмотре каждой странице указанного сайта и сбора некоторых статистической информации о ней: title, header и так далее.

Что лучше использовать для хранения промежуточных результатов парсера? Это те данные, которые получаются после каждой страницы. Сейчас делаю все на файлах, но стал задумываться о правильности этого подхода.

Во время работы парсера идет только запись данных, чтение минимально. В дальнейшем возможно одновременный парсинг нескольких сайтов несколькими людьми.

Будет ли хоть какой-то выигрыш (в быстродействии или в снижении нагрузки на сервер), если я переведу работу на noSQL?

Вопрос задан более трёх лет назад
2971 просмотр

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 975 просмотров
6

ответов
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 224 просмотра
5

ответов
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 141 просмотр
1

ответ
PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- 25 апр.
- 218 просмотров
2

ответа
PHP

Средний
Как подключиться к серверу PHP и чтобы отображались исполнители?
- 1 подписчик
- 24 апр.
- 243 просмотра
3

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 311 просмотров
2

ответа
PHP

Простой
Не работает яндекс ссылка прямая?
- 1 подписчик
- 07 апр.
- 212 просмотров
1

ответ
PHP

Простой
Почему слетает сайт при загрузке обработчика?
- 1 подписчик
- 02 апр.
- 236 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Авторизация вконтакте как настроить?
- 2 подписчика
- 26 мар.
- 391 просмотр
1

ответ
PHP

Простой
СТРОКА — где искать ее истоки на сайте?
- 1 подписчик
- 11 мар.
- 388 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2014-05-18 11:41:36

вообще неважно куда класть эти данные можно и в реляционную БД mysql, можно и в nosql, главное чтобы данные в базе лежали, где их можно по быстрому найти и извлечь.

Answer 2 · 2014-05-18 11:43:48

А если каждый раз после парсинга страницы делать INSERT в MySQL, не сильно большая нагрузка будет при обработке 2000 страниц?

Как лучше хранить промежуточные данные парсера? NoSQL или файлы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт