Пишу парсер новостей.
Сейчас в бд такая структура:
Таб1: Таблица со списком сайтов-источников. Основные поля: ссылка на ленту новостей, название, категория, страна, регион, ссылка на пхп с методом парсинга, селекторы для парсинга и кое-какие ещё.
Таб2 - ТабN - таблицы с новостями для каждого источника. Поля одинаковые: заголовок, картинка, ссылка на страницу с новостью. Сейчас пытаюсь понять, как прикрутить дату и время, так что ещё и это поле появилось.
На сайте новости отображаются по категориям (страна->регион->категория)
Тут столкнулся с мнением, что в моем случае лучше не разбивать новости по источникам, а закидывать их в одну таблицу.
Внимание, вопрос: а как лучше? Уважаемые знатоки!
Какие плюсы и минусы моей текущей ситуации и сведения всех новостей в одну таблицу? (Но, как я понимаю, регионы и страны все равно лучше разделить.)
Про партиционирование мне тут тоже написали, так что я немного в курсе.
Но все равно пока не уверен, объединять или нет.
Для меня пока преимуществ от объединения больше: проще парсинг, проще выборка для отображентя на сайте.
Но вдруг я чего-то не знаю? И человек, который мне это посоветовал, чего-то не учёл.
Просто, как я понимаю, таблица со всеми новостями, даже из одного региона, будет дофига большой.
И ещё один нюанс.
Хочу ввести возможность юзерам закидывать свои источники.
Грубо говоря, хочу я следить за новостями маленькой сельский школы - добавил сайт и получаю новости и из этого источника. Тогда ведь все равно разные таблицы будут.... А в одной выборке ведь показывать. Или тогда для каждого юзера делать свою таблицу источников и на сайте - отдельный раздел с ними?
Короче, путаюсь я... Изучаю веб и бд с нуля и сам. А идею придумал не очень простую для такого как я, видимо.
Вот скрины моей текущей ситуации: