Какой стек технологий используется при частых опросах больших баз данных?

Question

evkaky @evkaky

Highload

Какой стек технологий используется при частых опросах больших баз данных?

Стало интересно, как реализовывают подобные задачи:
Есть реляционная БД, в ней миллионы записей.
Нужно обеспечить очень быстрый доступ к этим записям, учитвая, что запросы будут очень частыми и сложными (фильтр по многим полям).
Допустим, пару тысяч человек на веб интерфейсе клацают по кнопкам, которые формируют фильтр запроса и тут же получают какой-то ответ.
Реляционные БД типа Oracle, PostgreSql справляются с такой задачей?
Или мой вопрос не корректный и тут нужно говорить о целой структуре сервер/серверный язык/что-то еще?

Вопрос задан более трёх лет назад
2534 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Учебный центр IBS

ARC-008 Проектирование высокопроизводительных приложений и инструменты ИИ

1 неделя

Далее
Яндекс Практикум

Архитектура программного обеспечения

6 месяцев

Далее
Devhands

Производительность и масштабируемость

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Node.js

+3 ещё

Средний
Как организовать паралельную и последовательную обработку задач по условиям?
- 1 подписчик
- более года назад
- 218 просмотров
0

ответов
Linux

+2 ещё

Простой
Как поймать, что дает высокий Load Average?
- 3 подписчика
- более года назад
- 881 просмотр
2

ответа
PHP

+2 ещё

Средний
Какую архитектуру парсинга маркетплейса выбрать?
- 1 подписчик
- более двух лет назад
- 368 просмотров
1

ответ
Highload

+1 ещё

Простой
Существует ли практика выставления приоритета запросу в очереди сообщений?
- 4 подписчика
- более двух лет назад
- 1234 просмотра
1

ответ
Python

+2 ещё

Простой
Что выбрать в качестве промежуточного хранилища в проекте?
- 6 подписчиков
- более двух лет назад
- 2618 просмотров
3

ответа
.NET

+3 ещё

Простой
Как реализовать атомарное обновление 2 файлов?
- 4 подписчика
- более двух лет назад
- 1063 просмотра
3

ответа
Базы данных

+3 ещё

Сложный
Какие есть инструменты и решения для экстремально быстрой online-аналитики потоковых данных?
- 4 подписчика
- более двух лет назад
- 987 просмотров
3

ответа
Nginx

+1 ещё

Простой
Тест nginx -- сколько сообщений в log без потерь?
- 9 подписчиков
- более двух лет назад
- 3253 просмотра
1

ответ
Highload

Простой
Как создать новостную ленту подписчиков на высоконагруженных веб-проектах?
- 1 подписчик
- более двух лет назад
- 66 просмотров
0

ответов
Linux

+1 ещё

Простой
Access логи. Нужны ли на серверах с большой опсещаемостью?
- 1 подписчик
- более двух лет назад
- 179 просмотров
4

ответа
Показать ещё Загружается…

Answer 1 · 2014-04-11 13:38:19

Тут нужно говорить о типе информации и о типе запросов. Ну а также об архитектуре всей системы.

Другими словами, при одной организации базы не будут справляться, при другой - будут.
Например, есть бооооольшая таблица с ФИО и паспортами и адресом жительства (город, дом, квартира) , есть индексы по ФИО, номеру паспорта и адресу. Такая база будет нормально работать при поиске конкретных записей, но если мы хотим сделать выборку по городу, то можем потерпеть неудачу из-за большого количества записей в таблице.
Соответственно можно попробовать оптимизировать - разбить таблицу по городам. Каждуму городу отдельную таблицу - тогда выборку по ФИО и номеру паспорта придется делать запросом ко многим таблицам сразу, но при этом выборка по городам будет значительно быстрее.
Можно еще оптимизировать - создать отдельную таблицу по ФИО и паспорту с указанием таблиц городов, а можно отдельно сделать таблицы по каждой букве алфавита.
И так далее.. Это называется нормализацией информации. Но все зависит от типов запросов.
Нельзя, увы, сделать базу под все запросы сразу... Но и для этого есть OLAP-кубы, но это отдельная песнь...
И да, и оракл и сайбейс и ростгрес могут как справляться, так и несправляться - как данные будут организованы, и как к ним будут запросы строиться. Все эти базы нормально работают с миллионами записей в таблицах, весь вопрос как мы этими таблицами будем оперировать...

Что касается архитектуры: то очень часто нужно кешировать какую-то информацию вне баз данных - например на промежуточных серверах, архитектура приложений 3tier или multitier en.wikipedia.org/wiki/Multitier_architecture (а в русской версии этой статьи фигня написана)

Какой стек технологий используется при частых опросах больших баз данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт