Ответы пользователя Walt Disney по тегу «Базы данных»

Почему не работает запрос в БД?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

$NameVideo = $_POST ['name'];
$idVideo = $_POST ['message'];
echo $NameVideo;
$db = mysql_connect("localhost","d9",774272722");
mysql_select_db("dlx",$db);
mysql_query("SET NAMES utf8");
$resultat = mysql_query("INSERT INTO `dlx`.`videoByMe` (`id`, `DenumireaVideo`, `VideoMixID`) VALUES (NULL, '$NameVideo', '$idVideo')"); // тут был бардак с кавычками
if(!$resultat){
 var_dump(mysql_error()); // тут скорее всего ругнётся, что id не может быть NULL
 exit();
}
mysql_close($db);

Ответ написан более трёх лет назад

Комментировать

Где можно скачать самую большую MySQL англоязычную БД городов мира?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

GEO NAMES каждый город содержит официальное английское название + неофициальные варианты транскрипции + официальное название на местном языке + куча другой полезной информации.
имеет около 100 источников, постоянно корректируется. Содержит города с населением от 1000 человек.

Ответ написан более трёх лет назад

Комментировать

В чем лучше хранить данные для быстрого доступа?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

в лоб,
писать данные в суточные или недельные таблицы, при их наполнение перекидывать данные в общую таблицу и сразу раскладывать по таблицам содержащим уже агрегированные данные.

Соответственно результаты будут состоять из двух запросов: простого селекта по уже агрегированным данным + сам агрегирующий запрос по суточной таблице.

Т.е. если вы, каким либо способом, избавитесь от запросов по всему датасету в онлайне, то эта схема проработает у вас очень долго (до полного исчерпания аппаратных ресурсов) в независимости от того какую БД вы будете использовать.

Ответ написан более трёх лет назад

Комментировать

Сохранение счетчиков из кеша в базу данных, алгоритм?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

1) можно просто по крону выполнять в консольную команду типа cut access.log -d' ' -f 7 | sort | uniq -c и сбрасывать результат в базу.
2) мемкеш не будет удобен, рано или поздно он начнёт сам удалять счётки, по тайм ауту или по нехватке памяти и это надо иметь ввиду, соответственно и решение должно быть рассчитано на потери. Т.е. например если в мемкеш ключ пуст, то забираем значение из базы и кладём в него, для отображения тоже используем значение из мемкеша, при запросе страницы инкрементируем ключ в мемкеш. А вот значение в базе обновляем например из методом описным в первом пункте. Соответственно играясь с временем жизни записей в мемкеше и частотой парсинга логов будем регулировать возможные лаги в значениях счётчика.
3) парсинг логов можно заменить на очереди типа rabbitmq
4) в большинстве случаев можете не париться и вынести счётчики в redis.io

Ответ написан более трёх лет назад

Комментировать

Подобрать базу под задачу проекта?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

1) Забиваете на SQLite и SQL Server, первая не про то, вторая под windows.
2) как бы вы не спроектировали базу, и что бы вы не выбрали Mysql или Postgres, отличаться будет только запрос на индексацию для сфинкса, который в любом случае будет отдавать вам primary key нужного вам документа, а выборка по PK в любой базе элементарная операция. Кеширование не нужно, сфинкс ваши максимальные 5 000 000 слов даже не заметит.

на laravel вы видимо будете использовать ORM, поэтому для вас, что postrgers что mysql. Ну разве что mysql более коробочный.

Ответ написан более трёх лет назад

1 комментарий

Как обеспечить непротиворечивость данных в клиент серверном приложении?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

В общем случае:
Если клиенту нужно отправить данные для обработки и показать уже обработанные данные то очевидно их стоит вернуть.
Если клиенту не нужны данные, а нужно только совершить какое то действие, то он отправляет данные необходимые для этого действия и в ответ получает только статус.

Случай на которым вы акцентируете внимание, когда большой объём сырых данных обрабатывается и сохраняется на сервере, а потом в обработанном виде отображает на клиенте. Тут нужно смотреть по ситуации, клиент может быть слабый по производительности и скорости интернета, а может и нет, соответственно на сервер можно ждать обработанные данные с сервера, а можно на него отправлять уже обработанные.

Ответ написан более трёх лет назад

Комментировать

Как поисковые системы ищут куски слов в своих поисковых деревьях? Или у них деревья из кусков слов?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

N-граммы, потом статистика опечаток и ошибок, потом корректировка через анализ поведения пользователя в выдаче и на сайтах на которые он перешёл.

Тут надо понимать, что чем больше информации тем проще решить эту задачу. На не большом сайте можно решить проблему с неверной раскладной и небольшое количество вариантов ошибок и опечаток и всё,у поисковиков всё на порядок круче.

Ответ написан более трёх лет назад

Комментировать

Как вытащить последнюю запись из таблицы когда одна запись ссылается на другую в этой же таблице?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

можно, гуглите словосочетания Adjacency list, Matherialized Path, Nested sets, Closure Table не забывая подставлять слово MySQL, найдёте кучу описаний и кучу готовых реализаций.

Всё названное это оптимизированные варианты хранения деревьев в реляционных БД.

Ответ написан более трёх лет назад

Комментировать

Как создать поиска по сайту используя геолакацию, где юзер использует радиус поиска?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

На маленьких радиусах можно использовать евклидову геометрию.
На больших через формулу, описанную например тут ru.scribd.com/doc/2569355/Geo-Distance-Search-with...

Что бы всё не тормозило используйте геоиндекдсы в БД они специально для этого придуманы.

Ну и надо понимать, что поиск в окружности от координат города смысл имеет не всегда, например Волгоград длиной 60 км, а шириной максимум 5 км.

Ответ написан более трёх лет назад

Комментировать

Зачем нужна нормализация БД MySQL?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

Нормализация нужна для борьбы с избыточностью. т.е. данные не дублируются и связаны только внешними ключами.
Видимо это было очень важно когда размер HDD был 10 мегабайт. Текущая практика показывает, что полностью нормализованная база работает очень медленно, т.к. обледенения данных это дорогая операция. Так же вы верно подметили относительно роста сложности запросов.
Однако в нормализации обновляемых данных есть и жирный плюс, вам не надо обновлять/удалять и вставлять, одни и те же данные в куче таблиц. Ведь это тоже сложно, держать в голове всё, что нужно обновить, что приводит к ошибкам. Также решает вопросы сложности разгуливания операций изменения данных когда операция прошла не полностью.

Поэтому оптимальность где то посередине.

Так же не забываете, что нормализованные таблицы гораздо проще проецировать на модели в языках программирования.

Ответ написан более трёх лет назад

Комментировать

Сколько максимум строк можно содержать в таблице без больших потерь скорости выборки из нее?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

Количество не играет роли.
Играет роль:
1) Влезают ли индексы в отведённую для них память.
2) Хватает ли IO на диске для записи данных.
3) Хватает ли процессора для перестройки индексов.

Соответственно когда один из этих параметров исчерпывается, производительность проседает.

Ответ написан более трёх лет назад

Комментировать

Какую key/value базу данных выбрать для словаря?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

В общем случае REDIS это то что доктор прописал.
Если задача и язык позволяет, то можно поиграться с judy array

Ответ написан более трёх лет назад

3 комментария

Как сделать анализатор и поиск по прямому тексту?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

Всё же sphinxsearch.

В нём достаточно инструментов для решения этой задачи. Словари нужны в любом случае для построения выборки результирующего документа/страницы или их множества. Так же обычно нужны небольшие словарики для разбора направления ограничения выборки, всякие "до/от, больше/меньше, старше/младше, дальше/ближе, в/из и т.п."

Неоднократно решал задачу поисковых запросов на естественном языке к различным структурированным данным. И замечу, что если источником запроса служит текстовое поле то пользователи тупят, не пользуются этим т.к. хотят видеть сложную форму с кучей селект боксов галочек и т.д. Ни кто не хочет писать: "чёрный лексус 2 литра не старше 2000 года". Зато если источник ввода это распознанная устная речь на мобильнике то это работает.

Ответ написан более трёх лет назад

Комментировать

Как хранить токены пользователя?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

Вы не должны их хранить.
Пользователь даёт доступ вашему приложению с таким то id доступ к таким то своим данным. Всё, пока пользователь не отзовёт права у вашего приложения, он может использую access key приложения получать доступ к тому, что он вам разрешил.

Выше речь про приложения vk и fb, в standalone-приложениях немного иначе но суть также.

Ответ написан более трёх лет назад

Комментировать

Как хранить время последней активности пользователя в MySQL?

Walt Disney @ruFelix

Предсказание будущего по руке, таро, кофе.

Общее для всех mysql:
Проверить какой запрос отрабатывает система если replace то плохо если update или insert on duplicate key update - то ок.
Если в action_history есть индексы кроме примари кей то их скорее всего стоит убрать т.к. вероятно запросы ( сортировки или агрегации) по этим полям будут приводить в любом случае к фулскану и индекс не будет иметь смысла, а при апдейте перестройка будет постоянно всё класть.

Для Maria: убедиться, что в Maria XtraDB не сломана построчная блокировка (всё таки опыт продакшена у марии неё вялый ). Потом вызывает опасение реализация внешнего индекса в таблицах разного типа, возможно это как то может ломать построчную блокировку. Если у вас лок всей таблицы разберитесь откуда, так не должно быть

В общем и целом, поразмышлять что INSERT DELAYED VALUES (1,2,3),(..,..,..),(N,N,N) для записи всех действий будет работать заметно веселее особенно без индексов и в одном потоке, а после некоторых шаманств с агрегацией по крону ещё не будет деградировать от распухания. Что можно про крону парсить access.log (понимать что он не рилтайм), в этом случае будет одна пачка апдейтов допустим раз в минуту и user_id будет заапдейчен только один раз, это будет пожалуй самой простой реализацией задачи упорядочивания и фильтрации потока апдейтов к mysql. Парсинг лога можно заменить на RabbitMQ, или написать своего демона который будет висеть на соке и рулить.

Но смотрите если у вас задача в стиле показать последние 10 пользователей сделавших, что то, то это решается сильно иначе.

Ответ написан более трёх лет назад

2 комментария

Войдите на сайт