Как можно предиктить дату регистрации при массиве данных?
Допустим у меня есть некоторые данные в формате:
{ id: 1, date: unixdata }
И эти данные которые у меня есть это id с датами в шаг примерно 50 000 000. И для этого есть линейная прогрессия но она не подходит из за очень больших перепад в регистрации id'шников. Также есть интерполяция но при этом погрешность при таких данных 18 часов и 37 минут. При возрастании id погрешность будет только расти.
rPman, нет, по интерполяции через lowest и highest значениям рядом с id и у каждого id есть дата, таких значений от 1 до 1 миллиарда с шагом в 50млн и если нужно найти дату у 25млн id мы сравниваем самый маленький (id1) и самый большой (id50млн), точнее их значение (два поля id и date), и с помощью интерполяции получаем приближенное число. Получается погрешность в виде 12-18 часов из за неравномерного роста даты у id'шников
A1ikse1, что это за данные? Правильно ли я понимаю, что регистрация была бы в данных с id 0, но ее нет. И эти точки с даты регистрации примерно линейно падают, пропуская какие-то айдишники?
Очень запутанный вопрос, сложно сформулирован, приходится додумывать.
Например, "дата при массиве" по идее означает единственную дату на весь массив, но из контекста следует, что дата для каждого элемента массива. И таких запутывающих моментов много. Советую переформулировать так, чтобы было чётко и однозначно.
Если сайт - региональный то люди регистрируются в дневное время. И здесь например
анализ Фурье событий по суткам может показать наиболее вероятный пик.
Я так понимаю, что массив данных представляет монотонно возрастающую последовательность, формально колеблющуюся вокруг прямой или достаточно гладкой, почти "прямообразной", кривой. Такие последовательности очень неплохо интерполируются. Например, квадратными или кубическими сплайнами. Причём для достаточно точной интерполяции не требуется обрабатывать весь массив данных, достаточно обработать сравнительно узкое окно, погрешность интерполяции при этом возрастает незначительно.