Как провести анализ кривой?

Question

Иван Курнаков @Skinner2170

Как провести анализ кривой?

Суть вопроса такова:
Есть набор кривых(графики) у которых можно узнать x и y. Требуется найти в этом наборе графики, не удовлетворяющие определенному виду, который сложно задать математически кривой. Какими способами это возможно сделать и где о них можно почитать?

Решал подобную задачу полиномиальной регрессией с использованием библиотеки alglib с дописыванием к ней подсчета R2, но хочется узнать о других методах решения.

Вопрос задан более трёх лет назад
465 просмотров

4 комментария

Подписаться 3 Оценить 4 комментария

Роман @idap

Расшифруйте, пожалуйста, что такое "вид графика"? Это словесное описание: "графики должны иметь экстремум в точке А", "функция монотонна на (а, б)" и т.п. или нечто другое?

Написано более трёх лет назад
Алексей Кулаков @carbon88

Кстати да, хотелось бы понять что это такое этот ваш определенный вид. Можно же по разному задавать характеристики, например через какие-нибудь экстремумы, критические точки, диапазоны их изменения, и прочее

Написано более трёх лет назад
Иван Курнаков @Skinner2170 Автор вопроса

Роман, Алексей Кулаков:
В целом графики разнородные и сказать, что у них, например, должно быть не больше n-экстремумов - нельзя.
можно сказать, что это - плохо
imgur.com/KftQOzJ.png
и это тоже плохо i.imgur.com/jBXw0R0.png

Это вообще из рук вон плохо
i.imgur.com/5lmHSZo.png

А вот это и это - хорошо
i.imgur.com/E35no1o.png
i.imgur.com/bXVFKZj.png

При этом могут быть графики, содержащие 2 локальных минимума(или\и) максимума и быть хорошими.

Начал читать в статьи про кластеризацию и классификацию, может с такой точки зрения можно будет решить.

Написано более трёх лет назад
Иван Курнаков @Skinner2170 Автор вопроса

Задаются графики набором точек.
Если более подробно, то набор точек аппроксимируется сплайном, после чего строится.
Для анализа интересны именно аппроксимированные точки т.к. интересуют именно вопросы отображения по-сути.

Написано более трёх лет назад

Решения вопроса 2

5 комментариев

Роман @idap

Интересно ещё, что функции имеют разные области определения: где то от 0 до 1100, а где то от 0 до 100. Насколько это важно? В общем, вы, будучи экспертом, должны начать со словестного описания того, что такое "хорошо" и что такое "плохо" – это нужно как для того, чтобы построить алгоритм классификации самому (п.1), так и для того, чтобы построить вектор-признак, по которому сможет обучаться какой-то алгоритм машинного обучения.

Написано более трёх лет назад
Иван Курнаков @Skinner2170 Автор вопроса

Роман: можно даже сказать еще более обще - области определения разные не только по оси x, но и по оси y, сами значения роли не играют, важен вид графика.
Сейчас в раздумьях, как я могу сформулировать хотя бы словесно признак "хорошо", "плохо". Думаю, что проще, возможно, будет попробовать разбить на кластеры и посмотреть, какие же они получаться и если подойдут под "хорошо", "плохо" на этом и остановиться.

Написано более трёх лет назад
Иван Курнаков @Skinner2170 Автор вопроса

дополню, что не "вид графика", а скорее "форма" кривой

Написано более трёх лет назад
Роман @idap

Иван Курнаков , тогда могу ещё вам посоветовать выполнить нормализацию, перед любыми вычислениями. То есть надо считать что область определения у всех графиков [0, 1], и область значений тоже [0, 1]. Попробуйте выполнить такую нормализацию, и изобразите все-все ваши кривые на одном графике, но разным цветом: хорошие графики зелёным, а плохие – красным (например). Это должно помочь вам (и нам, если вы поделитесь с нами) понять и описать различие плохих от хороших кривых.

Написано более трёх лет назад
Роман @idap

Иван Курнаков и ещё про кластеры. А как вы хотите разбивать на кластеры? Алгоритмы кластеризации работают с векторами, так что вам нужно ваши кривые сначала превратить в векторы... а когда у вас есть векторы, то можно уже и не кластеризовать, а обучаться.

Написано более трёх лет назад

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C#

Простой
Как добавить обработчки каллбеков в Telegram.Bot?
- 1 подписчик
- 5 часов назад
- 16 просмотров
0

ответов
C#

+1 ещё

Средний
Почему свойство IsVisible всегда возвращает false (C# WPF)?
- 1 подписчик
- 10 авг.
- 90 просмотров
0

ответов
C#

Средний
Ошибка сценария в веб браузере c#. Почему?
- 1 подписчик
- 06 авг.
- 103 просмотра
2

ответа
C#

+1 ещё

Средний
Где найти чистые исходники мобильного сервера SAMP / CRMP?
- 1 подписчик
- 06 авг.
- 140 просмотров
1

ответ
C#

+1 ещё

Средний
Как получить упорядоченный список элементов графического интерфейса внешнего приложения на c#?
- 2 подписчика
- 05 авг.
- 275 просмотров
2

ответа
C#

+1 ещё

Средний
Как сделать систему сохранений в Unity?
- 1 подписчик
- 05 авг.
- 127 просмотров
1

ответ
C#

Простой
Как лучше всего возвращать ответы?
- 1 подписчик
- 31 июл.
- 123 просмотра
1

ответ
C#

Средний
Как работает TaskCompletionSource, когда возникает исключение?
- 1 подписчик
- 29 июл.
- 95 просмотров
2

ответа
C#

+1 ещё

Простой
Как спроектировать домены?
- 3 подписчика
- 26 июл.
- 162 просмотра
0

ответов
Высшая математика

Средний
Объясните доказательство теоремы из книги по матанализу?
- 1 подписчик
- 25 июл.
- 75 просмотров
0

ответов
Показать ещё Загружается…

C# разработчик

AMBIM

от 240 000 до 300 000 ₽

Разработчик C# (WPF, EF+SQL) | Удаленно | Автоматизация ЖД

Railog

от 180 000 до 200 000 ₽

Руководитель группы аналитиков системного анализа (Team Lead)

PromIT • Екатеринбург

от 180 000 до 220 000 ₽

Расшифруйте, пожалуйста, что такое "вид графика"? Это словесное описание: "графики должны иметь экстремум в точке А", "функция монотонна на (а, б)" и т.п. или нечто другое?
Кстати да, хотелось бы понять что это такое этот ваш определенный вид. Можно же по разному задавать характеристики, например через какие-нибудь экстремумы, критические точки, диапазоны их изменения, и прочее
Роман, Алексей Кулаков:
В целом графики разнородные и сказать, что у них, например, должно быть не больше n-экстремумов - нельзя.
можно сказать, что это - плохо
imgur.com/KftQOzJ.png
и это тоже плохо i.imgur.com/jBXw0R0.png

Это вообще из рук вон плохо
i.imgur.com/5lmHSZo.png

А вот это и это - хорошо
i.imgur.com/E35no1o.png
i.imgur.com/bXVFKZj.png

При этом могут быть графики, содержащие 2 локальных минимума(или\и) максимума и быть хорошими.

Начал читать в статьи про кластеризацию и классификацию, может с такой точки зрения можно будет решить.
Задаются графики набором точек.
Если более подробно, то набор точек аппроксимируется сплайном, после чего строится.
Для анализа интересны именно аппроксимированные точки т.к. интересуют именно вопросы отображения по-сути.

Answer 1 · 2015-05-26 09:38:23

Насколько я понимаю, плохо – это когда разница между минимумом и максимумом очень большая, хорошо – когда эта разница маленькая (по крайней мере на конце графика). Также имеет значение гладкость.

Я вижу здесь два варианта решения:

1. Описательный.
Вы сами формулируете критерии "хорошести", и находите способ её измерения. То есть нужна функция L: "множество функций" -> [0, 1], и если L(f) = 1, то график f хороший, если L(f) = 0, то график f плохой.

2. Машинное обучение.
Здесь вам всё равно нужно описать какие-то критерии функции, и для каждой функции соорудить вектор-признак. Например, вектор-признак может содержать информацию (значение максимума; значение минимума; разность между макс и мин; какой-то показатель гладкости (может быть вычислить производную в каждой точке, и смотреть чтобы производная менялась не сильно); площадь подграфика и т.п.).
Затем, собираете выборку графиков, для них получаете выборку векторов-признаков, и дальше можете использовать алгоритмы классификации: логистическая регрессия, нейронные сети, SVM и т.п. Успех данного подхода зависит от того, насколько хорошо придуманный вами вектор-признак будет описывать ваши же критерии.
Результатом будет та же функция L: "множество функций" -> [0, 1], только, возможно, вы не сможете осмыслить её работу (не будет словестного критерия, как в п.1), но она также будет выдавать на выход является функция хорошей или плохой.

Answer 2 · 2015-05-26 09:05:20

Тут нужно определить критерии "плохой\хороший", потому как по графикам не особо заметно разницы, нужно понимать, что если результат не очевиден человеку, объяснить это компьютеру будет еще тяжелее.
Если таких критериев нет нужно их найти, что можно следать:

1. Отобрать как можно больше "плохих" графиков и отдельно "хороших"
2. Нормализовать, то есть привести их виду, где минимальное и максимальное значение по осям будет одно и тоже (если конечно нет критерия вида много по Y - плохо и т.п.)
3. На нормализованной плоскости построить сплайн или просто сразу апроксимировать функции таким образом чтобы получить для каждого графика одинаковый набор значений y для одних и тех же X, к примеру на нормализованной плоскости через каждые n единиц по X получить значение Y.
На выходе получится матрица Xmax*Ymax, где каждой на пересечении будет 1 либо 0
Данные матрицы можно использовать для обучения нейронной сети.

или матрицы не строить а оставить в виде последовательности значений Y, потом сравнивать вектора "плохих" графиков с векторами "хороших",
для сравнения можно будет использовать все что в голову взбредет, то есть любые математические функции, какая ни будь даст достаточно статистически различимый результат. Кстати полученное на п.2-3 можно использовать и для кластеризации.

Как провести анализ кривой?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт