@Kotsubid
Изучал front-end, теперь изучаю SQL/python

Как предсказать время поломки/срок службы оборудования?

Доброго дня.
Есть небольшой набор данных о случаях поломки оборудования, т.е. задокументировано:
1. Дата/время поломки
2. Тип поломки
3. Какое оборудование сломалось (идентификация экземпляров по модели и серийнику);
Всего 130 случаев поломок, некоторое оборудование фигурирует больше 1 раза.
Также есть данные около 160 единиц оборудования вида: модель, серийник, год выпуска, счетчик проделанных операций.
Гипотеза такая, что вероятность поломки увеличивается в зависимости от счетчика, и времени эксплуатации (очевидно).

А вот дальше уже затык.
Есть небольшой опыт построения модели на платформе Azure, но тогда решалась задача классификации, а тут, как понимаю, нужен регрессионный анализ. Как лучше скомпоновать данные для машины? Какой лучше алгоритм выбрать.
Хочу попытаться для каждого оборудования (модель/серийник) предсказать его срок службы или время следующей поломки и/или тип этой поломки исходя из "истории болезни" оборудования, но ума не приложу, как машине лучше скормить эти данные.

Будет уже неплохо, если подскажете, что почитать по этой теме, может быть у кого-то был успешный опыт решения такой задачи.
  • Вопрос задан
  • 1358 просмотров
Пригласить эксперта
Ответы на вопрос 3
begemot_sun
@begemot_sun
Программист в душе.
Нужно почитать теорию надежности.

Как выше написали.
Вероятность поломки может быть описана приближенно такой формулой:
p(t) = a/(b*t) + c*exp(d*t) + e
Ответ написан
Комментировать
@dmshar
Есть такой раздел Data Science, который очень оптимистично называется "анализ выживаемости". Название историческое, так как изначально анализируются шансы пациентов выжить за определенный промежуток времени. Или выздороветь - в зависимости от уровня оптимизма :-).
Так вот, в общем случае этот раздел как раз и строит модели, нацеленные в том числе на выявление вероятности поломки оборудования, вероятности свершения какого-то определенного события, попыток предсказания момента выхода оборудования из строя и т.д. Ну вот, из самого свежайшего (буквально вчерашнего) и простейшего описания этого раздела Data Science - можно прочитать тут: https://datascienceplus.com/survival-analysis-part-i/
(Кстати, тут и объясняться, за одно, и почему классическая регрессионная модель в данном случае не работает, и в чем отличия ее от модели выживаемости).
Из более фундаментального - statsoft.ru/home/textbook/modules/stsurvan.html
И вообще, информации по теме много. Ключевые слова - "анализ выживаемости".
Ответ написан
Комментировать
@SolidMinus
Нет, тут тоже классификация.

Multi-class classification, когда несколько типов поломки.

Посмотрите в сторону классификатора на нейронных сетях с выходным слоем softmax активацией и softmax-регрессию. Почитайте как распознают при помощи Feed-forward NN ( MLP ) набор MNIST, там та же задача, только в качестве фич - пиксели. https://www.tensorflow.org/get_started/mnist/beginners

3-й и 1-й пункт - это фича. Только нужен фич инжиниринг провести, т.к строк

ufldl.stanford.edu/tutorial/supervised/SoftmaxRegr...
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы