Тестирование с количественным учетом результатов?

Question

bytecode_rus @bytecode_rus

Тестирование с количественным учетом результатов?

Есть некий алгоритм, который постоянно совершенствуется (или нет). И хочется после каждого его усовершенствования тестировать его на нескольких эталонных выборках. Как я понимаю, для этого существуют системы Continuous Integration, которые собирают проект, тестируют и отчитываются о результатах.

И я понимаю, как это работает в случае с классическим тестированием — алгоритм может либо сработать либо не сработать (1 или 0).
В моем же случае это алгоритм компьютерного зрения. И он может отработать на 100%, может на 0%, а может на 66% или 45.6%.

Я не нашел никаких средств, которые учитывают такие вот количественные результаты. Возможно я чего то не понимаю, или что то упускаю.

Пожалуйста, помогите советом или какими нибудь best practices на эту тему.

Спасибо

Вопрос задан более трёх лет назад
2638 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Тестирование ПО

+1 ещё

Простой
Уходить из тестирования или есть смысл поиска работы в 2026 году? С учетом, что мануал?
- 1 подписчик
- 16 июн.
- 321 просмотр
2

ответа
Тестирование ПО

Простой
Где найти вакансии на тестировщика?
- 1 подписчик
- 28 мая
- 187 просмотров
1

ответ
Тестирование ПО

Простой
Как лучше всего писать тесты e2e для бэкэнда NestJS?
- 1 подписчик
- 05 мая
- 81 просмотр
2

ответа
Тестирование ПО

Простой
Как вы тестируете LLM-фичи в продакшене?
- 3 подписчика
- 21 апр.
- 255 просмотров
1

ответ
Тестирование ПО

+1 ещё

Простой
Почему не нажимается кнопка по методу click() в Selenide?
- 1 подписчик
- 04 февр.
- 128 просмотров
0

ответов
Тестирование ПО

Средний
Как оформить УЗ для тестирования ЕСИА авторизации?
- 1 подписчик
- 29 дек. 2025
- 97 просмотров
0

ответов
Тестирование ПО

Простой
Запуск удалённого монитора в Postman?
- 1 подписчик
- 27 дек. 2025
- 118 просмотров
0

ответов
Docker

+1 ещё

Простой
Docker, forgejo, как подключить woodpecker-ci?
- 2 подписчика
- 07 дек. 2025
- 102 просмотра
0

ответов
Тестирование ПО

Простой
Почему TestIT не видит кейсы?
- 1 подписчик
- 13 окт. 2025
- 90 просмотров
0

ответов
Тестирование ПО

Средний
Специалисты по управлению качеством в IT-компаниях есть?
- 1 подписчик
- 20 сент. 2025
- 125 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2013-11-13 17:40:46

Только хардкор, только разработка собственных метрик, классификация тестовых данных на группы. Экспертная оценка данных людьми, сравнение результата с экспертной оценкой, сравнение полученных метрик с предыдущим и лучшим результатом, отдельно для каждого набора данных и для класса. При этом фреймворк должен мочь пересчитать все метрики для предыдущих версий по новому алгоритму, потому, что систему оценки качества будете регулярно допиливать. Попытка свести оценку к бинарному виду выдаст "среднюю температуру по больнице". Я почти уверен, что вы не найдете готового решения, слишком нетипичная задача для массового решения. По крайней мере, я в свое время не нашел.

Тестирование с количественным учетом результатов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт