Как реализовать классификатор на датасете рукописных цифр?

Question

Екатерина Воропаева @Eka19

Как реализовать классификатор на датасете рукописных цифр?

Реализовать свой первый классификатор на датасете рукописных цифр. Помогите пожалуйста с идеей алгоритма.
Задача состоит в том, чтобы разработать свой уникальный алгоритм классификации, точность которого будет больше 20% (вообще чем больше - тем лучше).
Нельзя использовать встроенные библиотеки ( т.е. должно быть написано вручную), методы машинного обучения (мы не знаем ничего о нейронных сетях), нельзя использовать метод ближайших k-соседей.

Вопрос задан более двух лет назад
220 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Хекслет

Фронтенд-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

6 комментариев

Екатерина Воропаева @Eka19 Автор вопроса

да, у меня квадратные картинки. как в наборе mnist.

Написано более двух лет назад
mayton2019 @mayton2019

Eka19, 1-bit? Grayscale?

Написано более двух лет назад
Екатерина Воропаева @Eka19 Автор вопроса

1 бит

Написано более двух лет назад
mayton2019 @mayton2019

Eka19, ну тогда все просто. Берешь две картинки. Делаешь сложение их по модулю 2 (операция XOR) и результирующая картинка содержит биты где есть различия. Считаешь эти биты и получаешь расстояние Хемминга для картинок. Чем меньше расстояние - тем картинки более похожи.

Идея понятна?

Написано более двух лет назад
Екатерина Воропаева @Eka19 Автор вопроса

буду разбираться, спасибо!

Написано более двух лет назад
mayton2019 @mayton2019

Eka19, будь осторожен. Расстояние Хемминга не толерантно к сдвигу картинок. Если одна картинка будет сдвинута относительно другой - то метрика покажет дистанцию хотя с точки зрения человека - картинки очень похожи.

Но ты сам этого хотел. Хотел свой деревянный алгоритм с точностью 20%. Не знаю будет там 20 или нет. Это уж сам смотри.

Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 61 просмотр
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 93 просмотра
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 76 просмотров
1

ответ
Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 154 просмотра
0

ответов
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1294 просмотра
6

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 238 просмотров
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 272 просмотра
3

ответа
Нейронные сети

Простой
Как настроить оркестрацию вайбкодинга?
- 2 подписчика
- 21 сент.
- 434 просмотра
3

ответа
3D

+2 ещё

Средний
Cуществует ли софт для генерации трёхмерного (если нет — двухмерного) видео говорящего какой-либо заданный текст человека?
- 1 подписчик
- 20 сент.
- 114 просмотров
1

ответ
Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент.
- 185 просмотров
1

ответ
Показать ещё Загружается…

Backend developer

Creative Code

До 160 000 ₽

IDE Plugin Engineer

IForce connect ltd • Лондон

от 3 000 до 6 000 €

Backend developer

BCraft

До 4 000 $

Answer 1 · 2023-03-22 13:27:50

По этой ссылке репозитарий с реализацией вашей задачи на чистом numpy (python библиотека), которая предоставляет векторизованный массив. (все функции написаны вручную) не каких ML алгоритмов из коробки не используется.

Реализуйте на том языке на котором вам необходимо. Я думаю иметь готовый код без ML библиотек это хорошее начало для решения вашей проблемы.

Так же автор репозитария написал статью на https://towardsdatascience.com/ вы можете зарегистрироваться там они дают по моему три бесплатные статьи в месяц и изучить его статью, как весь процесс организовать и т.д. Название статьи "MNIST Handwritten digits classification from scratch using Python Numpy".

Answer 2 · 2023-03-22 13:40:48

Эффективность идеи зависит тоже от того в каком виде представлены данные. Если рукописные цифры - это квадратные картинки (как в наборе MNIST) то тогда решается просто. Считай расстояние Хемминга для всех картинок ко всем. Там где расстояние будет минимально - найден кластер картинок. Или класс символов похожих на букву. Далее можешь искать среднее. Завести вещественные значения для кластера. (Тут кстати тебя надо спросить у тебя 1-битные изображения или GrayScale?)

Если цифры еще не размечены на атласе картинок и тебе предстоит еще и найти их место-положение - то это
задача уровня FineReader/Tesseract. Это посложнее будет и идей и методов там сразу еще +10 штук.

Поэтому опиши как выглядят исходные данные. Понял да? Идей целый вагон. Только не заставляй распылятся на пустяки.

Как реализовать классификатор на датасете рукописных цифр?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт