Хочу заняться созданием собственной базы, не прибегая к уже существующим. Вопрос, есть ли где-то ресурс, где это можно поучить? Нашел кучу уроков, где используя jupyter пользуются уже готовыми базами, созданными по структуре. Но урока как делать самому все с нуля, включая базу для обучения и базу для тестирования- нет :(. Может кто-то может поделиться, очень хочу изучить этот вопрос и научить отличать собаку от кота, без прибегания к существующим базам
научить отличать собаку от кота, без прибегания к существующим базам
Тут есть один нюанс. База котов и собак уже заранее тегирована. Тоесть кто-то проделал колоссальную работу собирая фотки и раскладывая их на 3 кучки или три фолдера с картинками. Коты. Собаки. И черт-знает-что.
Если ты решил сам формировать свой учебный датасет - то тебе надо во первых собрать большое количество материала. Чем больше - тем лучше. И во вторых сесть и самому их тегировать.
JRBRO, вот тебе степ бай степ:
1. Сделать миллион фотографий
2. Обрезать и смасштабировать их, чтобы они были в одном разрешении
3. Посмотреть глазами на каждую и положить в одну из трёх папок: кошка, собака, другое
JRBRO, да. Просто тебе нужно разделить полученный огромный датасет на два по меньше. Один, например 90% для тренировки, и 10% для теста.
Будет две папки:
train/*
test/*
Василий Банников, извиняюсь если туплю, пытаюсь разобраться по вопросу. На какие три папки должно быть разделено? Я пока без практики спрашиваю, чисто пишу заметки чтобы не с пустой головой начинать
JRBRO, ты от всего не подстрахуешся. Поэтому начитай с этого и пиши новые вопросы по ходу. Придумывать всякие угрозы для тебя и опасные места - это знаешь-ли неблагодарное дело. Короче получи свой опыт.