@101-s

Какой должна быть архитектура сети для поиска объекта на фото?

Дано: лица людей, нужно найти, допустим глаза.
Есть датасет с границами глаз на фото (x1,y1) (x2,y2)
Для сети это будет задача регрессии? То есть подобор подходящих координат

Вот такая модель подойдет? на выходе 4 значения.
mobile_net = tf.keras.applications.MobileNetV2(input_shape=(192, 192, 3), include_top=False)
mobile_net.trainable = False
model = tf.keras.Sequential([
    mobile_net,
    tf.keras.layers.GlobalAveragePooling2D(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(4, activation='sigmoid') # ?функция активации sigmoid, т.к. данные от 0 до 1
])

model.compile(optimizer="rmsprop", loss='mean_squared_error', metrics=['mae'])
# Т.к. задача регрессии, удобнее использовать mean square error(средне-квадратичная ошибка).
# В качестве метрики берем mean absolute error средняя абсолютная ошибка (MAE)
  • Вопрос задан
  • 27 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы