@Andrei1penguin1

Датасет Celeba неверный?

Доброго времени суток, есть датасет лиц Celeba, вот ссылка на него на kaggle:
https://www.kaggle.com/jessicali9530/celeba-dataset
В архиве также идёт несколько файлов с дополнительной информацией, в частности, файл list_bbox_celeba.csv, содержащий строки в формате:
image_id,x_1,y_1,width,height
Но эти точки не соответствуют ограничивающему прямоугольнику на изображении, для примера:
В датасете все изображения 178x218, но в первой же строке файла list_bbox_celeba содержится следующая строка:
000001.jpg,95,71,226,313
Тогда как такой высоты и подавно быть не может
Вот код визуализации прямоугольника:
import cv2
img = cv2.imread("img.jpg")
with open("list_bbox_celeba.csv") as file:
    points = file.readlines()[1].replace("\n", "").split(",")[1:]
    points = [int(point) for point in points]
box = cv2.rectangle(img, (points[0], points[1]), (points[0] + points[2], points[1] + points[3]), (255, 0, 0), 3)
cv2.imshow("img", img)
cv2.imshow("img_box", box)
cv2.waitKey(0)
cv2.destroyAllWindows()

Подскажите пожалуйста, это в датасете проблема, или я неправильно визуализирую?
  • Вопрос задан
  • 106 просмотров
Пригласить эксперта
Ответы на вопрос 1
fox_12
@fox_12 Куратор тега Python
Расставляю биты, управляю заряженными частицами
Ну да - там собственно в дискуссиях есть:
The bbox coordinates mentioned here are corresponding to the original images in the CelebA. These are face crops generated some other technique. You can either use the original images or just skip using bbox.

В датасете приведены части изображений, в то время как bbox координаты приведены для оригинальных изображений.
Если сделать беглый поиск - то он приведет на данный сайт:
https://www.programmersought.com/article/60434058932/
который приведет сюда:
mmlab.ie.cuhk.edu.hk/projects/CelebA.html
Там собственно можно скачать оригинальные изображения.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы