Как кодируются картинки?

Question

drunkstudent @drunkstudent

Как кодируются картинки?

При скачивании файла из сети (в данном случае картинки) мы имеем дело с массивом байтов. Как определить какого расширения данная картинка (png, jpg, bmp и др)? Есть ли какая-то служебная информация? Как конвертировать из одного формата в другой?
P.S. Да, знаю, можно найти спецификацию любого формата и вычитать там, но хотелось бы сначала понять основы, а потом ковыряться в спецификациях

Вопрос задан более трёх лет назад
1641 просмотр

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик с нуля

6 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программирование

+2 ещё

Средний
Возможно ли написать программу, которая будет удалять все данные с дисков?
- 2 подписчика
- 16 часов назад
- 196 просмотров
6

ответов
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1414 просмотров
5

ответов
JavaScript

+2 ещё

Простой
Можно ли заменить кликанье мышью по веб-интерфейсу cli-командой?
- 3 подписчика
- 13 сент.
- 1127 просмотров
2

ответа
Программирование

Простой
Оператор, операция, функция, процедура — что всё это значит?
- 1 подписчик
- 05 авг.
- 447 просмотров
2

ответа
Программирование

Простой
Какие есть источники, помогающие понять бизнес-логику проекта?
- 3 подписчика
- 30 июл.
- 935 просмотров
2

ответа
Программирование

Простой
Как готовиться к ВСоШ по информатике 9-11 классов/олимпиадам по программированию вообще?
- 1 подписчик
- 20 июл.
- 297 просмотров
3

ответа
Программирование

+1 ещё

Простой
Ответьте на вопрос по информатике?
- 1 подписчик
- 10 июл.
- 817 просмотров
3

ответа
Программирование

+1 ещё

Средний
Редактирование прошивки китайской камеры видеонаблюдения?
- 1 подписчик
- 01 июл.
- 492 просмотра
2

ответа
Программирование

+1 ещё

Простой
Как работает регистрация и аутентификация с помощью ЭЦП?
- 1 подписчик
- 26 июн.
- 328 просмотров
3

ответа
Программирование

+3 ещё

Средний
Какой лучше выбрать мини пк под сервер?
- 2 подписчика
- 19 июн.
- 4175 просмотров
16

ответов
Показать ещё Загружается…

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

IDE Plugin Engineer

IForce connect ltd • Лондон

от 3 000 до 6 000 €

Backend Developer

Невасофт • Санкт-Петербург

от 200 000 ₽

Answer 1 · 2015-06-11 00:23:55

Есть такое понятие - сигнатура. Набор байтов которые встречаются только в этом типе файлов.
У PNG тоже есть сигнатура. www.libpng.org/pub/png/spec/1.2/PNG-Structure.html

The first eight bytes of a PNG file always contain the following (decimal) values:
137 80 78 71 13 10 26 10

Еще можно посмотреть исходники утилиты identify из пакета ImageMagick www.imagemagick.org/script/identify.php

Answer 2 · 2015-06-11 01:05:50

В общем случае конечно в протоколе передачи данных должен быть способ указания на то, как передаваемые данные интерпретировать. Например, в HTTP используются заголовки в ответе для указания типа содержимого (Content-Type) и кодирования на уровне HTTP, например, сжатия, если таковое присутствует. При получении данных клиент (например, браузер) должен раскодировать содержимое в исходный вид (например, распаковать, если сервер сжал отправляемый ресурс) и далее работать с ним на основе указанного Content-Type. Невозможно на 100% определить заранее, что картинка того или иного формата, но, как правильно подметил Павел Волынцев, у большинства форматов есть сигнатура, по которой с вероятностью 99.9..% можно сказать, что прилетела PNG-шка или JPEG. В любом случае, правильно реализованная читалка (декордер) графических форматов должна быть готова к тому, что картинка может быть повреждена и должна выдавать ошибку, если разобрать картинку согласно предполагаемому формату невозможно.
Сами форматы растровых изображений (вектор не рассматриваем сейчас) как раз таки и различаются прежде всего: а) особенностями представления пиксельной карты (матрицы пискелей): как кодируется цвет, индексный или компонентный, сколько всего может быть различных значений цвета у пиксела, есть ли сжатие, какие алгоритмы сжатия применяются - без потерь (PNG) или с потерями (JPEG); б) служебной информацией: это может быть как базовая необходимая информация, например размеры картинки и размер одного пикселя в байтах (читай - сколько байт выделяется на цвет одного пиксела), так и дополнительная, например EXIF, где можно указать и автора, и режим съемки и много чего еще; в) доп. фичами, которые и делают каждый формат особенным: поддержка анимации (GIF, MNG), поддержка сжатия с потерями (JPEG), поддержка слоев в картинках (фотошоповский PSD), поддержка "многостраничных" картинок (TIF) и так далее.
Конвертирование собственно сводится к:
1) определению исходного формата картинки;
2) чтению исходного формата с целью перевести его в удобное развернутое представление в памяти, удобное для программиста с точки зрения дальнейших операций (расжать, прочитать служебную инфу и т.д.)
3) записи полученного представления в памяти в новый формат, что опять таки подразумевает запись необходимых сигнатур и служебной инфы в соответствии со спецификацией формата, плюс преобразование изображения алгоритмами сжатия, если нужно (например, эффективность jpeg для фотоизображений достигается использованием довольно сложного и хитрого алгоритма кодирования, учитывающего восприятие цвета человеком, в том время как PNG сжимает почти как обычный архиватор, который никак не интерпретирует сжимаемые данные).
Надеюсь дальше понятно куда копать.

Как кодируются картинки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт