Что я знаю о изображениях это RGB от 0 до 255 то есть выходит на каждый пиксель идет 3 байта, так ?
Нет. Закодировать можно и в 1 бит на пиксел (чёрно-белое), и в 32 бита на пиксел (RGBA), и в любом другом варианте, например R3G3B2 - три бита на красный, три на зелёный, два на синий. Кроме того, практически никто не хранит в файле RAW-изображение, его, как правило, сжимают (JPEG, PNG, GIF, и т.д.), после чего для получения пикселов необходимо использовать специальные алгоритмы декодирования.
Что я знаю о звуке (тут не много темный лес для меня) есть колебания это ГЦ к примеру 10 то есть 10 колебаний за 1 с и есть разное так сказать качество звука 8-16 байт как я понимаю , возьмем 8 байт
По теореме Котельникова для сигнала с максимальной частотой 22КГц (стандартное качество звука) необходима частота дискретизации не менее 44КГц. На один сэмпл, как правило используют 8 или 16 бит (не байт), при этом в файле может быть не одна дорожка. И, опять же, при записи в файл звук обычно сжимают (MP3, OGG, FLAC, и т.д.), соответственно для его воспроизведения тоже нужны специальные алгоритмы декодирования.