Звук в какой-то среде (воздухе, воде или твердом теле) - это колебания давления, то есть распространяющиеся в пространстве от источника последовательности перепадов более высокого и более низкого давления.
Звук в компьютере - это условно (то есть от максимума до минимума) закодированная последовательность положений детали звуковоспроизводящего устройства, например - мембраны динамика. Величина отклонения от нулевого положения - амплитуда, количество промежуточных положений в секунду - частота дискретизации.
Когда говорят, что на CD звук закодирован в формате "16 бит 44 кГц", это означает, что положение мембраны динамика кодируется 44 тысячи раз в секунду и между крайними положениями - 2^16, то есть 65535 положений.
При воспроизведении звука, каждое такое значение от 0 до 65535 преобразуется цифро-аналоговым преобразователем звуковой карты в значение напряжения, подаваемого на динамики. А динамики исправно создают колебания давления в воздухе.
Тон - это действительно частота колебаний, но чистый тон, когда звук - чистые синусоидальные колебания - это большая редкость. На самом деле, синус - большая редкость. Откройте любую аудиозапись в каком-нибудь звуковом редакторе, посмотрите при максимальном увеличении на форму сигнала. Вот, в общем случае оно как-то так и выглядит.