Нет "нейросетей связанных с распознаванием аудио" . Есть нейросети. И вот их и надо изучать. А уж потом - смотреть, как нейросети используются при решении задач "распознавания аудио".
Но вообще-то что-бы по настоящему понять, как это все (нейросети) работает, начинать надо с базовых книг по Machine Learning, очень частным (но модным) случаем которого и есть теория нейросетей.