Привет.
Я делаю нейросеть, и мне нужно в ней различать 2 типа звуков.
Но эти 2 типа звуков, разной длинны, и я не могу придумать как их нормализовать так, чтобы они могли нормально входить в нейросеть. Например один звук длится 2 секунды, другой 3, третий 1,5
Если у кого-то есть опыт, статьи, или идеи по этому поводу, я буду рад слышать все ;)
Так если они по умолчанию разной длины - зачем там ИНС? Различайте по длине :-)
А по факту - возможно стоит смотреть на частотные характеристики звуков. И уже по ним сравнивать. В общем случае - тут надо отталкиваться от того, чем собсно эти звуки различаются
Звуки разные.
В одном звуке слышно одно, в другом другое. Этих звуков 2-ух типов у меня сотни.
Это не 2 одинаковых звука, это сотни разных (и по длине и по звучанию).