ИМХО, если на пальцах, в общем случае, каждый слой можно заменить одной кривой на графике, к примеру для разделения груш от яблок, хватит одной кривой, и того один слой, а для решения задачи "ИЛИ" нужно две кривые, итого два слоя.
Так же, в общем случае, для решения одной и той же задачи, многослойная сеть потребует меньше синапсов чем однослойная.