Регуляризация применяется на этапе обратного распространения ошибки.
Простыми словами - вы хотите избежать очень больших весов для каких-то нейронов (aka переобучение). Чем больше вес у определенного нейрона, тем больше регуляризация для этого нейрона.
Картинка с просторов интернета для наглядности. Надеюсь поможет понять