Die Kombination von Residual Connections und Layer Normalization nennt man in der Transformer-Literatur oft "Add & Norm".