Понимаете , если Вы ищите что бы это было разжовано в режиме легкого чтива, то, боюсь, такой литературы нет. По сути своей Вам необходим хороший курс по процессору и околопроцессорной тематике.
Начать, можно, например, с Ассемблера. Нет, я не призываю Вас все бросить и начать на нем программировать, но этот язык требует знаний архитертуры, и, как следствие, там есть нужная Вам информация.
Юров В.И. - Assembler 2-е издание
Затем можно почитать обзорно википедию, там более или менее можно найдти информацию про различные архитектуры и, можно освежить историю выпуска процессоров, а так же архитектур процессоров.
Далее это тесты и обзоры процессоров, практика сравнений. Как правило обзорщики пишут причины почему один процессор обходит другой, а лучше тестирование в прикладных задачах, например работа с БД, расчеты.
Далее это техпроцесс и архитектуры. Каталогизированной информации нет, только поиск в гугле, на ютубе... Например на Хабре были подобные статьи
https://habr.com/ru/post/456922/
Это техническая литература, зачастую в открытом доступе ее может и не быть, кроме маркетинговых общих фраз.
И вот изучив тонны литературы и потратив уйму времени - Вы и получите ответ на вопросы Бытия!!!
Почему для каждого процессора разный сокет? Если выпуски новых процессоров - это эксперименты - зайдет, не зайдет, то почему не удается тупо выпустить универсальный процессор?
Ну во-первых не для каждого, у АМД сокеты долгоиграющие, а вот тот же Интел меняет их под каждое поколение, потому что ему так удобно. Но дело не только в том, как раскрутить пользователей на бабки. Материнские платы увязывают множество технологий и стандартов и, если год назад DDR4 были нормой, то завтра нормой будет память DDR5, появится новый тип USB - 4.0, поменяется реализация шины для видеокарты и вот... новые технологии могут не оставить места для старых процессоров, как и новые процессоры перестанут поддерживать старые реализации протоколов и шин... Это невозможно оттягивать бесконечно. По-этому рано или поздно смена сокета будет необходима.
Почему выходит удачная модель?
Потому что соотношение производительности к стоимости может быть лучше аналогов, а еще может повлиять форм-фактор или еще какие-либо вещи.