Была давненько в универах такая дисциплина - Прикладная теория цифровых автоматов (ПТЦА). Так вот, там нас учили строить и рассчитывать схемы процессоров, простеньких, всякие сумматоры, сдвигатели, АЛУ, регистры и т.д. и все это решалось на простейших триггерах (вентилях), И, ИЛИ, ИЛИ-НЕ и т.д. (тут уже есть картинка.)
Так вот представьте, что при большом количестве транзисторов можно реализовать схему, которая, например, перемножит две матрицы за один такт работы ЦПУ. Или еще чего покруче, а размеры кристалла останутся такими же.