Линукс же сам по себе легкий его, часто слышу что на старых устройствах он очень хорошо работает
Именно поэтому нет универсального способа понять, где узкое место.
Там формулу нельзя нарисовать, поскольку нет линейной зависимости. В задачах performance
tunning никто напред (никакой умный архитектор) не может сказать на сколько тебе надо домножить
тактовую частоту чтоб блокер ушел.
Если это твой Питонский код - то там тоже есть cProfile, line_prof e.t.c.
Еще посмотри perf, strace.
"Производительность" не бывает в вакууме, она бывает в конкретной задаче. А конкретная задача может сильно разниться.
При этом load может отражать загрузку совсем не процессора, а периферии (диски, сеть и другие устройства). Например, вполне жизненная ситуация, когда от диска прилетают hardware timeout, а в системе катастрофически растёт load. Даже если диск этот - raid в зеркале: пока система не догадается отстрелить проблемный диск и остаться на половинке зеркала, load будет высоким, всё будет тормозить. А это зачастую может занять далеко не одну минуту. Другой вариант: если на диске включена опция discard, то в моменты фонового trim он тоже может создавать внезапную нагрузку.
Ну вот, например, когда система тормозит - можно посмотреть: если в процессах высокое потребление процессора у kswapd или kcompactd, то это значит памяти не хватает и система начала свопаться слишком активно. Это тоже вызовет повышение load, но упираться это будет не в процессор вовсе.
ты же понимаешь, что когда мы говорим о недостатке, то мы имеем в виду
сравнительную категорию.
Конечно с таким стеком можно легко найти работу, даже более того можно найти зная только питон, и пачку ответов по верхам других тем для собеса, а можно и не найти.