Могу предложить реализацию перемножения матриц на APL (dll'ку сделаю, + в папку bin надо будет пару dll'лек кинуть), если матрицы большие, то прирост скорости в разы.
Н-р: 2000 на 2000 на APL — около 8 сек, на C# там чуть ли не минута а то и больше. (не помню честно точные результаты, но эксперименты мы с другом ставили такие)=)