Узким место тут будет сеть, драйвер сети, сетевой адаптер. До CUDA дело не дойдет даже, CUDA здесь избыточно.
А
вот серверный сетевой адаптер, который имеет свое собственное железо на борту, а не перекладывает работу на драйвер операционной системы, в отличие от дешевых ширпотребных аналогов - смысл имеет.
И качество коммутатора.
Откуда танцевать
nginx.org/ru/docs/events.html
После того как вы решили проблему с сетью - тогда имеет смысл оптимизировать дальше:
CUDA, язык программирования и пр.
Но это все очень сильно зависит от того что именно вы обрабатываете.
Может у вас каждый пакет требует 10 минутного обдумывание на CUDA. Из вопроса - это не понятно.
Real-time у вас требования или можно запрос поставить в очередь и ответ отравить через час - тоже не понятно из вопроса.
Постоянная нагрузка или плавающая, можно ли за счет очередей реализовать - из вопроса не понятно.
Сможете ли вы на CUDA грузить данные с такой скоростью?
На CUDA можно грузить большие куски данных. Но мало кусков. Но быстро.
Насчет того можно ли грузить на CUDA и получать ответ для множества мелких кусков - сомнительно.
Обрабатывал ли кто нибудь сигналы с частотой 30 мГц
мГц? 30
миллигерц? то есть 0,03 раз в секунду??? в чем проблема-то?
если речь о МГц - мегагерцах - то и пишите правильно.
Для начала вам ликбез:
Приставки СИ
Что до UDP - так еще и
от размера пакета зависит скорость.