количество ядер тебя не должно волновать
подавляющему большенству пользователей хватает 4 (одно ядро съедает операционная система, пару - игры и приложения, еще одно ядро прозапас и к примеру для браузера в фоне), конечно душа радуется десяткам ядер процессора, за счет которых синтетические бенчмарки показывают красивые цифры, но самый важный параметр на текущий момент - это single thread benchmark, с какой скоростью выполняется задача на одном ядре в одном потоке (и там свои нюансы, т.е. нельзя это число умножать на количество потоков)
твоя машина даст 1580, а процессор что я предложил 3047, при этом общая скорость в pass mark у них примерно 6тысяч (мне кажется их система оценки скорости мягко говоря проглючил), за счет более быстрой оперативной памяти, большего кеша процессора и других отличий, современное решение будет быстрее даже в многопоточных задачах раза в полтора два, а в однопоточной - раза в 2-4
у меня был похожий на твой fx (6x) и разницу в скоростях я представляю не на синтетических тестах а в реальных задачах
между ней и текущими пропасть технологий, совместимыми остались только pci-e, usb и разъемы питания.
даже amd выпустили новый сокет am4 (точнее уже am5) не tr4 я не рассматриваю, а уж они в отличии от интеля, стандарты подключения процессора меняли гораздо реже
Станислав, итак, связь у тебя через vpn проходит, пинги идут, значит проблема в твоем провайдере (где стоит vps), надо еще смотреть что ты там с iptables намутил но вроде выглядит норм.
Надо подчеркнуть что эта структура нужна для хранения словаря слово => количество
не уверен, какая именно технология используется в stdlib c++ для map (вполне возможно что на основе hashmap), и если честно, объемы (количество слов а не данных) при которых имеет смысл заморачиваться с древовидными структурами, должны быть ну очень огромными, столько нет слов в естественных языках.
upd.
maps are implemented as Binary Search Trees, unordered maps as hash tables
сортировать и считать как я показал эффективно,только если отдельные куски (файлы) будут небольшого размера, итоговые числа нужно будет складывать другим способом (например отдельным потоковым приложением или даже базой данных), в итоге если заморачиваться со своим приложением, все что я описал можно заменить простеньким и эффективным кодом на основе std map
docker сделан на основе lxd
грубо говоря что на основе чего сделано с добавлением особенностей
docker -> lxd -> lxc -> cgroups
p.s. есть еще более простая и эфективная технология - chroot но там не никакой изоляции и нет сетевых фишек, это просто изоляция по путям в файловой системе (идет подмена указанного каталога на корень для выполняемого приложения)
задача странная, сомневаюсь что у нее есть сверхоптимальное решение в виде единой утилиты
чтобы сделать задачу быстрее конвееров, нужно очень постараться и заглубиться очень глубоко, смысла в этом никакого, повторяю, даже на слабом железе все упирается в распаковку сжаты архивов или чтения с диска
p.s. utf8 это проблема, регулярки с ней работают не очень шустро, рекомендую перекодировать сначала текст в однобайтовые кодировки, и только потом отдавать ее sed
p.p.s. приложение на c++ можно написать за 15 минут
не пытайся одной командой считать ВСЕ слова, один файл/кусок - свой набор, потом сложишь результаты
не пользуйся базами данных в процессе этого промежуточного подсчета, собирай все в оперативной памяти
вообще задачка то не простая, если данных терабайты
ой точно точно, ну идею вы уловили
нет нужды искать тут какой то GUI, тулкит и т.п., простые решения тут самые эффективные
единственное нужно думать о том где хранить файлы, правильно - каждая нода и хранит и обрабатывает, неправильно - все файлы сложить на одно NAS и упереться уже с 10 нодами в гигабитные сети даже со сжатыми файлами
upd. если в строке не много слов, то можно воспользоваться xargs cat file | xargs -n 1 | sort | uniq -c
Drno, браузеры уже давно по умолчанию используют cloudflare или google (@BlagoYar перепроверь это в настройках,так же удостоверься ходят ли пинги при указании ip а не доменного имени сайта)
Что именно не понятно?
Вариант третьей машины - сервера, это когда обе твои машины, и управляемая и управляющий, оба подключаются к этому третьему серверу, который в свою очередь ничего не делает, кроме проверки прав доступа и тупой пересылки сообщений.
Как человек который пощупал и слабые и мощные машины а так же слабые и мощные видеокарты (к сожалению без тестов в разное время) я скажу - видеокарту нужно апгрейдить в первую очередь по максимуму, да там не линейная зависимость, т.е. не каждый следующий рубль даст такое же ускорение.
spoiler
Если бы речь шла про игры я бы брал rtx3070ti, но так как я заинтересова еще и в нейронках, лучше брать карты с 12+ памяти а значит 4070 оправдан
p.s. не представляю ситуацию, когда я бы не апгрейдил железо в будущем... т.е. это значит мне бы в принципе не понадобился компьютер.
поэтому всегда планируй апгрейд, даже если он будет лет через 5
p.p.s. экспоненциальный рост производительность видеокарт закончился точно так же как это произошло с процессорами, с лагом в несколько лет, сейчас рост скорости идет за счет внедрения высокопроизводительных серверных решений в десктопных (грубо говоря чипы стали использовать почти те же), новые ускорители уже не будут давать каких то заметных побед, за исключением каких то новых технологий (типа ИИ рескайлинг или еще что)
пока монополисты в лице компаний США и той же дарпа не перестанут съедать и уничтожать стартапы, дающие заметные результаты в области вычислительной техники, ситуация не изменится и новых игроков на этом рынке мы десятилетие не увидим
что значит зачем, автор наверное хочет сделать из сервера игровую машину.
вот представь у тебя на руках X денег, их хватит либо на новую видеокарту либо на новый процессор но не одновременно, что ты выберешь?
p.s. Про 30 fps это очень холиварная тема - и в ней есть некий консенсус у спорящих, и он гласит, если 30- СТАБИЛЬНЫЕ (не всякая игра позволяет фиксировать на произвольной частоте, но есть лайфхаки, через рефрешрейт монитора) то играть очень комфортно, а вот чтобы достичь 60fps стабильных требуется очень нетривиальное железо, и любая нестабильность там точно так же заметна.
повторяю, только киберспортсменам для динамичных шутеров, критичны высокие fps исключительно из-за того что так они получают больше оперативной информации, но это очень небольшой процент неймеров, в обычной ситуации все бонусы от высокого fps убиваются сетевыми лагами
есть игры более критичные к процессолру, есть менее
даже там где это заметно, разница незначительная
в 99% случаев достаточно стабильных 30fps! в среднем активным мультиплеерным шутерам хватит 60fps и только киберспортсмены заморачиваются с качественными мышками и fps в 144
человек спрашивает не как письками мериться а можно ли сэкономить и не покупать новую машину.
Свой ответ я дал - с точки зрения производительности купить более мощную видеокарту и не апгрейдить процессор более эффективно чем за те же деньги апгрейдить процессор и покупать на остатки никакую видеокарту. Единственная у него проблема - а заработает ли многопроцессорная машина как десктоп
p.s. вот если бы у него был бы какой-нибудь целерон года 2011 тогда да
не вводи в заблуждение
если человеку нужно игры играть, то в подавляющем большинстве случаев у него производительтность будет на 90% зависеть от видеокарты и в очень незначительных случаях от процессора, грубо говоря если сравнивать топовый процессор и этот ксеон с одной и той же видеокартой, разнице в fps будет условные 100 и 95. И что, что загрузка уровня будет на пару секунд дольше?
Различия в производительности современных десктопных процессоров и указанного ксеона - незначительная, в однопотоке, от силы на 40% хуже (для самых топовых машин и там есть оговорки про тротлинг по температуре и питанию), что значимо не повлияет на игровой процесс или работу приложений, основная нагрузка у которых - видеокарта.
Это 10 лет назад разные поколения процессоров могли дать очень значимую разницу в скорости, но не сейчас, когда производительность в однопоточном режиме почти не растет, а многопоточная - требует особой поддержки софтом, что не наблюдается у типовых приложений и игр (исключение - вычисления, но там нет особой разницы, 10 минут приложение будет работать или 12)
подавляющему большенству пользователей хватает 4 (одно ядро съедает операционная система, пару - игры и приложения, еще одно ядро прозапас и к примеру для браузера в фоне), конечно душа радуется десяткам ядер процессора, за счет которых синтетические бенчмарки показывают красивые цифры, но самый важный параметр на текущий момент - это single thread benchmark, с какой скоростью выполняется задача на одном ядре в одном потоке (и там свои нюансы, т.е. нельзя это число умножать на количество потоков)
твоя машина даст 1580, а процессор что я предложил 3047, при этом общая скорость в pass mark у них примерно 6тысяч (мне кажется их система оценки скорости мягко говоря проглючил), за счет более быстрой оперативной памяти, большего кеша процессора и других отличий, современное решение будет быстрее даже в многопоточных задачах раза в полтора два, а в однопоточной - раза в 2-4
у меня был похожий на твой fx (6x) и разницу в скоростях я представляю не на синтетических тестах а в реальных задачах