Как в ировом движке на C++ распаралерить функции Update и Render?

Question

Imaginer @Imaginer

Как в ировом движке на C++ распаралерить функции Update и Render?

В игровом движке, котрый я для обучения разрабатываю, есть класс Game, в котором есть методы Update(float dt) и Render(). Также в этом класе есть данные. Причем Update их изменяет, а Render только читает. Я хочу запустить Update в отдельном потоке. Тогда физика будет более правильной, например если Update выполнится 1000 раз в секунду, а рендер 60.

class Game
{
public:
	Game()
		:done(false)
		,pause(true)
		,drawDebugInfo(true)
		,FPS(0)
		,lastTickCount(0)
		,timeScale(0.1f)
		,GraviForce(false)
		,Collision(false)
		,numEntites(0)
		//,Enityes(nullptr)
		,render(nullptr)
		,input(nullptr)
		
	{
	};
	virtual bool Init(size_t numEntites_, Options option);
	//void Input(int key, bool press);

	bool Run();

        void Update(float dt);
	virtual void Draw();
	virtual void InputCheck();
	void End();

public:
	Render* render;
	Input* input;
	std::vector<Entity*> Entityes;
	size_t numEntites;
	static bool* keys;


//private:
	bool done;
	bool pause;
	bool drawDebugInfo;	
	size_t FPS;
	long long lastTickCount;
	float timeScale;
	bool GraviForce;
	bool Collision;

	float dt;

};

Я пробовал вынести функцию Upadate из класса и использовать mutex, но не получилось. Может использовать атоморные типы данных?
Буду благодарен за советы и критику.

Вопрос задан более двух лет назад
468 просмотров

12 комментариев

Подписаться 2 Простой 12 комментариев

Василий Банников @vabka

Если это твой движок, то это тебя надо спрашивать, как распараллелить.
Обычно делается отдельный цикл событий для обработки физики и отдельный цикл для обработки ввода и рендера.

Написано более двух лет назад
Anaflion @Anaflion

Не могли бы вы обозначить на пальцах содержание этих двух методов, чтобы понять - где там границы критической секции и как оная выбрана... Мне интересно - и для самообразования. На чем пишете? На Vulkan, OpenGL?

Но интересна сама суть - Update() расставляет геометрию и эффекты? Или отсекает от сцены то, что попадет в Render? В то время когда Render() рисует участок сцены, которая у вас попадает в обзор?

Рендер будет "молотить" в любом случае, поэтому многопоточная работа у вас происходит именно в расстановке геометрии и эффектов - в Update? Или наоборот...

Если Update лишь формирует поле обзора камеры игрока для Render с преобразованием участка 3D сцены в 2D изображение экрана то... Оный должен без блокировок читать Мир - который в свою очередь наполняется сущностями из вектора Entityes (это же у вас вектор состояний и объектов?) А наполнять Entityes должны уже некие потоки - сущности - активности игры, такие как игроки, неписи и эффекты мира? :) Я впервые разговариваю с разрабочиком движка - очень интересно.

Написано более двух лет назад

Imaginer @Imaginer Автор вопроса

на OpenGL, но использую старые методы вывода.
Есть на github исходники:
github.com/Imaginer86/GEngine

bool Game::Run()
{
	long long lastTickCount = Core::GetTickCount();
	float dt = 0.0f;
	Draw();
	while (!done)
	{	
		InputCheck();
		Draw();//TT
		long long tickCount = Core::GetTickCount();
		long long dTickCount = tickCount - lastTickCount;
		dt = static_cast<float>(dTickCount) / 1000.0f;;
		//FPS = static_cast<size_t>(1.0f / dt);
		dt *= timeScale;
		if (!pause)	Update(dt);
		lastTickCount = Core::GetTickCount();
	}
	return true;
}
void Game::Draw()
{
	render->beginDraw();
	//render->drawSphere(Vector3f(0.0f, 0.0f, 0.0f), 50.0, Quaternion(0, Vector3f(0.0f, 0.0f, 1.0f)), Color4f(1.0f, 1.0f, 1.0f, 1.0f));
	for (size_t i = 0; i < numEntites; i++)
	{
		if (Entityes[i]->isBall())	render->drawSphere(Entityes[i]->pos, dynamic_cast<Ball*>(Entityes[i])->r, Entityes[i]->color);
		else if (Entityes[i]->isModel())	dynamic_cast<ModelOBJ*>(Entityes[i])->Draw(render);
	}
	if (drawDebugInfo)
	{
	

	}
	render->endDraw();
}
void Game::Update(float dt)
{
	std::cout << dt << std::endl;
	for (size_t i = 0; i < numEntites; i++) Entityes[i]->init();
	if (Collision)
	{
		for (size_t i = 0; i < numEntites; i++)
			for (size_t j = i + 1; j < numEntites; j++)
			{
				if (Entityes[i]->isBall() && Entityes[j]->isBall())
				{
					Vector3f raxis = Entityes[i]->pos - Entityes[j]->pos;
					float dr = raxis.Length();
					float r = (dynamic_cast<Ball*>(Entityes[i])->r + dynamic_cast<Ball*>(Entityes[j])->r);
					if (dr <= r)
					{
						std::cout << "Collision " << i << " vs " << j << ". Vel Before: " << Entityes[i]->vel << " vs " << Entityes[j]->vel << "m: " << Entityes[i]->m << " m: " << Entityes[j]->m << std::endl;
						if (i == 0)
						{
							std::cout << "!Black Hole Collision " << std::endl;
						}
						if (InElasticImpact(*Entityes[i], *Entityes[j]))
						{
							numEntites--;
							Entityes[i]->m += Entityes[j]->m;
							std::cout << "m after impact: " << Entityes[i]->m << ". Vel After: " << Entityes[i]->vel << std::endl;
							Entityes.erase(Entityes.begin() + j);
						}
						else
						{
							std::cerr << "Erorr: collision with not a balls!" << std::endl;
						}
						//ElasticImpact(*Entityes[i], *Entityes[j], dt);
					}
				}
			}
	}

	if (GraviForce)
	{
		for (size_t i = 0; i < numEntites; i++) Entityes[i]->init();
		for (size_t i = 0; i < numEntites; i++)
			for (size_t j = 0; j < numEntites; j++)
				if (i != j)
				{
					float r2 = (Entityes[i]->pos - Entityes[j]->pos).lenght2();
					float f = G * Entityes[i]->m * Entityes[j]->m / r2;
					Vector3f force = (Entityes[j]->pos - Entityes[i]->pos).unit() * f;
					Entityes[i]->applyForce(force);
					Entityes[j]->applyForce(-force);
				}
	}

	for (size_t i = 0; i < numEntites; i++)
	{
		Entityes[i]->simulate(dt);
	}
	for (size_t i = 0; i < numEntites; i++) 
		if (!Entityes[i]->moved)
		{
			Entityes[i]->move(dt);
		}
}

Написано более двух лет назад

Imaginer @Imaginer Автор вопроса

Anaflion, я еще не реализовал запуск в отдельном потоке(

Написано более двух лет назад
mayton2019 @mayton2019

Если писатель редкий а читатели - частые - то существует вариант оптимистичного лока который разрешает
читателям не брать mutex а просто читать некий atomic счетчик. Я не знаю как этот шаблон может называться
в С++ его можно реализовать поверх std:atomic. Но в Java он выделен в StampedLock. Типа блокировка основанная
на таймстампе времени.

Написано более двух лет назад
Imaginer @Imaginer Автор вопроса

Не, тут наоборот - писатель чаще должен оюрабативатся(

Написано более двух лет назад
mayton2019 @mayton2019

Imaginer, слушай мне вот эта процедура Update(float) совсем не нравится.
Во первых убери из нее cout. Вывод в консоль - блокирующий и вредит производительности.
Во вторых она делает слишком много всего всякого. Коллизии. Гравитация. Это разные ее части
и я-бы разбил процедуру на под-процедуры как раз для регулировки перформанса. Это во вторых.
В третьих нужно понять временную диаграмму. Сколько % общего времени игры занимает эта процедура.
Поскольку она - эксклюзивная то ее время должно быть меньше чем суммарное. Посчитай с точностью
до милисекунд и микросекунд. Например игра работала 1 минуту и из этого времени Update(float) кумулятивно
занимал допустим 55 секунд. И тогда мы будем понимать есть ли вообще шанс у читателей успеть заскочить
в блокировку и что-то прочитать. И еще посчитай сколько раз вызывался update за 1 минуту. Блокировка
это такая сволочь что даже не делая полезной работы она может забирать полезные циклы CPU.

Исходя из полученных результатов можно будет придумать стоит ли тебе делать 1000 Герц на физику и 60
на визуализацию. Мне кажется что с физикой ты где-то ошибся. Не видно прямо таких убедительных
причин чтоб так часто обновлять вселенную.

Написано более двух лет назад
Imaginer @Imaginer Автор вопроса

Спасибо за критику)
cout забыл закоментировать(
Последую советам, переделаю Update.
Хочу вынести в отдельный поток процедуру Update что бы физика плавней была, так как процедура Render и остальное в главном потоке может занимать разное время. Ну и что бы на практике многопоточность использовать.

Написано более двух лет назад

Anaflion @Anaflion

mayton2019, может быть - если нужен вывод неблокирующий пользоваться "syncstream" ?

Источник кода

#include <syncstream>
#include <iostream>
int main() {
  
  std::osyncstream bout1(std::cout);
  bout1 << "Hello, ";
  {
      std::osyncstream(bout1.get_wrapped()) << "Goodbye, " << "Planet!" << '\n';
  } // emits the contents of the temporary buffer
  
  bout1 << "World!" << '\n';
  
} // emits the contents of bout1

Написано более двух лет назад

mayton2019 @mayton2019

Anaflion, тут даже вопрос не о блокировании экрана. А просто о смыслах. Ты посмотри о каких частотах там речь идет. Человек хочет 1000 раз в секунду выводить float аргумент. Зачем он тебе нужен? Какой толк в буферизации или небуферизации если глазами эту информацию все равно не взглядом не охватить и не осмыслить. Я в таких случаях просто завожу отдельный поток
который обновляет atomic переменные и тихонько публикует их в мониторингах. И видеть их уже можно через
ICMP, JMX, или просто через какой-то статус страничку в вебе. Вот это более инженерный подход.

Если нужно отладочное логгирование - то там спецом библиотеки есть. Но такое логгирование обычно имеет
глобальный выключатель чтоб в релизе не мешало.

Написано более двух лет назад
Imaginer @Imaginer Автор вопроса

1000 раз в секунду обновлять это я преувиличил, цель просто в отдельный поток перместить процедуру Update, что бы плавнее физика была. Попробою через atomic переменные.
Я для отладки выводил в кажом вызове dt в cout.
Спасибо за помощь)

Написано более двух лет назад
mayton2019 @mayton2019

Imaginer, потом атомики. Просто померяй какую долю времеи сьедает Update по отношению к общему.
Это то что доложно определять твою стратегию оптимизации concurrency. Измерения - великая вешь. И очень часто
разработчики имеют очень смутное представление что им надо оптимизировать в первую очередь.

Написано более двух лет назад

Решения вопроса 3

1 комментарий

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

Средний
Как инициализировать TCHAR*?
- 1 подписчик
- 08 авг.
- 62 просмотра
2

ответа
C#

+1 ещё

Средний
Где найти чистые исходники мобильного сервера SAMP / CRMP?
- 1 подписчик
- 06 авг.
- 115 просмотров
0

ответов
C++

+1 ещё

Сложный
Не работает поиск через Массив байтов, как исправить?
- 1 подписчик
- 03 авг.
- 102 просмотра
1

ответ
C++

Простой
Почему не получается вывести тип шаблона?
- 1 подписчик
- 02 авг.
- 62 просмотра
1

ответ
C++

Простой
Почему умные указатели нельзя интегрировать в язык?
- 1 подписчик
- 31 июл.
- 179 просмотров
3

ответа
Windows

+2 ещё

Средний
Как получить позицию икноки на десктопе, если известен его file index?
- 1 подписчик
- 27 июл.
- 132 просмотра
1

ответ
C++

+2 ещё

Простой
Проблема с подкючением TDLib в CMakeList.txt. Как решить проблему undefined reference to...?
- 1 подписчик
- 19 июл.
- 71 просмотр
0

ответов
Java

+1 ещё

Простой
Почему возникает deadlock?
- 1 подписчик
- 17 июл.
- 258 просмотров
1

ответ
C++

+3 ещё

Средний
Как настроить кросскомпиляцию Qt6 + TDLib под Windows на Arch Linux, если при сборке постоянно возникают ошибки?
- 1 подписчик
- 15 июл.
- 193 просмотра
2

ответа
C++

+1 ещё

Простой
В visual studio для c++ пишет ошибки E0070. Как их убрать?
- 1 подписчик
- 14 июл.
- 106 просмотров
0

ответов
Показать ещё Загружается…

Database Administrator

Wanted

До 5 000 $

Game programmer (Junior)

Dartheme Studios • Санкт-Петербург

от 300 $

Руководитель проектов по цифровому развитию клиентов в сфере недвижимости (CSM)

Сбер • Санкт-Петербург

от 200 000 ₽

Если это твой движок, то это тебя надо спрашивать, как распараллелить.
Обычно делается отдельный цикл событий для обработки физики и отдельный цикл для обработки ввода и рендера.
Не могли бы вы обозначить на пальцах содержание этих двух методов, чтобы понять - где там границы критической секции и как оная выбрана... Мне интересно - и для самообразования. На чем пишете? На Vulkan, OpenGL?

Но интересна сама суть - Update() расставляет геометрию и эффекты? Или отсекает от сцены то, что попадет в Render? В то время когда Render() рисует участок сцены, которая у вас попадает в обзор?

Рендер будет "молотить" в любом случае, поэтому многопоточная работа у вас происходит именно в расстановке геометрии и эффектов - в Update? Или наоборот...

Если Update лишь формирует поле обзора камеры игрока для Render с преобразованием участка 3D сцены в 2D изображение экрана то... Оный должен без блокировок читать Мир - который в свою очередь наполняется сущностями из вектора Entityes (это же у вас вектор состояний и объектов?) А наполнять Entityes должны уже некие потоки - сущности - активности игры, такие как игроки, неписи и эффекты мира? :) Я впервые разговариваю с разрабочиком движка - очень интересно.
Anaflion, я еще не реализовал запуск в отдельном потоке(
Если писатель редкий а читатели - частые - то существует вариант оптимистичного лока который разрешает
читателям не брать mutex а просто читать некий atomic счетчик. Я не знаю как этот шаблон может называться
в С++ его можно реализовать поверх std:atomic. Но в Java он выделен в StampedLock. Типа блокировка основанная
на таймстампе времени.
Не, тут наоборот - писатель чаще должен оюрабативатся(
Спасибо за критику)
cout забыл закоментировать(
Последую советам, переделаю Update.
Хочу вынести в отдельный поток процедуру Update что бы физика плавней была, так как процедура Render и остальное в главном потоке может занимать разное время. Ну и что бы на практике многопоточность использовать.
mayton2019, может быть - если нужен вывод неблокирующий пользоваться "syncstream" ?

Источник кода

#include <syncstream> #include <iostream> int main() { std::osyncstream bout1(std::cout); bout1 << "Hello, "; { std::osyncstream(bout1.get_wrapped()) << "Goodbye, " << "Planet!" << '\n'; } // emits the contents of the temporary buffer bout1 << "World!" << '\n'; } // emits the contents of bout1
Anaflion, тут даже вопрос не о блокировании экрана. А просто о смыслах. Ты посмотри о каких частотах там речь идет. Человек хочет 1000 раз в секунду выводить float аргумент. Зачем он тебе нужен? Какой толк в буферизации или небуферизации если глазами эту информацию все равно не взглядом не охватить и не осмыслить. Я в таких случаях просто завожу отдельный поток
который обновляет atomic переменные и тихонько публикует их в мониторингах. И видеть их уже можно через
ICMP, JMX, или просто через какой-то статус страничку в вебе. Вот это более инженерный подход.

Если нужно отладочное логгирование - то там спецом библиотеки есть. Но такое логгирование обычно имеет
глобальный выключатель чтоб в релизе не мешало.
1000 раз в секунду обновлять это я преувиличил, цель просто в отдельный поток перместить процедуру Update, что бы плавнее физика была. Попробою через atomic переменные.
Я для отладки выводил в кажом вызове dt в cout.
Спасибо за помощь)
Imaginer, потом атомики. Просто померяй какую долю времеи сьедает Update по отношению к общему.
Это то что доложно определять твою стратегию оптимизации concurrency. Измерения - великая вешь. И очень часто
разработчики имеют очень смутное представление что им надо оптимизировать в первую очередь.

Answer 1 · 2023-06-28 11:43:36

Если есть несколько потоков, то можно данные защищать через какой-нибудь mutex. Каждый поток перед тем как менять или читать данные, блокирует мьютекс, что-то быстрое делает, освобождает мьютекс. Лучше не держать его все время длинных вычислений, а, допустим, считать новые данные в локальных переменных, а потом в критической секции записать их в место, которое другой поток сможет читать.

Answer 2 · 2023-06-28 11:43:54

Это классическая задача читателей-писателей, способы решения этой задачи легко гугляся. Если вы хотите сделать функцию update потокобезопастной, то можете использовать любые доступные методы синхронизации. В данном случае нет серебряной пули и необходимо выбирать способ синхронизации самому. Вот пара простейших идей:

- Сделайте переменные, изменяемые в методе Update типа atomic.
- Сделайте доступ к данным через мьютекс (что в вашем конкретном примере не совсем эффективно, но очень просто в реализации).
- Если у вас предполагается лишь 1 поток (полагаю, что в данной задаче использование большего числа потоков не актуально), который будет обрабатывать функцию Update, то в начале функции вы можете сохранить все модифицируемые переменные (поля объекта) в локальные переменные и в конце функции взять мьютекс и сохранить значение локальных переменных в поля объекта.

Также интересно имеет ли смысл просчитывать физику объектов без ее отрисовки? Если данные физики качающего маятника используются лишь для отрисовки его на экране, то смысла в распараллеливании, насколько я понимаю, не очень уж много.

Answer 3 · 2023-06-28 20:39:35

Imaginer, плавности добиваются не этим. Обычно опираются на дельту времени кадра и интеполируют значения, в идеале с последующей корректировкой через кадры.
Т.е. к примеру, у тебя 60 фпс, просчет физики fps\3 =20. Недостающие кадры ты интерполируешь (тупо высчитываешь следующую координату из предыдущей и вектора движения), на ключевом кадре когда произойдет симуляция физики(со смещением времени) сравниваешь текущее интерполируемое значение и просимулированное, в случае различия двигаешь все на просимулированные данные т.к. они корректны и точны. Ошибки будут но они зависят от сложности физики, числа взаимодействующих объектов и фпс физики.
Примерно так оно везде устроено если упрощенно, на самом деле могут еще и уменьшать число фпс физики в зависимости от дальности объекта от камеры и прочие прочие трюки.

По потокам, дроби свой метод update на более мелкие задачи которые можно запустить параллельно. К примеру:
- скайбокс на котором упрощенно двигаются облачка, самолетики и прочее, на геймплей не влияют как и на физики, можно спокойно вынести это в поток
- расчет звуковых симуляций, это не бросится в глаза при неточностях.
Раздербанивать опираясь на то какая у тебя игра именно, и чаще всего в потоки получится вынести очень малую часть от всего объема

Answer 4 · 2023-12-04 22:55:49

Не очевидно почему физика должна стать "плавнее". Начинать нужно с профайлинга, и понять сколько времени выполняются функции Update() и Render(), и уже от этого решать как параллелить, что параллелить, и нужно ли вообще. Так же нужно определиться как обновляется игровое состояние - всегда ли с фиксированным шагом dt (православно), или позволительно обновляться с плавающим dt (не православно) - в этом случае результаты симуляции не будут сходиться у игроков с разным ФПС, и это может сильно мешать прохождению игры.

Случай 1: время выполнения одного Update() много больше Render()
Тогда вынос Update() в отдельный поток профита практически не даст, т.к. почти весь кадр он же и съедает, а оверхэд связанный с многопоточностью перекроет весь теоретический прирост ФПС с вероятностью 146%. В этом случае надо распараллеливать внутри вызова Update() - обновлять игровой стейт в несколько потоков. Если каждый объект модифицирует только собственный стейт, то все параллелится элементарно.

Случай 2: время выполнения одного Render() много больше Update()
Здесь уже два варианта:

можно попробовать обойтись без многопоточности, просто в начале кадра провернуть цикл с несколькими вызовами Update(), разбивая dt кадра на несколько шагов
вынести Update() в отдельный поток, и там уже крутить цикл с фиксированным dt или плавающим. Там же ограничивать логический ФПС, чтобы не считать игровой стейт, например, с частотой 2000 Гц, и не жарить процессор юзера

В общем случае идеальная многопоточность - это когда потоки не конкурируют за данные, которые одновременно могут быть читаемы и модифицируемы, т.е. точек синхронизации практически нет, и нет блокировок потоков. А мьютекс - это как раз блокировка в случае одновременного доступа двумя и более потоками. Чем больше кусок кода под мьютексом и чем больше потоков за него конкурируют, тем больше ущерб перфомансу, и тем печальнее вся многопоточность работает, и такой результат получить очень легко. Планировать использование мьютексов на раннем этапе игрового движка - это тупик, на такой поточности далеко не уехать. Мьютекс годится для редких операций, либо очень коротких вычислений под ним, либо ожидание происходит в каких-то вторичных потока, которые не приведут к фризу на экране.

В случае игрового движка, оптимальная схема будет выглядеть так:
Есть два независимых стейта - логический и графический.
Логический стейт - это вся физика, скрипты, эвенты, и тд - то что сейчас и есть.
Графический стейт - это минимально достаточный набор данных по каждому объекту логики, плюс состояние окружения, погоды, эффектов, и т.п. Этот стейт полностью описывает графический кадр, передается как аргумент в Render() и позволяет нарисовать весь кадр с нуля без обращения к логическому стейту. Этот стейт должен быть сериализуем, чтобы его можно было отложить в сторонку и через какое-то время нарисовать.
Так же у нас есть два потока - основной логический и основной рендерящий. В логическом потоке мы обновляем логический стейт, по необходимости по нему формируем графический стейт, после чего через тройную буферизацию передаем графический стейт в поток графики. Поток графики же всегда рисует самый актуальный графический стейт (предыдущие рисовать не имеет смысла), либо ждет, когда появится новый, если логика сильно тормозит.
В итоге имеет два потока работающих независимо, и единственное место синхронизации - это свап указателей/индексов в triple buffer, который сделан через атомики, что практически бесплатно (плюс ожидание на семафоре или спинлоке в потоке графики, если логика не успевает). В зависимости от задачи можно сделать чуть более жесткую синхронизацию, чтобы логический поток также ждал поток график, как сделано в большинстве движков, когда логический поток считает N кадр, а графический поток рисует (N-1), в остальных случаях один из потоков будет висеть на семафоре...

Псевдокод:

LogicObject { position, velocity, script, health, ammo,... }
//соответствующий LogicObject графический объект:
GraphicObject { position, shape, color, opacity, animationPhase...}

LogicState { time, vector<LogicObject > entites,....}

GraphicState { logicTime, camerPosition, cameraFOV, cameraAspect, ... , skyBoxID,  vector<GraphicObject> objects,...}


LogicState gameState;
TrippleBuffer<GraphicState> graphicStateBuffer;//3 графических стейта

//логический поток:
{    
    while(true)
    {
        Update(dt, gameState);

        GraphicState graphState = buildGraphState(gameState);
        graphicStateBuffer.write(graphState);
    }
}

//графический поток:
{    
    while(true)
    {
        //для простоты считаем что метод блокирующий, когда нет нового стейта
        bool bNewFrame = graphicStateBuffer.update();

        if(bNewFrame)
            Render(graphicStateBuffer.read());
    }
}

Если делать прям совсем на красоту, то можно сделать экстраполяцию позиций графических объектов. У каждого GraphState мы знаем время логического стейта, для которого он был запечен, и это время всегда в прошлом. Соответственно позиции графических объектов в начале кадра графики экстраполируются на разницу между реальным временем начала рендеринга и временем, когда этот графический стейт был сформирован. В этом случае к графическому стейту прилипают скорости всех объектов...

Как в ировом движке на C++ распаралерить функции Update и Render?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт