По простому, ответ - никак!
Формально можно, но по факту это будет создание своей ИИ почти с нуля (можно взять опыт deepseek, вроде бы они все расписали, порядок вложений несколько десятков миллионов баксов, и хотя они 'стояли на плечах гигантов' они реально молодцы, openai потратили на пару порядков больше)
Новые знания заливать в gpt модель не получится! почти любые попытки файнтюна дают деградацию и фокусировку на конкретных знаниях (да есть успешные примеры обучения ии на чатах, она отлично ловит стиль текста, но умнее от такого не становится, даже наоборот). Правильный файнтюн требует изначальную обучающую выборку, есть алгоритмы прореживания данных, что бы дообучать не на полном датасете а только на его части и что бы деградации не было или была по минимуму.
Обучающую выборку ни одна компания с адекватными моделями не публикует (из жадности) - потому что для нейронки это и есть исходники, а итоговые веса для инференса - это как .exe-шник работать работает, но что то поменять не получится.
p.s. файнтюн а еще лучше алгоритмы RLHF позволяют изменить формат представления данных, например внедрить системный промпт в модель, что бы при ее итоговом использовании он не требовался (что бы не тратить на него драгоценные токены), это выглядит не так просто как написано, нужно правильно составлять обучающую выборку и тюнить качественную модель валидатор ответов (так например по словам разработчиков, характер алисы от яндекс был внедрен в ее модель, все ее ответы на вопросы о ее предпочтениях, отношению к чему либо и т.п.).
p.p.s. что бы показать, почему это сложно, проведите эксперимент, возьмите самую простую нейронную сеть, которая будет пытаться подменить какую-нибудь функцию, типа y=sin(x), дайте ей пару тройку слоев и визуализируйте процесс - выводя на экран исходную функцию и что она строит... а затем посмотрите, что получится если взять обученную сетку и подсунуть ей другую функцию, пусть даже слегка модифицированную,.. сеть начинает сходить с ума, пытаясь забыть старые данные и воспринять новые... и оказывается что обучить заново с нуля сеть на новых данных тупо быстрее по затратам, чем переобучивать предыдущую