Fine-tuning опенсорсного LLM новому языку?Это не конкретная задача для машинного обучения. Машинное обучение мыслит категориями, supervised, unsupervised, количество параметров, общее количество данных, форма данных, размерности данных и т.д. И исходя из этого, можно в общем обсуждать время или что то еще. Тренировать языковые модели с нуля, не то что человеку не по карману, это только корпорации могут себе позволить. Тюнить готовые это другое дело, тут уже все возможно и для одного человека.
input_year = input('Введите год: ')
df = pd.DataFrame({
'date':pd.date_range('2021-01-01', periods=1000),
'temperature':np.random.uniform(-10,10,1000)})
selected_year = (df.set_index('date').loc[input_year]).copy()
selected_year
order = list(df['Шифр дисциплины'].str.split('.').str.get(0).unique())
cat.categories
Если накопишь данные, то тогда с гарантиями элементарный классификатор построишь и он будет работать. А сейчас можно пробовать только тюнинг готовых языковых моделей.