offtopicУ вас, к сожалению, очень сильно не хватает базы в программировании и пользовательского опыта. Советую прежде чем разбираться с ML пройти курс по Python. Хорошо подойдут, например, эти курсы на stepik (бесплатно)
Начальный и
Продвинутый
В данный момент у вас в программе нет файлов. Есть две строки, которые сохранены в переменные text1 и text2. Чтобы загрузить файл в переменную, его нужно считать. Если это простой текстовый файл (формат txt), то поищите
чтение из файла python. Если вы хотите, читать более сложный формат - например, docx - то необходимо использовать библиотеку, которая умеет с ним работать. О том, как считать весь файл в строку (простейшее использование), обычно указывают в примерах в документации библиотеки. Ищите
docx python.
Стоит также помнить, что такой подход (загрузка всего файла в память), может не сработать с большими файлами и тогда стоит использовать потоковые методы обработки. "Чтение строки - обработка" и так до конца файла.