Итак, у вас там файл в формате JSON. Это специальный машиночитаемый формат данных. Более правильное решение в вашем случае выглядит следующим образом:
- Открываем JSON файл в любом редакторе, который его поддерживает
- Приводим его специальной командой в нормальный вид
- Смотрим на его структуру и определяем поля, с которыми надо работать - в вашем случае
originalText
и text
- Далее пишем простейший скрипт на JS (или любом другом вашем любимом ЯП) для чтения и парсинга:
import { readFileSync } from "node:fs"
let data, result = []
try {
data = JSON.parse(readFileSync('file', 'utf8'))
} catch (e) {
console.error('Ошибка загрузки файла', e)
}
- Реализуем требуемую вам логику по работе с текстом:
for(let item of data) // В данном случае, предполагается, что data - это массив
{
// Полезная работа
}
- А после - сохраняем результат в другой файл:
fs.writeFileSync("result.json", JSON.stringify(result));
Т.о. вся работа сводится к работе с однозначным и конкретным куском текста. У вас классический случай
Проблемы XY.