Как работать с большими файлами в режиме непрерывного чтения?

Question

Алексей @Renzo

C++
Qt

Как работать с большими файлами в режиме непрерывного чтения?

Доброго времени суток!

Есть некая программа, которая пишет некоторые данные в файл. Допустим, известен только формат строки (например, "время записи;число;число;число"), т.е. длина строки не фиксирована. Эта программа записывает данные не в постоянные интервалы времени, запись может производиться как раз в секунду, так и раз в 10 секунд. Моя задача - это считывать данные с этого файла и заносить их в базу. Как это вообще реализовать? Файл может быть больших размеров, я должен записывать только новые данные, те, что уже записал - не учитывать. При запуске моей программы, с файла должны быть считаны и записаны в БД строки, которые еще не были записаны. В какую сторону копать? Пока что не представляю, как это можно воплотить в жизнь.

Язык: C++/Qt

Вопрос задан более трёх лет назад
2277 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Разработчик C++

9 месяцев

Далее
Нетология

Специалист по информационной безопасности + нейросети

12 месяцев

Далее
Компьютерная академия «TOP»

Учебная программа “Разработка программного обеспечения”

30 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

+1 ещё

Средний
Имя массива это адрес первого элемента или указатель на его первый элемент в Си?
- 2 подписчика
- 12 нояб.
- 404 просмотра
5

ответов
C++

+1 ещё

Простой
Почему Project Dependencies не работает?
- 1 подписчик
- 10 нояб.
- 79 просмотров
1

ответ
C++

Простой
Влияет ли, передаёшь ты в функцию аргументы по ссылке или по значению, на производительность и память?
- 2 подписчика
- 07 нояб.
- 317 просмотров
2

ответа
C++

Простой
А нужно ли заменять dynamic_cast?
- 1 подписчик
- 07 нояб.
- 96 просмотров
1

ответ
Qt

+2 ещё

Простой
Как настроить РАЗДЕЛЬНЫЕ темы для Kvantum Manager?
- 1 подписчик
- 04 нояб.
- 33 просмотра
0

ответов
C++

Простой
Как понять что переполняет память в C++?
- 1 подписчик
- 01 нояб.
- 257 просмотров
1

ответ
C++

Средний
Как исправить некорректное отображение кириллицы?
- 1 подписчик
- 30 окт.
- 230 просмотров
3

ответа
Компьютерные сети

+1 ещё

Средний
Как обнаружить сканирование портов по логу сетевого трафика?
- 8 подписчиков
- 29 окт.
- 3284 просмотра
2

ответа
C++

Простой
Какой подход выбрать для представления Chunk?
- 1 подписчик
- 28 окт.
- 176 просмотров
1

ответ
C++

+2 ещё

Простой
Как подключить SFML к Clion на MacOs?
- 1 подписчик
- 14 окт.
- 104 просмотра
1

ответ
Показать ещё Загружается…

Big Data / ETL Engineer

Oracul Analytics

от 300 000 до 450 000 ₽

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Answer 1 · 2014-10-13 09:32:46

В линуксе есть tail -f. Можно посмотреть как это реализовано там и сделать аналогично, либо запускать вашу программу tail -f /path/to/file | myprogram и читать из stdin строки и писать в базу.

В винде, мне кажется, стоит копать в сторону fseek(). Например хранить дату последнего сообщения, и через fseek читать последние 5-10% файла и заносить только новые записи. Коряво, но будет работать.

Answer 2 · 2014-10-13 06:40:47

Копайте в сторону индексирования. Разделяйте на несколько файлов по времени записи, например.
Или храните "время записи -> оффсет внутри файла" где-нибудь отдельно.

Да даже можно использовать пайпы какие-нибудь - пусть данные записываются одновременно(или по очереди) в файл и в ваше приложение.

Ну и ничего страшного в большом размере файла нет. В вашем случае необходимо же считывать только последние записи - т.е. не весь файл, а только его конец.

Как работать с большими файлами в режиме непрерывного чтения?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт