Как мне визуализировать огромное количество данных из xml-файла?

Question

Cobret @Cobret

C#
XML

Как мне визуализировать огромное количество данных из xml-файла?

Привет. Я начинающий UWP - C# разработчик. Я бы хотел чтобы моя первая программа могла сохранять записи пользователя для дальнейшей обработки. Все данные в строковом виде я решил записывать и сохранять в xml файл. Но сейчас я думаю над тем что если пользователь не будет ограничен в количестве создаваемых записей тогда их будет настолько много что я не знаю как их потом лучше визуализировать и чтобы программа не зависла при запуске.

Предположим количество записей будет около миллиона и тогда я хотел бы знать:
1. Смогу ли я загрузить файл для чтения и сохранить все нужные данные для начала в XmlNodeList чтобы потом перебирать и визуализировать частями?
2. Если я не могу такое огромное количество одновременно записать в XmlNodeList как мне тогда их получать из файла? Создать несколько файлов?
3. Если мне удалось извлечь необходимые мне данные из файла и сохранить их в памяти классами для дальнейшей обработки, то как мне визуализировать лучше всего это частями? Первое что приходит на ум визуализировать их по 200 или 300 или любым другим числом и запоминать индекс последнего и добавлять остальных по мере прокрутки страницы? Но самая большая загвоздка в том что пользователь может фильтровать или сортировать записи по своему усмотрению (по алфавиту, по дате или по другим признакам) как мне тогда запомнить последний визуализированный элемент?

Как лучше всего поступить в этой ситуации, чтобы сохранить производительность но чтобы и не ограничивать число записей?

-- Также хотел бы упомянуть что я решил визуализировать записи с помощью специальных UserControl, без ListView или GridView.

Вопрос задан более трёх лет назад
210 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Разработчик игр на Unity

13 месяцев

Далее
Академия Эдюсон

Разработчик игр на Unity + ИИ

6 месяцев

Далее
Stepik

PRO C#. Профессия "Backend разработчик"

4 месяца

Далее

Пригласить эксперта

Ответы на вопрос 5

Комментировать

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C#

+4 ещё

Сложный
Как сделать правильную перемотку видео в Flyleaf (wpf)?
- 3 подписчика
- 15 июн.
- 210 просмотров
1

ответ
C#

+1 ещё

Средний
Как передать изображение на принтер TSC?
- 1 подписчик
- 12 мая
- 141 просмотр
1

ответ
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 372 просмотра
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 113 просмотров
1

ответ
C#

+2 ещё

Простой
Как заставить кнопки в ScrollView корректно перераспределять остальные элементы при анимации?
- 1 подписчик
- 10 апр.
- 106 просмотров
1

ответ
C#

Простой
Как прочесть без блокировок в многопоточном приложение 16 байт структурное значение?
- 1 подписчик
- 30 мар.
- 196 просмотров
1

ответ
C#

+1 ещё

Средний
Как убрать проблему, из-за которой карта не возвращается в руку?
- 1 подписчик
- 18 мар.
- 312 просмотров
1

ответ
C#

Средний
Как скачать видео из MAX с параметрами C# GET?
- 2 подписчика
- 14 мар.
- 408 просмотров
0

ответов
C#

+1 ещё

Простой
Как переопределить стиль WPF-компонентов из подключенной библиотеки?
- 1 подписчик
- 02 мар.
- 127 просмотров
1

ответ
C#

Средний
Как в JsonSerializer.Deserialize игнорировать ошибки десериализации битого json?
- 3 подписчика
- 29 янв.
- 282 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2022-08-10 17:30:07

Ваша история выглядит примерно так:
1. Я по непонятным мне самому критериям выбрал язык разметки как формат для хранения данных.
2. Задумался, что он таки не очень хорошо подходит для этой задачи
3. Я хочу продолжать использовать этот формат, но хочу избавиться от проблем.

Я думаю, вам стоит в принципе попробовать другой формат.
Например, если у вас имеется очень много данных, над которыми потом надо производить аналитику - вам может подойти формат Parquet - он изначально для бигдаты и спарка придуман.

Раз нужно много разных сортировок и фильтраций - можно попробовать, например, sqlite или другую, более полновесную СУБД.

Если всё-таки хотите остаться на XML, то посмотрите в сторону поточного чтения документа с последующим преобразованием в какое-то внутреннее представление, с которым ваша программа сможет работать эффективнее (по сути вы так изобретёте свою СУБД на минималках с индексами и эффективной структурой)

Для поточного чтения можно попробовать класс XMLReader

Но самая большая загвоздка в том что пользователь может фильтровать или сортировать записи по своему усмотрению (по алфавиту, по дате или по другим признакам) как мне тогда запомнить последний визуализированный элемент?

Нужно сортировать все данные, а не только те что показаны - тогда смещение будет работать ровно так, как ожидается

Answer 2 · 2022-08-10 17:00:56

Вообще, я бы советовал посмотреть в сторону баз данных, т.к. они из коробки поддерживают выборку порциями.
Для небольшого приложения - подойдет sqlite, т.к. она встраивается в приложение и после попадания к пользователю не будет требовать установки каких бы то ни было программ связанных с БД.

Если все-таки нужно xml, то при работе с большими файлами лучше читать их построчно.
Upd: Вроде-как не совсем то. (см. комментарий)
(С шарпом не знаком, но поиск выдал класс streamreader и метод readline)

Answer 3 · 2022-08-10 18:56:25

XML-файл обычно используют для очень сложной доменной структуры. С композицией документов. Типа есть документ. В нем - такие-же под-документы. А если у вас структура плоская - то лучше писать в плоский файл. CSV или log. Есть еще вариант JSONL (Json-lines) где каждая строчка - независимый документ. В последнем случае метаинформация будет более очевидна чем в лог-файле.

Чтоб быстрее искать - можно большой файл побить на порции по дате-времени например /yyyy-mm-dd/hh-MM.xml
Если индекс по алвафиту - то тоже можно завести параллельно структуру /index/a/yyyy-mm-dd/hh-MM.xml, /index/b.... и так далее.

Файловая система в этом смысле лучше чем БД. Т.к. цена поддержки - нулевая. Никаких доп-процессов не будет.

Answer 4 · 2022-08-10 23:48:19

Используйте загрузку данных в некотором объёме. Допустим, настройте своеобразные страницы для просмотра (Типа сайта фильмов, они не загружаются все миллион, а страницами) и просто вытаскивайте из списка/массива от n индекса до m (m < length) и выводите на экран, или куда вам там надо) Можете так же настроить какие-то сортировки для большего удобства, что-то типа, вывести последних 200 штук

Answer 5 · 2022-08-10 16:56:24

Saboteur @saboteur_kiev

software engineer

Используй базу данных

Ответ написан более трёх лет назад

Комментировать

Как мне визуализировать огромное количество данных из xml-файла?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт