Как лучше оперировать большими объемами данных, используя C#?

Question

Илья Трифонов @ilyatrifonov

C#

Как лучше оперировать большими объемами данных, используя C#?

Ситуация следующая: я получаю, предположим, около миллиона строк (возможно больше), которые записываю в List<MyClass> Followers.
Также у меня есть еще один список List<MyClass> Likes с таким же большим количеством элементов, около одного миллиона (возможно больше).
Далее мне нужно сделать Likes.Intersect(Followers).
Правильный ли я подход использую, храня это в обычных List<T>, или нужно делать это как-то иначе? И не нарвусь ли я на ограничение на объем List<T> в 2GB?
Каким образом можно сделать максимально быстрым фильтрацию (нахождения пересечения, INNER JOIN проще говоря) этих двух массивов данных?

Вопрос задан более трёх лет назад
171 просмотр

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Stepik

Профессия "C# разработчик"

1 неделя

Далее
XYZ School

C# для разработки игр

5 месяцев

Далее
Учебный центр IBS

DEV-001_NET Шаблоны проектирования GoF. Редакция для .NET

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 3

4 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C#

+1 ещё

Простой
Как создать копию предмета и добавить ему компонент?
- 1 подписчик
- 08 нояб.
- 122 просмотра
1

ответ
C#

+1 ещё

Простой
Как сделать постраничную навигацию в Avalonia UI MVVM?
- 2 подписчика
- 08 нояб.
- 93 просмотра
0

ответов
C#

Простой
Почему одинаковые делегаты работают по разному, В 10 Раз разница в скорости?
- 1 подписчик
- 27 окт.
- 278 просмотров
0

ответов
C#

+1 ещё

Простой
Почему не работает обратная привязка в Avalonia UI?
- 1 подписчик
- 22 окт.
- 145 просмотров
1

ответ
C#

+1 ещё

Средний
При каких входных данных моя программа работает неверно и как мне научиться самому это понимать? Как научиться искать ошибки?
- 2 подписчика
- 20 окт.
- 359 просмотров
3

ответа
C#

+2 ещё

Простой
Как универсализировать обычный ViewList в WPF C# XAML?
- 1 подписчик
- 20 окт.
- 97 просмотров
2

ответа
C#

+1 ещё

Простой
Как проверить, наследует ли объект в обобщённом методе?
- 1 подписчик
- 16 окт.
- 116 просмотров
1

ответ
C#

+1 ещё

Средний
Пермач после авторизации [WTelegram,TDLib] как исправить?
- 1 подписчик
- 10 окт.
- 320 просмотров
0

ответов
C#

+1 ещё

Простой
Как в VSCode для C#-кода сгенерировать или посмотреть только структуру?
- 1 подписчик
- 01 окт.
- 144 просмотра
1

ответ
C#

+1 ещё

Простой
Почему VSCode панель Outline view не показывает классы и функции из C# кода?
- 1 подписчик
- 01 окт.
- 145 просмотров
1

ответ
Показать ещё Загружается…

C# WinForms .Net разработчик

Ляпунов и Резниченко • Санкт-Петербург

от 350 000 ₽

QA automation (C#)

Альфа-Банк • Москва

от 200 000 до 350 000 ₽

QA Automation Engineer (C#)

Centicore Group • Москва

До 300 000 ₽

Answer 1 · 2017-04-08 19:22:52

GavriKos @GavriKos

Микропетпроджект - домашнее облако homeCloud

Используйте базу данных. Они как раз вот для этого.
А про нарветесь или нет - посчитать легко, зная размер MyClass средний.

Ответ написан более трёх лет назад

4 комментария

Answer 2 · 2017-04-08 20:48:18

List<T> не имеет ограничения по объему. Если у вас 32-битная система - то вы нарветесь на ограничения в 2 GB оперативки, если 64-битная - то будет забивать память под завязку. Подход неправильный, т.к. вы не знаете, сколько памяти у конечного юзера.

Правильно посоветовали насчет БД - это самый простой подход. Используйте SQLite, как самую простую переносимую БД.
Подход посложнее - сохранять записи в файлы, затем делать Intersect порционно, алгоритмически.

Answer 3 · 2017-04-08 22:14:32

AtomKrieg @AtomKrieg

Давай я поищу в Google за тебя

Для больших объемов надо использовать hashset

Ответ написан более трёх лет назад

Комментировать

Как лучше оперировать большими объемами данных, используя C#?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт