Therapyx
@Therapyx
Data Science

Парсинг целого стринга на различные аттрибуты(производительность)?

Так как с .НЕТ перешел на Java(по работе) не совсем знаком с эффективными медотами для работы с текстом. Суть заключается в том, что данные очень огромные, считывание идет из 5 огромных файлов, которые передаются в функцию целыми строками. Пусть это будет String data;

Такого типа: String data = "H 534624325 [3] 4234 32.5"
итд, как видно все разделенно простым пробелом. Сперва идет string, int, string, double

Т.е. все это надо передать в функцию someFunction(string, int, string, double) в разбитом состоянии.
напоминаю: Данные текут десятками гигабайт. На что лучше всего мне смотреть в этой ситуации? Подскажите подходящие функции, как более еффективно работать с такими вещами учитывая малейшие погрешности в производительности? Статьям тоже рад. Заранее спасибо :)

upd: наткнулся сейчас в поисках гугла на StringTokenizer, но опять же боюсь, что постоянная инициализация 5-10 аттрибутов и передача их в другую функцию будут не достаточно эффективной.
  • Вопрос задан
  • 383 просмотра
Решения вопроса 1
@sirs
Попробуйте использовать Google Guava Splitter.

P.S. Если честно то кажется, что Вы занимаетесь преждевременной оптимизацией. Обычно пишут самый простой/быстрый/очевидный вариант и проверяют как работает под нагрузкой, а уже потом при необходимости начинают его улучшать.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
Rou1997
@Rou1997
Многопоточность и многоядерность, диск SSD, бинарный поиск.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы