Neural Network, я думаю что тебя возьмут без опыта с обещанием что будешь учиться и работать. Хотя за РФ не могу говорить. У вас - сложнее все гораздо.
Neural Network, придумай что-нибудь. При 200 человеках на место - HR будет сортировать все резюме по количеству опыта. Вообще если ситуация так плоха - кидай к чорту Java/Android и переключись на что-то более редкое и нужное.
Вот эти пункты:
-проверить и изменить кодировку;
-проверить орфографию;
-убрать нечитаемые символы;
нужно очень детально расписать с примерами. Потому что сложность решения может меняться на порядки буквально в зависимости от 1-2 слов в этом задании.
Что такое проверить орфографию? Я - не знаю. Где достаточное условие проверки? Неясно.
Кодировки. Надеюсь речь не идет о симметричном шифровании. Но базовых кодировок с кирллицей
всего 4 (cp866/1251/Unicode16/utf8) и обычно задача сводится к проверке что текст статистически похож на кириллицу.
У меня часто такое было. Найдешь в торрентах нужную книжку в pdf. Свежак. Год издания - текущий. Качаешь. Открываешь. А там внутри - одна странчка с рекламой. И линка которая веден на сайт 100% фишинговый. Вот такую мерзость я часто видел.
PVkolos, мы теряем время. Что такое aiogram я всё равно не знаю. Да и никто тебе не скажет. Зачем тут астрология? Надо точнее. Сделай отчет профилирования и он покажет какая стока в коде сколько памяти сожрала.
Есть расширенная часть закона Амдала (это про HighLoad) которая показывает что начиная от некоторого количества потоков перформанс приложения будет резко падать. Далее запускай хоть 64 хоть 128 ядер. Они все будут драться за один спинлок или выбивать полезные странички из L1 и ожидать своих страничек к примеру и это займет их 99% времени. А оставшися 1% они будут посвящать полезной работе.
Лекарства от этого нету. Есть варианты - уменьшить число потоков и поднять тактовую частоту. И второе - просто переписать приложение по другому.
Дружище. Ищи конспект по курсу. Этот вопрос - седьмая вода на киселе. О каких этапах идет речь? Об исторических? Начиная от того как древние люди жгли костры чтоб информацию передать на расстояние. Это - тоже можно рассказать. Но лучше наверное понять контекст как излагал препод.
В качестве лирического отступления. Данная проблема решаема в MySQL хотя это нарушение 1НФ. Обычно в таблицах лежат атомарные значения с которыми мы работаем атомарно. Тоесть рассматривая их как единое целое. Если-же у нас регулярно возникает задача реплейсмента частей поля в таблице то такую таблицу надо срочно переделать. Она - не реляционная по смыслу.
Это можно но безсмысленно. Дело в том что утилизация CPU не всегда связана с производидельностью приложения. Можно запустить и больше конкурирующих потоков и процессов но они будут конкурировать за оперативную память и кеши L1-2-3 и диск.
Оптимальную нагрузку можно подобрать только исходя из КПД вашего приложения. Меряйте с секундомером время готовности пережатого фильма. Оптимум можно будет найти за 3-5 экспериментов с разным числом потоков.
С миром автопрома есть хорошая аналогия. Расход бензина например. Вы-же не ставите задачу своей машине - жечь его как можно больше?
Leonid_V, на всяких там процессах ETL я съел собаку. Но даже мне непонятно какой собственно ответ тебе нужен.
Может у тебя были просто завышенные ожидания? Знаешь есть такой принцип KISS? Его Java разработчики часто слышат но редко соблюдают. Они занимаются овер-проектированием. Тоесть вносят в задачу сущностей больше чем надо для решения этой задачи. Хотя KISS говорит что код должен содержать ровно минимум для решения задачи.
Ты попробуй здесь в qna задать свой вопрос. Только про "распаршенные" данные - надо написать подробнее.
PVkolos, мало информации. Ты вот что, дружище. Давай публикуй исходники и какой-то memory analyze. Я уверен что твой прикладной код является причиной распухания.