Нужно быть очень злым буратиной чтобы целенаправленно загружать диск.
Любой тест дисковой поверхности загружает его на 100%. Или любое копирование
файлов в /dev/null делает тоже безсмысленную и безпощадную нагрузку.
Твои дата-сайенс задачи просто должны не доходить до такого. И в большинстве
случаев они и не дойдут. Потому что информацию с диска надо не просто читать
но еще и процессить. Обучать какую-то нейросетку.
Если ты все таки где-то умудрился такое сделать, то это - не промышленная задача.
Это что-то маргинальное и оно скорее всего не интересно к обсуждению.
Дурное дело - не хитрое.
Функция indexOf возвращает ПОРЯДКОВЫЙ НОМЕР подстроки или символа в исходной строке.
А вовсе не то что ты написал. Я делаю на этом акцент чтоб ты сам понимал то что ты делаешь.
Кошкин. Тебе же пишут. Имя можно задать любое при создании Thread,
Это имя может быть абсолютно любым и никакой системы в нем нет.
Единственное на что ты можешь расчитывать это на уникальность номера
ThreadID.
Да. Подобную автоматизацию можно вполне сделать на Питоне.
Только дьявол кроется в деталях. И я-бы спросил автора
- что делать с дубликатами имен файлов? Переписывать или предупреждать?
- что делать с файлами которым не нашлось ключа в таблице?
- почему автор пишет "рассортировать". Эта задача не является сортировкой. Просто для термина уже
существуют устойчивые определния и то что хочет автор - это скорее классификация.
У тебя очень перегретое ТЗ. Лучше из него убрать такие поэтические метафоры экстремально
или "чем быстрее, тем лучше". Потому что под них невозможно написать никаких SLA, AC.
Лучше нарисовать картинкой диаграмму из кубиков где слева течет информация
и описать роли и отвественности кубиков.
Разуместся главный кубик - это язык С++ и использование AsyncIO API. В Linux оно называется
multiplexing IO. Там кажется всего три функции select, poll, epoll.
В современных C++ фреймворках эти функции могут быть просто завернуты в какое-то громкий API.
Какой - я к сожалению не знаю т.к. давно уже не писал ничего на С++.
Да. Если будешь подписываться на какие-то SLA, то никогда не указывай максимумы минимумы и средние.
Пиши про 95 процентиль например. Типа 95 % всех сигналов будут обработаны за 1мс.