• Запись строк только в конец файла?

    @dmshar
    Из документации (https://python-reference.readthedocs.io/en/latest/...
    Note that if the file is opened for appending (mode ‘a’ or ‘a+’), any seek() operations will be undone at the next write. If the file is only opened for writing in append mode (mode ‘a’), this method is essentially a no-op, but it remains useful for files opened in append mode with reading enabled (mode ‘a+’).

    Так что поведение вполне ожидаемо.
  • Какие эффективные методы для обработки больших массивов данных?

    @dmshar
    4ainik,

    1) анализ выбросов и аномалий;
    charuaggarwal.net/outlierbook.pdf
    2) анализ рядов с изменением параметров модели;
    urss.ru/cgi-bin/db.pl?lang=Ru&blang=ru&page=Book&i...
    3) анализ рядов на основе нелинейной динамики;
    https://www.pks.mpg.de/nonlinear-dynamics-and-time...
    4) кластеризация временных рядов;
    https://umexpert.um.edu.my/file/publication/000056...

    И да, в нейронных сетях я не "шарю", я в них разбираюсь, потому-как изучал, достаточно глубоко и серьезно.
  • Какие эффективные методы для обработки больших массивов данных?

    @dmshar
    4ainik,
    Я понял суть вопроса. Я понял, что вы в том числе с моей подачи, ознакомились с такими терминами, как "временной ряд". Я понял, что что-либо самостоятельно читать-изучать не входит в ваши привычки-намерения.
    Про "поставить на место за 5 минут" - меня немного улыбнуло. Хотя я не очень понял, вы за пять минут при очной встрече покажите, что вы больше меня понимаете "в статистике" и уже поняли, что такое "визуализация"? Или вы как-то по другому привыкли решать научные вопросы? После этого вопрос про возраст меня уже не удивил. Заниматься вашим дальнейшим просвящением в направлении "овладевания (!!) предметной областью статистики" и отвечать на ваши вопросы - более желания нет.
    Удачи в самообразовании.
  • Какие эффективные методы для обработки больших массивов данных?

    @dmshar
    Ну, начинайте считать:
    https://otexts.org/fpp2/
    И учтите, что это очень неполный перечень. Как минимум, там не затронуты такие огромные разделы (не конкретные методы, а именно целые направления) анализа временных рядов, как:
    - анализ выбросов и аномалий;
    - прогнозирование временных рядов методом SSA;
    - анализ неэквидистантных временных рядов;
    - мультивариативные временные ряды;
    - анализ пространственно-временных временных рядов;
    - анализ прерванных временных рядов;
    - анализ рядов с изменением параметров модели;
    - анализ рядов на основе нелинейной динамики;
    - логико-вероятностные модели анализа временных рядов;
    - анализ на основе нечеткой логики;
    - кластеризация временных рядов;
    - использовнаие МГУА для анализа временных рядов;
    и еще много других. И это мы еще даже не подошли к использованию нейронных сетей для анализа и прогнозирования временных рядов.
    Так что думаю, 121 - это еще не все методы.
  • Какие эффективные методы для обработки больших массивов данных?

    @dmshar
    4ainik,
    Во-первых, почему в кавычках?
    Во-вторых, кроме Яндекс есть Гуугл.
    В-третьих, кроме "Прореживание рядов" есть еще и "Прореживание обучающей выборки".
    В-четвертых - пять-это не мало, тем более для начала изучения, вообще-то.
    В-пятых и самых главных - а каким боком к вашей задаче относиться это самое прореживание??? С моей точки зрения - никаким.
  • Какие эффективные методы для обработки больших массивов данных?

    @dmshar
    уже по новым обработанным данным построить еще графики и они даже могут выглядеть иначе и возможно даже более информативно.
    По-моему, вы нас троллите. Метод скользящего среднего излагается на третьей странице любого учебника по временным рядам. В чем суть вопроса?
    способы представления - вам мало графиков - ну стройте диаграммы рассеивания значений, определяйте параметры распределения и стройте соответствующие графики.
    Спрашивать "какие вы знаете способы обработки/анализа временных рядов" - корректно на экзамене у двоечника, которого тянут на тройку, но не на форуме.
    Прореживание временных рядов" - известная процедура описанная в любом учебнике по статистике.
    Начните все-таки с самообразования.
  • Какие эффективные методы для обработки больших массивов данных?

    @dmshar
    Я вас поздравляю, что вы познакомились еще и с кластерным анализом. На ваш вопрос - можно-ли? - отвечаю "можно". Но для этого надо изучить и одну тему (временные ряды) и другую (кластерный анализ").
    По секрету скажу вам, что есть еще 121 других методов, которые могут применяться. Надеюсь, что вы не будете спрашивать про каждый из них в отдельности, а просто займетесь их изучением?
  • Какие эффективные методы для обработки больших массивов данных?

    @dmshar
    4ainik, Уважаемый 4ainik.
    Судя по вашим вопросам :"какие виды графиков еще можно придумать и вообще что с помощью статистики можно получить на выходе"., может есть какая-то статья на эту тему, может у вас уже есть какие-то графики - уж не обижайтесь - наталкивает на мысль, что вы никак с этой темой не знакомы. От слова "совсем". И хотите, что-бы тут вам друг рассказали, что вам делать с вашими данными, даже не рассказывая, что это за данные. Так не бывает. Начините с азов - откройте любую книгу, учебник, статью по временнЫм рядам, читайте, разбирайтесь, примеривайте на свою задачу. Естественно, многое будет вам непонятно, вот тогда приходите сюда и задаете вопрос - "вот этот-вот вопрос мне не понятен, помогите, пожалуйста". И имеющиеся тут "специалисты по статистике" вам с радостью помогут. А так "изложите мне тут по быстрячку на форуме раздел науки", которые на самом деле люди изучают в универе, возможно несколько семестров, а потом еще и практикуются годами, что-бы до конца разобраться в теме - так не бывает.
    Материалов по теме в сети не просто много, их море небозримое. Просто берете первый попавшийся учебник - и вперед. Ну, а если просто для начала ознакомиться - то можно начать хоть отсуюда
    https://www.kdnuggets.com/2017/01/time-series-anal...
    people.duke.edu/~rnau/411home.htm
    https://pokrovka11.files.wordpress.com/2011/12/eme...
    https://paulvanderlaken.com/2017/05/11/time-series...
    baguzin.ru/wp/analiz-vremennyh-ryadov
    https://www.kdnuggets.com/2018/03/time-series-dumm...
    https://www.analyticsvidhya.com/blog/2016/02/time-...
    Да просто хоть в Гугле по первой-же ссылке идете
    http://www.machinelearning.ru/wiki/index.php?title...
    и от нее - по внутренним ссылкам.
    Удачи. И возвращайтесь сюда с реальными вопросами.
    P.S. И да еще раз, на всякий случай, имейте ввиду, что к Большим Данным - как вам уже тут сказали - ваши данные не имеют вообще никакого отношения. Ваша тема поиска в Гугл "Анализ временных рядов".
  • Какой стек технологий использовать для анализа игроков в спорте?

    @dmshar
    Dr_Gonzo,
    " Саму реализацию будут делать разработчики." - а что будете делать при этом вы сами? :-).
    Я понимаю - разработать архитектуру, подобрать необходимые "части" (предварительно оценив варианты, все за и против", продумать интерфейсы и пр. - и речь идет отнюдь не о трех камерах по углам площадки). Но для этого надо вообще-то говоря быть очень продвинутым специалистом, с налету такую задачу - решить то можно, но лучше - не надо. И даже просто выучить по книгах - для нормального решения - мало. Надо еще и опыта набраться на более простых, обозримых задачах. А это время (и деньги).
    Есть еще одна роль - оплатить такую разработку. Ну, то есть поставить свое имя в ряд перечисленных выше Apple, Google... - потянете? А рассчитывать на то, что эти ваши конкуренты вбухали в проекты миллионы, а вы справитесь за пару тысяч рубчиков - как-то по меньшей мере непрофессионально.
  • Анализ геоданных?

    @dmshar
    А руководитель что, физически недоступен?
    Просто к чему тут кластеризация, если просто "тыкать на карту" - не совсем понятно. Может на карте есть заготовки описаний в привязке к координатам и надо найти ближайшее к "тыкнутой". Или наоборот - несколько "тыкнутых" точек как-то надо связать в кластер? А может что-то другое имеется ввиду под " будет происходить анализ информации".
    Выясняйте, станет яснее. Тогда и думать о чем-то конкретно можно будет.
  • Как запустить pretrained model?

    @dmshar
    Fissium, Повторяю.
    "Потому что в Python 2 функции print() нет, а есть оператор print. Т.е. строка должна выглядеть вообще иначе."


    Я код смотрю. И репозиторий. И вижу, что цитированная вами фраза залита туда год назад, а файл data_loader.py - 10 месяцев назад. Выводы делайте сами.
    Не хотите на третий Python переходить - заменяйте оператор на синтаксически корректный, делов то.
  • Как запустить pretrained model?

    @dmshar
    Fissium, Нет, не правильно.
    В коде видно, что в нормальном случае - идет работа с картинкой, а в случае исключения (т.е конвертации не получилось по каким-либо причинам) картинка создается новая. Перед созданием идет запись в файл информации об этом событии. Вот без этой записи можно в принципе обойтись, как мне кажется.
    Ну и убедитесь, что вы работаете Python 3. Потому что в Python 2 функции print() нет, а есть оператор print. Т.е. строка должна выглядеть вообще иначе.
  • Как запустить pretrained model?

    @dmshar
    Тот, который в 17 строке файла data_loader.py.

    print(..., file=sys.stderr)
  • Как организовать он-лайн получение информации от систем мониторинга?

    @dmshar Автор вопроса
    Strabbo, Спасибо, смотрел. Но вот именно оперативный, онлайн отбор данных там не нашел.
  • Как организовать он-лайн получение информации от систем мониторинга?

    @dmshar Автор вопроса
    Ezhyg, Спасибо, но очевидно я не совсем правильно объяснил. Надо не удаленную машину мониторить, а на данной конкретной машине одновременно уметь снимать телеметрию оборудования (загрузка ЦП, памяти, обращений к диску, температуру процессора и пр.) и снимать некоторые показатели работы сети, к которой этот компьютер подсоединен. Так что об удаленном агенте пока речи нет.
  • Как организовать он-лайн получение информации от систем мониторинга?

    @dmshar Автор вопроса
    Strabbo, Спасибо. попробую. Но тема - не закрыта :-)
  • Как организовать он-лайн получение информации от систем мониторинга?

    @dmshar Автор вопроса
    Strabbo, Так и я о том-же. Комп - однозначно Windows. Даже если сервер - то тоже Windows. Поэтому - не подходит. Увы.
  • Какую тему диплома выбрать?

    @dmshar
    Если учесть, что тот-же автор тот-же вопрос об актуальности тем в области ИБ задавал почти год назад, можно сделать вывод о том, как он проучился четыре года, ну как минимум - весь последний год. Мне кажется единственные толковый совет, который ему можно дать - искать что-то гораздо более простое, чем ИБ.
  • Как еще аргументировать, что это пирамида чистой воды?

    @dmshar
    lagudal, И возможно что мои аргументы и впрямь неубедительны, и вот хотят более явных каких-то, или более профессиональных. ---- > Да не хотят они комментариев!!! Они хотят от вас подтверждения собственных иллюзий того, что это "конфетка". И что-бы вы не говорили - они это не воспримут.
    Боитесь, что вас потом в чем-то обвинят - просто говорите им открытым текстом: "По моему мнению - это пирамида и разводняк. Хочешь приключений - на твои будущие заоблачные доходы претендовать не буду, но и ко мне никаких претензий в случае пролета. Я тебя предупредил, потом не говори, что нет".
    Другого (разумно-рационального) выхода из этой ситуации не существует.