• Как сгенерировать случайную величину с заданной многомерной функцией распределения?

    wataru
    @wataru Куратор тега Математика
    Разработчик на С++, экс-олимпиадник.
    Есть способ генерировать по одной компоненте. Но надо, чтобы функция была очень хорошая: ее должно быть можно интегрировать и вдоль и поперек и обращать.

    Известно, как сгенерировать одномерную величину с заданной функцией распределения: обращаем функцию распределения (интеграл плотности) и подставляем туда равномерно распределенную на отрезке 0..1 величину.

    Пусть у вас 3 компонены x,y,z. Интегриркем по y,z, получаем функцию плотности для x. Гегерируем. Потом подставляем это значение в функцию плотности и получаем новую, уже двухкомпонентную функцию (ее еще надо будет поделить на плотность для данного x l, чтобы нормировать). Повторяем операцию для y.

    Но, как и в одномерном случае, этот метод не просто применить, если функция рачпределения сложная, или у нее интеграл просто не берется.

    В противном случае можно натягивать сетку и считать интеграллы и обратные функции численно.
    Ответ написан
    4 комментария
  • Как время передачи запроса зависит от расстояния до веб сервера?

    @asmelnik
    Если вам нужно, что бы контент с сервера был доступен с задержками поменьше на большой географии, то Сервис CDN (Content Delivery Network) вам в этом может помочь.
    Если сервер в Новосибе, а клиент из Калининграда, то скорость и время отклика для Новосиба и Калининграда будет сильно отличаться.
    При использовании CDN (если у CDN провайдера сеть достаточно разветвленная) время может быть минимальным и там и там.
    Ответ написан
    Комментировать
  • Как выбрать расстояние до веб сервера?

    @dronmaxman
    VoIP Administrator
    Провайдеру не выгодно гонять трафик через Токио) Гарантировать один маршрут можно только в пределах одной локальной сети. В других случаях такая идея ломает резервирование каналов и балансировку. 95% случая маршрут всегда будет самым коротким.

    Те знать время прохождения до того ка взял сервер практически невозможно.

    У провайдера услуги можно встретить утилиту или список IP для проверки связи к различным его датацентрам и таким образом определить оптимальный датацент для размещения VPS.

    Так что, забивай в google провайдера который понравился и добавляй speedtest
    как пример
    https://fastvps.ru/support/kb/8456431
    https://ishosting.com/ru/looking-glass
    Ответ написан
    1 комментарий
  • У кого есть программная реализация lstm ячейки на python or c?

    @AlexSku
    не буду отвечать из-за модератора
    Алгоритмы есть в Википедии, можно реализовывать на любом языке.
    Пример на С из Гитхаба (автор пишет, что позаимствовал алгоритм у Андрея Карпатого, наверняка у того на Питоне).
    На самом деле есть несколько модификаций архитектуры. Даже более продвинутые (по скорости и экономии памяти) получили своё название: GRU (gate reccurent unit).
    Ответ написан
    4 комментария
  • Какие есть программы для графического проектирования нейронных сетей?

    @AlexSku
    не буду отвечать из-за модератора
    В Матлабе есть приложение Deep Network Designer. Только он для России уже не даёт лицензий.
    видео
    Ответ написан
    1 комментарий
  • Как выучиться на машин-лернера с нулевой базой математики?

    @Everything_is_bad
    Если ноль, то проще забить на теоретические основы, а разобраться с текущим состоянием готовых решений - библиотеки и пониманием, какие методы из всей кучи доступных, нужны для конкретного типа задач. А с нуля сейчас пишут только в учебных целях при обучении в универах
    Ответ написан
    7 комментариев
  • Существует ли нейросеть для краткого пересказа книг?

    Adamos
    @Adamos
    Сказано: "Даже о литературном произведении нельзя судить по содержащимся в нём словам!" (с) Шинкарев.

    Филологи утверждают, что главная идея, суть и рефрен поэмы "Москва - Петушки" выражается буквально в трех словах: "встань и иди". В самой книге эти слова встречаются только дважды, причем в одном абзаце.

    В общем, чтобы изложить МЫСЛЬ - автор и пишет книгу, даже если кому-то она кажется слишком толстой. А вот выжать СЮЖЕТ (если он вообще есть, это необязательно) - это даже тупая нейросетка, наверное, сможет...
    Ответ написан
    3 комментария
  • Какой размер кэш процессора на одно ядро?

    Melkij
    @Melkij
    PostgreSQL DBA
    Может различаться для конкретных реализаций. Потому, необходимо уточнять в Datasheet конкретного процессора, если это для вас важно.

    Например, Intel 13 generation (Raptor Lake):
    64e36131e373d800849356.png
    L1 для данных (DFU) и L1 для инструкций (IFU) у каждого ядра свои собственные.
    L2 у каждого P-ядра свой собственный, но для E-ядер - используется общий.
    L3 общий
    Ответ написан
    3 комментария
  • Какой размер кэш процессора на одно ядро?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Обычно L3 - общий для всех ядер а L2/L1 - персональные кеши для каждого Thread/Kernel.
    Но технологии меняются. И я не думаю что это какая-то окончательна архитектура. Могут быть
    и исключения.
    Ответ написан
  • Какие есть стандартные наборы данных для тестирования и сравнения нейронных сетей?

    @dmshar
    Ну, можно еще и тут:
    https://huggingface.co/datasets
    Ответ написан
    Комментировать
  • Какие есть стандартные наборы данных для тестирования и сравнения нейронных сетей?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Если зайти в вики по ключевому слову MNIST - можно найти наборы для распознавания рукописного ввода. И еще от самой странчки MNIST еще 2 ссылки идут на аналогичные тестовые сеты.

    +UPD

    https://en.wikipedia.org/wiki/MNIST_database
    https://www.kaggle.com/datasets
    Ответ написан
    3 комментария
  • Какая разница между валидационным и тестовым наборами данных?

    Maksim_64
    @Maksim_64
    Data Analyst
    Смотри в теории машинного обучения есть такая важная тема как Resampling Methods. Это методы случайной выборки из данных которые у тебя есть. Есть два основных это Cross Validation и Bootstrap. Обычно во всяких обучающих материалах используется Cross Validation да и на практике он тоже очень популярен. Что он из себя представляет мы берем например делим случайным образом датасет на 5 частей. Сначала треним на 4 потом тестим на одном что остался, потом на других 4 и тестим на одном что остался и т.д. Так вот каждый такой набор (на котором мы тестим) называется валидационным набором. Например наша метрика MSE мы получим 5 MSE по каждому валидационному набору потом обычно берут среднее по ним.

    Теперь про тестовый сет. Есть правило алгоритм во время трениовки, никогда не должен видеть тестовый набор. Есть два подхода первый мы имеем отдельно тестовый набор на котором мы тестим после всех дел, когда все закончили включая тюнинг модели и тренировочный разбиваем как в примере выше и у нас по очереди получаются валидацонные наборы. Есть и второй подход, когда обходятся без тестового набора, потому что его нет, данных мало и тогда только поочередные валидационные наборы используются.

    Используют и то и то. Это инженерное решение и ты будешь видеть оба подхода. Ну и на каких то обучающих историях, ты можешь увидеть отсутствие кросс-валидации и только разбиение train_test_split.

    В идеале все выглядит вот так. Единственное существует огромное количество разных кросс-валидаций.

    64bcbf8e217a9092904980.png

    Это пример где кросс-валидация используется для тюнинга гиперпараметров, но точно также она будет использоваться и для других целей, каждый синий Fold это и есть валидационный набор.
    Ответ написан
    4 комментария
  • Почему процессоры gpu не любят разветвлений в программе?

    @vadimr
    Процессор GPU выполняет так называемую векторно-конвейерную обработку. Это означает, что у него имеется набор конвейеров для векторов, то есть связанных между собой функциональных узлов, которые по очереди совершают однотипные операции над элементами массивов. Представьте себе конвейер на автомобильном заводе – на первом рабочем месте на шасси привинтили двигатель, потом конвейер подвинулся, стали там же прикручивать двигатель на следующее шасси, а на первое шасси в это время на втором рабочем месте устанавливают коробку передач, и т.д. Так же и в векторно-конвейерном процессоре. Он построен на том, что на каждом этапе конвейера выполняются одинаковые операции над разными элементами вектора. Компилятор разворачивает операции с массивами или простой цикл в такую конвейерную обработку. А если там будут условные операторы, всё сломается. Получится, что рабочий иногда должен монтировать двигатель, а иногда клетку с хомячком вместо него. Разброд и шатания, тем более, что эти операции могут быть разными по продолжительности. Конвейер так не работает. Поэтому условная операция будет вызывать очень длительную перенастройку контейнера на новую последовательность операций обработки.
    Ответ написан
    4 комментария
  • Как узнать память видеокарты и ее быстродействие?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Такие библиотечки как CUDA и OpenCL в части инициализаци должны выдавать сведенья о железе.
    Может эти сведенья будут очень high-level но должны быть.
    Ответ написан
    9 комментариев
  • Как сделать чтобы mysql хранил таблицы в ОЗУ?

    iMedved2009
    @iMedved2009
    Не люблю людей
    16.3 The MEMORY Storage Engine

    З.Ы. Но вы явно чего то не то замыслили.
    Ответ написан
  • Где браузер хранит данные Web Storage?

    dimonchik2013
    @dimonchik2013
    non progredi est regredi
    \AppData\Local\Google\Chrome\User Data\Default\Local Storage

    конечно можете, стиллеры же получают ))))))))))
    Ответ написан
    2 комментария
  • Как на python эмулировать клавиатуру и мышь?

    Pakonigoosy
    @Pakonigoosy
    Разработчик ПО
    Есть библиотеки mouse и keyboard
    Читайте документацию, они очень мощные
    Ответ написан
  • Как создавать сценарии тестирования?

    saboteur_kiev
    @saboteur_kiev
    software engineer
    Сценарии тестирования обычно делает тестировщик, зачастую senior или смотря какая квалификация нужна.
    В тестом взаимодействии с разработчиками и аналитиками, чтобы покрыть все требования и упростить тестирование и его автоматизацию.

    По сценарию уже либо пишутся автоматические тесты, либо их выполняют рядовые тестировщики.
    Ответ написан
    4 комментария
  • Как создавать сценарии тестирования?

    dimonchik2013
    @dimonchik2013
    non progredi est regredi
    тестировщик читая постановщика )))

    что такое тесты:
    лююая система сложна, пилится не одним (да и одним тоже, посмтрите на код через полгода - иногда и комментирвание не помогает вспомнить что оно и зачем) а командой
    птому после изменения в одном месте может сломаться в другом

    вот тесты и покрывают проверки перед выкаткой - а все ли в "в другом" по-прежнему?

    сюда же добавляются редкие до которых не додумыватся никто (а додумывание с опытом приходит и то... ) и находят уже пользователи

    + критически юридически зависимые (например галка о подписке, запрос кук , ГДПР и проч) - их вообще хз кто из техников додумается проверить, и делают после пинка сверху в частности
    Ответ написан
    4 комментария
  • Какие есть программы для размещения рекламы на видеоролике?

    opium
    @opium
    Просто люблю качественно работать
    так у многих видео редакторов есть пакетная работа с видео, помню много лет назад так вставлял в тысячи видосов логотип
    Ответ написан
    Комментировать