мне нужен расчет выходного значени фильтра по входному значению и нескольким выходным значениям. дайте пжл ссылку где это делается за один цикл, на любом языке. спасибо
Армянское Радио, по разному. пока десятки. но если делать нейросеть то могут быть тысячи а то и десятки тысяч. сейчас есть нейросети с миллирдами параметров. нам к сачастью столко не нужно
Александр Скуснов, надо разобраться. регистры 128 но арифметическое устройство 32. регистры очень быстрые так что ускорение может быть за счет обращения к памяти. вообще больше тормозит память чем процессор. снижение разрядости снижает память, это есть хорошо
Александр Скуснов, с программной точки зрения это обработка 128 разрядного слова. но физически это обединение 4 х 32 разрядных процессоров иди 4 такта одного процнссора. выирыша в общей производительности нет
Армянское Радио, работать с обычным алгоритмом, например генетическим. я вижу как точки группируются вокруг глобального максимима, это один из самых надежных алгоритмов. в конце апрксимировть и следить чтобы не улететь за пределы некорой зоны. общий принцип- максимально использовать уже вычисленные значения функции. это пытаются делать, меняют алгоритмы или их параметры по мере расчета. я попробую апроксимацию
Александр Скуснов, вообще я подумал что это врядли поможет. если процессор физически имеет 32 разряда то ичего не поделаешь, производительность не повысишь. надо снижать разрядность. в 32 разряда можно сделать два числа по 16 и внутри них числа 8 разрядов. можно спокойно складывать и умножать, переполнения не будет. уже в 2 раза быстрее. а еще хотелось бы разобраться с тензорными ядрами gpu. вы не в курсе7
Армянское Радио, вообще нейрон это несколько умножений и сложений. снижений разрядности позволяет делать несколько сложений и умножений в одном слове. те выигрыш в скорости будет ДЛЯ ВСЕХ ЗАДАЧ. другой вопрос как это повлияет на точность. если точности окажется недостаточным то можно доучивать сеть с большей разрядностью. гугл выбрал 8 разрядов для своего тензорного процесора, значит они считают такую разрядность наиболее востребованной
Армянское Радио, гарантий никаких нет. и не один алгоритм оптимизации не дает гарантии что вы нащли глобальный максимум. но в если вы действительно приблизились к нему то фукция хорошо аппросимируется даже параболой. это наверняка позволит уточнить результат без дополнительного вычисления целевой функции. а если вы попали в локальный максимум то ничего не поможет это попа
Армянское Радио, вот этого я понять не могую вопрос задан точно. и первый ответ говоримт о том что все понятно. там было замечание что точности не хватит. но гугл делает 8 разрядов, значит сочли достаточным. если я напишу что это работа с биржевыми данными разве будет понятнее?
Армянское Радио, я хочу заметить что очень хорошо понимаю что и зачем делаю. иесть неплохие полезные ответы. например по вопросы о полиномах мне подсказали конкретную пеализацию, не придется искать самому. са сработает это точно, хотя бы на конечном этапе оптимизации.
Армянское Радио, я же обяснил. если это уже делают то я лучше возьму или куплю готовое. мне нужен результат, готовое и дещевле и надежнее. с одной стороны лобовой путь это брать более мощное железо, оно нынче не дорогое. но сдругой стороны ресурсов всегда не хватает. сейчас наметился комплекс мер которые могут ускорить в несколько раз. это существенно. кстати когда сделаем и статейку на какой нибудь буржуйкий ресурс напишем. они оценят, там деньги считать умеют
Армянское Радио, я сам себе работодатель. и мне надо выжать максимум из железа. мне бы хотелось услышать что то полезное. прежде чем заказывать эту прогу я хотел бы поискать аналоги. я думаю что массовые продукты не делают в кодах не потому что не умеют а именно по тем причинам которые вы изложили. но у меня не массовый продукт
это полезная информация. физически ядра gpu 'это 32 разряда. я ожидал что снижение разрядности не используют. это вдохновляет. я написал в вопросе что тензорный процессор гугла использует 8 разрядов. можно обучить с этой точностью а потом утчонить. получится быстрее. некоторые призводители gpu дают ассемблер, можно попробовать с 8 разрядами