Ответы, понравившиеся пользователю floppa322

Биекция в комбинаторике на конечных множествах?

Пума Тайланд @opium

Просто люблю качественно работать

Если брать два независимых отображения (f: S→G и h: G→S) — ты прав, этого недостаточно, и пример рабочий.

Но в комбинаторике имеют в виду одно f: S→G, у которого "ровно 1 g на каждый s" (функция) + "ровно 1 s на каждый g" — это про прообразы того же f, т.е. инъективность + сюръективность. Никакой второй независимой h нет. "Достижимость" и есть сюръективность, она прямо зашита в "каждый g покрыт ровно 1 стрелкой".

Ответ написан 01 мая

5 комментариев

Необходимость сохранения инвариантов при мат. индукции?

Wataru @wataru Куратор тега Математика

Разработчик на С++, экс-олимпиадник.

Очевидно, да. Чтобы доказать утверждение по индукции, вам надо из индукционного предположения P(k) доказать P(k+1). Если P(k+1) состоит из кучи частей Pi(k+1), то надо их все доказать. Ведь иначе у вас P(k+1) окажется истинным лишь частично, а значит вы индукционный шаг не доказали.
Если вам надо доказать, что "все овцы имеют 4 белые ноги", а вы выводите, только "у них 4 ноги", то вы не доказали исходное утверждение, ибо из "4 ноги" не следует "4 белых ноги". Может быть, у них 4 черных ноги.

Ответ написан 18 дек. 2025

1 комментарий

Правильное ли док-во существования функции?

Wataru @wataru Куратор тега Математика

Разработчик на С++, экс-олимпиадник.

Да, ваше рассуждение корректно. Но можно сильно проще.
F(2x+y)-f(x+y) = 2x

Обозначим x+y = a.
f(x+a)-f(a) = 2x

Очевидно, что это уравнение выполняется для любых x,a

Подставим a=0:
f(x)-f(0)=2x
или F(x) = 2x+f(0).
Обозначим f(0) за c.
F(x) = 2x+c.

Тут все рассуждения в обе стороны, мы не выводили следстие из чего-либо, а лишь переписывали известное нам уравнение в эквивалентное. И получили, что F(x) - прямая с наклоном 2. Других быть не может, потому что именно этот вид эквивалентен изначлаьному условию.

Edit: Был не прав в конце. Это не эквивалентные утверждения, но мы вывели логически из условия, что функция - прямая. Других быть не может, потому что противоречие: функция не может одновременно быть такой прямой и не быть. А мы прямую вывели.

Ответ написан 10 нояб. 2025

4 комментария

Как правильно заниматься перебором: a³ + b³ + c³ = d³?

Wataru @wataru Куратор тега Математика

Разработчик на С++, экс-олимпиадник.

Циклы в питоне - это ужасно медленно, да. Не лучший язык для написания числодробилки.

Еще, оффтопик, база даных тут совсем не нужна. Достаточно выводить числа на экран или в текстовый файл. так быстрее будет.

У вас самый наивный перебор в лоб, его можно ускорить. Сначала сгенерируйте все кубы и схраните их в массив. Их будет примерно кубический корень из |MAX_VAL-MIN_VAL| - это достаточно маленькая величина.

Теперь задача: найти 3 числа в массиве, дающих в сумме число из массива. Это все еще O(n^3), если исползовать 4 индекса. Но можно ускорить решение методом "встреча по середине".
Вместо A+B+C=D из массива будем искать A+B=C-D. Для этого переберем все пары чисел, подсчитаем их сумму и сохраним в dict() вместе со списком индексами этих чисел (список всех пар, дающих эту сумму). Потом опять переберем все пары, подсчитаем их разность и посмотрим в словаре, а была ли пара с такой же суммой. Если была - вот мы нашли 4 числа, таких что A+B=C-D. извлекаем корни и выдаем это в ответ.
Это будет уже O(n^2) - заметно быстрее.

Ответ написан более года назад

7 комментариев

Можно ли как-то короче доказать этот факт?

CBET_TbMbI @CBET_TbMbI

А это разве не является условием, а не следствием? Как можно доказать условие задачи? Никак, мы сами такую задачу задаём.

Решить систему уравнений значит найти такие значения Х и У, которые обеспечивают истинность обоих уравнений. Это определение задачи.

Значит Х(i) и У(i) из первого уравнения должны быть точно такие же, как Х(i) и У(i) из второго.
А это значит, что Х(i) из первого равно Х(i) из второго.
И, очевидно, что если заменить Х(i) на Х(i), то равенство не изменится.

Есть множество других пар Х и У, которые являются решениями первого уравнения, но не являются решениями второго. Вот их мы не считаем решениями системы уравнений.

Ответ написан более года назад

2 комментария

Можно ли как-то короче доказать этот факт?

Wataru @wataru Куратор тега Математика

Разработчик на С++, экс-олимпиадник.

После пункта 4 вам надо лишь доказать, что найденные xi yi будут всеми решениями системы. Допустим есть какое-то еще решение {x' y'} не среди xi, yi. Но, раз оно удовлетворяет f(x',y')=0, то x'=f'(y'). Еще оно удовлетворяет g(x',y')=0, а значит и g(f(y'),y') = 0, т.е. вы бы это y' нашли среди ваших yi, но мы предположили обратное.

Ответ написан более года назад

11 комментариев

Всегда ли DP можно представить в виде DAG?

Wataru @wataru Куратор тега Алгоритмы

Разработчик на С++, экс-олимпиадник.

Тут вопрос определений. Что считать "представить в виде DAG".

В ДП можно составить граф зависимостей: какие состояния участвуют в вычислении каждого. Это будет DAG. Иначе у вас надо вычислять значения через самих себя и у вас уже не рекуррентные соотношения, а система уравнений.
В некоторых задачах эту систему уравнений можно решать иерархически, по частям, отдельно в каждой компоненте сильной связности. Это немного напоминает ДП, но им не является. Суть ДП в том, что у вас рекуррентные формулы. Это некий более общий алгоритм.

Если интерпретировать вопрос как: можно ли сформулировать задачу в виде "дан граф, подсчитать вот такую функцию в каждой вершине", то тут можно натянтуть сову на глобус, придраться к деталям и сказать, что нельзя. Именно это и говорится в SO.

Потому что иногда рекуррентные формулы не симметричные и вам надо, например, одно значение прибавить, другое вычесть. Это не всегда просто определить исключительно в терминах графа. Нельзя сказать что-то вроде "сложить значение во всех вершинах, куда ведут ребра". Но если добавить в этот граф пометки на ребрах или параметры состояний в вершинах, то можно задать нужную функцию (вроде: взять значение для вершины, в которую ведет ребро с пометкой 1 и вычесть значение из вершины, куда ведет ребро с пометкой 2).

Но эти помеченные графы все еще будут DAG.

Ответ написан более года назад

3 комментария

Более формальный вывод из доказательства по принципу наименьшего числа?

Wataru @wataru Куратор тега Математика

Разработчик на С++, экс-олимпиадник.

Нет, эти рассуждения не нужны, вы перемудрили немного. Вы предположили, что во множестве есть минимальный элемент, но получили, что во множестве есть меньший этого минимума элемент. Противоречие. Ибо все остальные элементы множества больше минимального (по определению минимума). Все. Отсюда следуюет что во множестве нет минимального элемента.

Дальше, да, хорошо бы указать, что любое подмножество положительных целых чисел обязательно имеет минимальный элемент. А раз минимума нет, то подмножества с искомым свойством не существует. Но это очевидный и постоянно повторяемый факт, поэтому его часто пропускают.

Есть еще тонкий момент: рассуждения получающие меньший элемент заданного иногда нельзя применить ко всем числам. Например, если вы работаете с целыми положительными, а предположенный минимальный у вас 1, то из 1 вы меньшее число никак не получите. Поэтому надо сначала проверить, принадлежит ли 1 к множеству и потом предполагать существование минимального элемента > 1.

Ответ написан более года назад

1 комментарий

Покрытие графа циклами?

Wataru @wataru Куратор тега Алгоритмы

Разработчик на С++, экс-олимпиадник.

Вы расписали то, что в доказательстве скрывается за "clearly, any 2-factor of G translates into a perfect matching of G' and vice versa". Можно было бы чуть поформальнее, но основная идея правильная. Или можно еще проще: разбиение на циклы равносильно перестановке, которая для каждой вершины задает следующую в цикле. Перестановка равнозначна максимальному паросочетанию.

Действительно, полное парсочетание становится циклами. Да, если граф не ориентированный, или содержит "тривальные" циклы (длины 2), то они могут войти в покрытие. Если найдется не полное паросочетание, то в графе будут какие-то непересечающиеся циклы и возможно пути. Он может быть даже не весь покрыт при этом.

Ответ написан более года назад

3 комментария

Алгоритм для поиска мин. разреза?

Wataru @wataru Куратор тега Алгоритмы

Разработчик на С++, экс-олимпиадник.

У вас ошибка в понимании остаточной сети. Раз фиолетовые ребра насыщены, то на самом деле в остаточной сети есть обратные им ребра. И вершина v отлично найдется обходом из s.

Без этих обратных ребер алгоритм поиска потока не работает, ведь у него не будет возможности "отменять" потоки.
Например в графе:

________    
  a-b-c
 /  |   \
s   |     t
\   v   /
  d-e-f

Если сначала найдется поток по пути s-a-b-e-f-t, то дальше единственный способ его дополнить - это взять путь s-d-e-b-c-t, и надо будет "отменить" поток по перекрестному ребру b-e.

Ответ написан более года назад

1 комментарий

Можно ли обойтись без бин. поиска?

Wataru @wataru Куратор тега Алгоритмы

Разработчик на С++, экс-олимпиадник.

Именно max flow, а не mincostmaxflow? Потому что есть очевидное решение с mincostmaxflow.

Граф почти такой же. Раздвоенное ребро. В середину каждого ребра вход из истока пропускной способностью 1 и стоимостью 0. Вдоль ребра в обе стороны такие же ребра - пропускной способности 1 и стоимости 0. Из вершины делаем degree(v) ребер в сток. Каждое пропускной способностью 1 и прогрессивно увеличивающимися стоимостями. Первые ребра стоимостью 1. Вторые - n+1, сделующие (n+1)^2 и т.д.

Стоимость полного потока будет тем меньше, чем меньше максимальная степень, ведь даже одно ребро стоимостью (n+1)^k для вершины степени k+1 хуже чем если бы все вершины имели степень k и ответ был бы n*(n+1)^(k-1).

Если нужен именно просто поток, а не минимальной стоимости, то возможно можно изменить алгоритм потока, чтобы искать его итеративно для всех возможных значений x в вашем графе. Ведь алгоритм итерационно ищет дополняющий путь в остаточной сети. И ответ для x можно использовать в качестве стартового потока для задачи с x+1. Т.е не надо логарифм раз запускать поток для разных графов, а после выполнения увеличить пропускные сопособности нужных ребер на 1 и запустить поток дальше. Это будет как если бы вы запустили поток один раз с максимальной пропускной способностью сразу.

Ответ написан более года назад

2 комментария

Как свести задачу к минимальному разрезу?

Wataru @wataru Куратор тега Алгоритмы

Разработчик на С++, экс-олимпиадник.

Вам нужен 2-дольный граф. Левая доля соответствует строкам, правая - столбцам. Из истока ребора в левую долю (ценой ri), из правой доли - в сток (ценой ci). Ребра между долями ценой aij.

Любой разрез тут соответствует покрытию всех вершин. Вы должны разрезать ребро между ij или si или jt что чоответствует покрытию клетки, строки иои столбца.

Ответ написан более года назад

1 комментарий

Есть ли у этой задачи название?

Wataru @wataru Куратор тега Алгоритмы

Разработчик на С++, экс-олимпиадник.

Если вам можно брать вершины только из одной доли, то это задача set cover (покрытие множества). Каждая вершина в R задает множество в L и вам надо взять минимальное их количество, чтобы все L было покрыто. Это NP-сложная задача и у нее есть только медленные решения, вроде перебора. Еще можно свести ее к задаче целочисленного линейного программирования и решать каким-нибудь солвером.

Ответ написан более года назад

2 комментария

Дейкстра почти за линейное время (для неориентированного графа)?

Wataru @wataru Куратор тега Алгоритмы

Разработчик на С++, экс-олимпиадник.

В сетевом роутинге, в основном, нет* центрального узла с информацией о всей топологии, чтобы искать пути. Так что там вообще не работает Дейкстра, а работают распределенные алгоритмы.

А так, да, на очень специфичных гарфах всеядный алгоритм Дейкстры не самый лучший вариант. И ваш алгоритм тут получается быстрее.

* Вообще, есть такая тема, как Software Defined Networking, где как раз есть центральный узел, который все и решает, но это чисто теория пока, и там суть не в поиске кратчайших путей в графе а во всяких сложных механизмах приоритезации трафика и устойчивости к сбоям.

Ответ написан более года назад

1 комментарий

Когда целесообразно использовать именно такую реализацию DSU?

Wataru @wataru Куратор тега Алгоритмы

Разработчик на С++, экс-олимпиадник.

DSU выполняет две операции: проверить, принадлежат ли 2 элемента одному множеству; объеденить множества двух данных элементов. Обе за O(log*n) ассимтотически. Это не логарифм, а суперлогарифм, или обратная функция Аккермана. Это - сколько нужно двоек сложить в степенную башню, чтобы набрать n. Она растет так медленно, что ее можно считать константой на практике (она достигнет 4 только при n=2^65536 - вы столько числел не сохраните во всех датацентрах мира).

Я бы в качестве альтернативной, "тривиальной" реализации рассматривал массив пометок + списки в массиве:
для каждого элемента храним номер его множества, а для каждого номера храним список всех его элементов в списках (так же, как и в DSU, в одном массиве ссылок на следующий элемент).

Эта структура компактна по памяти и более быстра, чем ваши хеш таблицы. Тут можно за O(1) проверить, что два числа в одном множестве и за O(log n) объеденить два множества (амортизированно, если перекрашиваем меньшее множество).

Итак, имеем O(Log*n) vs O(1) за проверку и O(log*n) vs O(log n) за объединения.

Т.е. вроде бы имеет смысл использовать пометки+списки, если у вас заметно больше проверок, чем объединений.

Но на практике там выигрыша нет, ибо редко когда у вас сильно больше проверок. Да и, если у вас много проверок, то оценка O(log*n) - завышена, ведь если вы одну и ту же проверку повторяете, то там пути сжимаются и проверки работают уже за O(1).

Таким образом, DSU от Тарьяна - лучше всех других структур на практике.

Ответ написан более двух лет назад

7 комментариев

Можно ли так доказывать правильность алгоритмов?

Wataru @wataru Куратор тега Алгоритмы

Разработчик на С++, экс-олимпиадник.

Если их нельзя переворачивать и при равенстве высот все-равно можно вложить (а не только строго меньшее), ио алгоритм правильный. Но доказательство не полное. Надо доказать, что любая неубывающая последовательность в этом массиве даст веладывающиеся прямоугольники.

Ответ написан более двух лет назад

7 комментариев

Метрическое пространство для k-nearest neighbors?

Griboks @Griboks

Предлагаю пойти ещё дальше и определить для вашей некой пока неизвестной функции выбора апостериорные метрики. Тогда на достаточно репрезентативной (большой) выборке можно сделать аппроксимацию функции выбора какой-нибудь известной, например линейной комбинацией ваших n-мерных кубов.

Но есть нюанс...

Строго говоря, придётся всё равно выбрать меру более высокого порядка уже для аппроксимации. Однако, полагая, что чем выше порядок меры тем глаже метрики (и что функция дифференцируема), можно смело сказать, что более высокий порядок меры даст лучшие результаты.

Но мы можем пойти ещё дальше и выполнить оптимизацию (например, градиентным спуском) аппроксимации целевой функции выбора. Для этого придётся определить функции более высокого порядка: меру ошибки и функцию обратного распространения ошибки. Короче, сделать нейросеть.

Останется только одна проблема - удостовериться в оптимальном выборе мер и функций обучения нейросети. Поскольку у вас есть компьютер, то вы можете составить матрицу всевозможных параметров обучения (не модели) и банально проверить все возможные комбинации.

Ответ написан более двух лет назад

1 комментарий

Метрическое пространство для k-nearest neighbors?

dmshar @dmshar

Теоретически может использоваться любая функция, которая удовлетворяет аксиомам метричности (тождества, положительности, симметричности, треугольника). Которые, в свою очередь, выражают интуитивные представления о понятии "расстояния". Т.е. можно взять любую функцию, проверить, удовлетворяет-ли она указанным аксиомам, и если да - то применять. В данном случае понятия "лучше"-"хуже" нет - этот вопрос выноситься за скобки, и как правило является предметом исследования на этапе предварительного анализа задачи.

Наиболее распространенным меры, применяемые в кластерном, классификационном анализе, в задачах распознавания образов и пр. - уже упомянутая вами эвклидова мера (или метрика L2). Ее модификация - квадрат евклидова расстояния. Манхэттенская мера (или метрика L1), мера Махаланобиса, мера Чебышева, мера Хэмминга, косинусная мера (полезная в многомерном пространстве, но в случае, если много параметров могут иметь нулевые значения), ее модификация - "мягкая" косинусная мера, мера Кульбака — Лейблера (если все значения всех признаков положительны и векторы объектов нормированы на единицу ) и пр.

А бывают еще неметрические меры близости. (т.е. случаи кода используется функция, которая нарушает одну из упомянутых выше аксиом). В общем, не советую задавать вопрос в теоретической плоскости типа "какой мат. аппарат понадобится для решения такой задачи", потому как там, в этом аппарате, можно и закопаться :-). Достаточно ознакомиться с такой вот интересной книгой: Деза Е.И., Деза М.-М. Энциклопедический словарь расстояний. Ну и при большом желании все перечисленные выше метрики, их описание и области применения легко гуглятся.

Что до практического использования этого аппарата - такая функция должна подбираться для каждой прикладной задачи отдельно. Это подтверждается успешным использованием в разных прикладных областях различных специфических мер близости - например, мера Левенштейна и мера Джаро — Винклера (используемые при обработке текстов), мера Хаусдорфа (при работе с подмножествами), мера Вассерштейна (применяется в различного рода транспортных задачах и - неожиданно - в обработке изображений, от распознавания рукописных текстов до диагностики по рентгеновским снимкам), и пр. А иногда выбор и обоснование тех или иных мер в конкретной задаче есть предмет научных статей и даже диссертаций.

Ответ написан более двух лет назад

1 комментарий

Какя разница в формулах теоремы Байеса?

Mercury13 @Mercury13

Программист на «си с крестами» и не только

В знаменателе — формула полной вероятности. Вот и всё.
p(B) = p(B|A)·p(A) + p(B|¬A)·p(¬A)

Для чего? Да просто p(B) в большинстве случаев хрен поймёшь, и его приходится вычислять непрямо. Например:
A — письмо является спамом
B — в письме есть слово «sex»
Видим в письме слов «sex» — спам ли оно?
Мы можем собрать базу спама со словом «sex», и базу обычной переписки с этим словом, и вычислить p(B|A) и p(B|¬A). А p(A) и p(¬A) вычисляются уже на компе конечного пользователя в зависимости от того, насколько жёстко его спамят.

Пример второй. Каждый тысячный водитель — пьяный. Алкотестер чётко видит алкаша, но останавливает каждого сотого трезвого. Какой процент из приехавших в больницу действительно пьянствуют за рулём?
U — проехавшие через пост водители
A — пьяный
B — алкотестер сработал
Аналогично, p(B) заранее неизвестен, но приходится вычислять по полной вероятности. И вроде бы при таких цифрах один из одиннадцати попавшихся реально пьяный. И это затрудняет антитеррористические меры: если по городу-миллионнику ходит сотня террористов, какая должна быть точность, чтобы не ломать невинные жизни!
UPD: чуть меньше 1/11: p(B|A)=1, p(A)=1/1000, p(B|¬A)=1/100, p(¬A)=999/1000,
итого с сокращением на 1000 будет 1/(1+999/100)=100/1099.

Ответ написан более трёх лет назад

Комментировать

Модель F(x) с разрывом типа «скачок»?

Wataru @wataru Куратор тега Математика

Разработчик на С++, экс-олимпиадник.

Сила трения. Имеет разрыв в v=0. Ездили когда-нибудь в автобусе или метро каком-нибудь? Пробовали не держаться за поручни? Вот когда оно тормозит, вас вперед тянет некая сила, которая внезапно обрывается, когда транспорт полностью останавливается. Вот это оно фактически. Сила трения действует на транспорт, вам, с вашей точки зрения, кажется, что это вас тянет вперед (хотя это корпус автобуса тянет назад). Но в момент достижения нулевой скорости эта сила трения становится резко равной нулю.

Ответ написан более двух лет назад

4 комментария

Войдите на сайт