Ответы, понравившиеся пользователю d'Ivan

Выбрать ли RTX 3060 12 Гб или RTX 5060 8 Гб для бюджетного AI?

rPman @rPman

для бюджетного AI

очень малоинформативно, но от этого может зависеть выбор железа.

С точки зрения сырой производительности, видеокарты отличаются на 25% (а тензорных ядер разница на 10%), и 5060 должна быть незначительно быстрее. Так же есть момент, в прошлом nvidia была замечена в 'умышленном' замедлении старых видеокарт в драйверах, вынуждая подбирать еще и правильную версию, ничто не мешает делать это в будущем, что бы продавать никому не нужные новые видеокарты.

Но есть еще момент, который может быть важнее скорости железа, причем меняя картину на порядок - количество оперативной памяти видеокарты. В тот момент, когда ее станет недостаточно, скорость падает, а точнее время, необходимое до получения результата вырастает на порядок.

Типовая ситуация - если веса нейронной сети и вся обучающая выборка полностью влезает в vram, то мощности видеокарты будут утилизированы на 100% и скорость сходимости при обучении (количество циклов прогона) будет наилучшей). Если обучающая выборка целиком не помещается в видеокарту, то ее размещают туда по частям, прогоняя цикл не по всем данным а по каждой части. Это так же позволит нагрузить видеокарту на 100% но итоговое количество циклов прогона увеличится (сходимость ухудшится, но это кстати может зависеть от алгоритма разделения обучающей выборки на части).

Если же веса нейронной сети не помещаются в оперативную память, то скорость тем более падает драматически (на порядок), даже если не помещается только небольшой процент, что очень заметно при использовании gpt нейронок.

Поэтому я рекомендую выбирать больше оперативной памяти чем производительность.

Ответ написан 01 окт.

Комментировать

Какие нейронки или программы смогут восстанови эл. схему по фото платы?

pfg21 @pfg21

ex-турист

никакая. ИИ не золотая таблетка для двоешника Васи :)
для того чтобы ИИ чтото смог его надобно онному обучить.
т.е. набрать кучу плат и схем и скормить ИИ, что весьма геморно и следовательно дорого. кому нужно - практически никому.
второе - не думаю что образность текущей логики ИИ даст даже после большого хорошего обучения сколько бы нормальный результат на произвольной плате.

Ответ написан 30 апр.

7 комментариев

Можно ли что нибудь оптимизировать в коде функции поиска?

VoidVolker @VoidVolker

Dark side eye. А у нас печеньки! А у вас?

Да, конечно можно - оптимизируйте, вам никто не запрещает. Оптимизировать можно вообще любой код. Оптимизация делается по конкретным критериям и под конкретную задачу. А ещё бывают противоположные критерии, когда оптимизация по одному критерию ухудшает другой. Поэтому для начала вам следует определиться с конкретными критериями оптимизации и что именно вы хотите оптимизировать в вашем коде. А так же какую именно задачу решить данной оптимизацией. И уже после этого проводить оптимизацию вашего кода.

Ответ написан 29 апр.

2 комментария

Как внести большое количество данных из Excel и pdf файла в БД?

Василий Банников @vabka

Нет.
pdf файл вообще не структурирован и предназначен для просмотра человеком, просто так импортировать из него данные не выйдет.
ексель файл тоже не очень структурирован обычно, но если он очень простой, то можно его в csv перевести и потом в тот же postgres через COPY его импортировать.

В общем случае тебе придётся писать парсер

Ответ написан 23 апр.

3 комментария

Допустима ли ссылка на сайт с пикантным контентом?

Кот Абсолютный @CityCat4

Жил да был черный кот за углом...

Порно в РФ - огромная серая зона. Законодательство не дает никаких определений (ни что такое порно, ни что считается эротикой, а что - порно ни какие есть легитимные способы его производства и "потребления"). Законодательство гораздо только запрещать (хотя запрещать порно это примерно то же самое, что прятаться от дождя под дырявой крышей - постоянно где-то протекает...
Поэтому по возможности лучше делать отсылки на техническую часть непосредственно.

Нынче никого, слава Богу, голыми сиськами не удивить. Раньше стим краснел как тургеневская девушка при виде МПХ, когда в игре был хентай например (даже абсолютно безобидный) - а сейчас там Dirty League :)

Ответ написан 20 дек. 2024

2 комментария

ИИ в строительной отрасли, какой выбрать?

Евгений Орлов @Mentalitet Куратор тега Искусственный интеллект

NLP lead

Вопрос в меньшей степени лежит на стороне выбора модели (хотя это тоже), тк ни одна модель сейчас не способна взять одну большую задачу и решить ее от начала и до конца. Даже чатгпт и прочие большие коммерческие модели с наилучшим качеством ответов.
Основное - это выделить четкие границы, в которых будет проводиться работа
Если составляем документ, то что на вход? Какого формата? Какие этапы обработки? Что на выход?
И так по любой вашей инициативе. Лишь разложив процесс на мелкие составляющие и максимально упростив каждый из этапов для ЛЛМ, уже можно пробовать собрать пайплайн, который с бОльшей вероятностью приведет к успеху.
Также, крайне важным составляющим успеха является технология Structured Output, которая помогает доставать из модели более детерминированные ответы и улучшать ответы даже маленьких моделей за счет того что мы можете направлять модель в какую сторону ей нужно думать

Ответ написан 28 февр.

Комментировать

Полезные инструменты для проверки мошенников?

Drno @Drno

мозг

Ответ написан 15 февр.

Комментировать

Как организовать систему обновлений БД?

VoidVolker @VoidVolker

Dark side eye. А у нас печеньки! А у вас?

Это называется "Миграция БД". Для этого уже давно есть готовые инструменты, которые уже много лет применяются везде.

Ответ написан 02 янв.

Комментировать

Допустимо ли хранить логи nodejs приложения в mysql бд или есть решения лучше?

Vitaly Karasik @vitaly_il1

DevOps Consulting

Есть - уже лет 10+ назад придумали БД для логов. Самые популярные сегодня - Elastic (== ELK в прошлом) и Loki.
Есть куча облачных сервисов на базе этих БД.
Все современные логгеры поддерживают log shipping по сети.

Ответ написан 25 дек. 2024

Комментировать

Допустимо ли хранить логи nodejs приложения в mysql бд или есть решения лучше?

shurshur @shurshur

Сисадмин, просто сисадмин...

Смотря что именно логгируется и для чего используется. Например, во многих CMS (админпанели, блоги итд) существует "логгирование действий пользователей" и оно традиционно использует базу. Ибо именно из базы удобнее и проще всего через web это показывать.

Но логи для админа или разработки или службы поддержки писать в базу - это скорее всего будет плохим решением.

Также плохое решение использовать console.log. Нужно использовать специальные библиотеки для логгирования, они есть под любые развитые языки. Например, такие, как winston для node.js. Библиотки позволяют настраивать уровень логгирования, транспорт (файлы/syslog/итд), что позволит написанный один раз код потом не переделывать под другие реалии (запуск в кубере, запуск для тестов на машине разработчика итд итп).

В процессе развития и роста можно будет уже приделывать Elastic/OpenSearch, vector, greylog, logstash итд итп в зависимости от потребностей. Для пет-проекта это, скорее всего, не нужно. Но даже для пет-проекта полезно учиться правильным практикам. Чтобы потом хорошо делать в больших и сложных.

Ответ написан 26 дек. 2024

Комментировать

Допустимо ли хранить логи nodejs приложения в mysql бд или есть решения лучше?

rPman @rPman

Логи нужно не просто писать в какую-то базу, а делать их машиночитаемыми, иначе смысла нет.

Пишут тут что это нужно только если у тебя миллионы запросов и гигабайты логов.. все это чушь (не совсем, просто если у тебя маленький проект, пользу логи будут приносить редко), а вот централизованная работа с логами со всех своих инстансев и даже проектов, очень даже неплохо, облегчает мониторинг, облегчает разработку, облегчает поиск проблемных пользователей/ситуаций и т.п... но ценою ресурсов на это.

А так, первым шагом можно вместо записи в базу данных, просто писать в jsonl (построчно по json на событие), по меньше упаковки в человекочитаемые строки и побольше читаемые машиной, постаравшийсь полностью исключить вывод сообщений об ошибках в stdout/stderr, и над именованием файлов подумать, что бы удобнее с ними было работать.

Ответ написан 25 дек. 2024

Комментировать

Правильный способ реализовать поиск с автодополнением по одному слову?

David Gegiya @Davidaa_WoW

Зависит от того, что вы храните в индексе, и какой результат в итоге хотите получить.
Какие могут быть кейсы:
1. В индексе хранится много чего: кошки, собаки, попугаи и т.д.
Решение: заводите новое поле, например 'pet_type'. Устанавливайте в него значение, например: 'собака'. Далее, создаёте статический фильтр синонимов в индексе, называете его, например 'pet_analyzer' и прописываете список необходимых синонимов. В результате должно получиться, что-то типа такого:

PUT /pets_index
{
  "settings": {
    "analysis": {
      "filter": {
        "pet_synonyms": {
          "type": "synonym",
          "synonyms": [
            "собака, щенок, кобель => dog",
            "кошка, кот, котёнок => cat",
            "попугай, попугайчик => parrot"
          ]
        }
      },
      "analyzer": {
        "pet_analyzer": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": ["lowercase", "pet_synonyms"]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "pet_type": {
        "type": "text",
        "analyzer": "pet_analyzer"
      }
    }
  }
}

2. В индексе хранятся только собаки, либо вам нужно распределение (щенки/взрослые собаки/распределение по полу)
В таком случае, добавляете эту характеристику прямо в name. То есть документ у вас будет называться: 'Щенок лабрадора'. Далее, смотрите на типы формирования входящих запросов. Вам могут подойти:

Match phrase prefix. Поиск по части фразы. Ссылка на документацию: https://www.elastic.co/guide/en/elasticsearch/refe...
Поиск с оператором OR. Когда в запросе содержащем несколько слов, совпадает хотябы одно. Ссылка на документацию: https://opster.com/guides/elasticsearch/search-api...
Поиск по неточному совпадению. Найдёт и 'щенок' и 'щинок' и даже 'чухуахуа', зависит от того, какой уровень неточности вы настроете. https://www.elastic.co/guide/en/elasticsearch/refe...

Ответ написан 16 дек. 2024

Комментировать

Как сделать копию папки из контейнера на компьютер после отработки кода?

ky0 @ky0

Миллиардер, филантроп, патологический лгун

Примонтируйте каталог как volume - тогда бэкап можно будет делать даже при выключенном контейнере.

Ответ написан 07 дек. 2024

2 комментария

Как конвертировать модель в GGUF и квантовать?

rPman @rPman

На самой странице модели есть пример кода на python или ссылка на github или докер образ, как ее использовать, обычно там же простым способом можно квантовать 8бит (более чем достаточно для исполнения, быстро, минимальные требования vram и без потери качества)

Есть проект vllm, в котором поддержку универсально пилят для всех топовых моделей, попробуй его, у него же встроен веб сервер, а так же веб сервер с совместимым openai api, а там 100500 локальных вебморд для использования.

p.s. только llama.cpp эффективно умеет работать на процессоре и главное использовать gpu и обычную память одновременно (например не хватает считанных гигабайт)

Ответ написан 29 нояб. 2024

Комментировать

Как исправить файловую систему на Линукс и не потерять данные?

Петровский @figachit

Подключите ISO с диском восстановления, какой-нибудь небольшой или просто специализированный дистрибутив, загрузитесь с него. По возможности скопируйте ваш диск с помощью dd целиком, если нужно (вот только куда — вам предостоит решить с хостером), или копировать в пайп по сети через ssh, например. Для этого понадобится и поднять SSH в загруженном вами образе.

Как вариант — из загрузочного образа смонтировать ФС в режиме чтения: mount -o ro /dev/blablabla /mnt/blabla и выковырять ценные файлы.

После этого отмонтировать ФС /dev/blablabla и провести xfs_repair...

Ответ написан 30 нояб. 2024

Комментировать

Как максимально сжать файлы в архиве?

tut_nick @apppostol

Сами форматы jpg и mp4 подразумевают в себе алгоритмы сжатия. Вы пытаетесь сжать уже сжатое.
Чтобы уменьшить размер файлов видео, их надо перекодировать с более низким битрейтом (что может сказаться на качестве).
И так же понизить качество/разрешение фотографий.
Других способов нет.

Ответ написан более года назад

1 комментарий

Какие есть хорошие ресурсы для изучения Docker для Golang?

Орхан Гасанлы @azerphoenix

Java Software Engineer

Не думаю, что вы найдете что-то конкретное. Но вы можете воспользоваться AI для этого.
Руководствуйтесь принципом - 1 контейнер - 1 сервис. Допустим, если у вас одно монолитное приложение и БД, то это 2 отдельных контейнера. Если у вас микросервисная архитектура, то каждый микросервис это один отдельный контейнер

Ответ написан 29 нояб. 2024

1 комментарий

Как расшифровать 1685700050?

Aragorn @Lord_of_Rings

Дунадан - северный странник. Злой, но очень добрый

Ну если это время, то:

import datetime

timestamp = 1685700050
str_time = datetime.datetime.fromtimestamp(timestamp)
print(str_time)

У меня получилось 2023-06-02 13:00:50

UPD. Это не код, а UNIX-время - количество секунд, прошедших с полуночи (00:00:00 UTC) 1 января 1970 года

Ответ написан 29 нояб. 2024

Комментировать

Какие протоколы прикладного уровня над TCP/IP поддерживают постоянное соедиение как WebSocket?

Everything_is_bad @Everything_is_bad

Часто для "умного" дома используют MQTT

Ответ написан 19 нояб. 2024

1 комментарий

Как выполнить функцию после завершения всех задач?

MVV @mvv-rus

Настоящий админ AD и ненастоящий программист

Используйте метод Task.WaitAll
Ссылки на все эти задачи, при этом надо, кончено не бросать без присмотра при перезаписи переменной outer, а сохранить (например, в массив Task[])

Ответ написан 18 нояб. 2024

Комментировать

Войдите на сайт