Задать вопрос
  • Есть ли такая модель для word embedding?

    2ord
    @2ord
    ИИ пишет

    1. Есть ли такая модель для векторизации слов, которая при инпуте "яблоко" вернет его векторное значение и будет работать в обратном порядке, подав вектор вернет "яблоко"?

    Да, есть несколько моделей для векторизации слов, которые могут выполнять эту функцию. Одними из них являются модели word2vec и GloVe. Они используют технологию подсчета частот для векторизации слов и могут работать в обоих направлениях - вектор -> слово и слово -> вектор.

    2. Есть ли такая модель, которая делает все вышесказанное, но ему можно еще подать ключ языка, чтобы вернуть "яблоко" из вектора на разных языках?

    Да, есть модели, которые могут выполнять эту функцию. Например, модели, основанные на технологии word-embedding, такие как FastText или spaCy, могут векторизировать слова и переводить их на различные языки с учетом семантического значения.

    3. не особо понимаю на практике, как без обучения или использования модели искать слово с близким эмбеддингом к запросу?

    Это можно сделать с помощью технологии поиска по векторному пространству. Например, вы можете использовать библиотеку scikit-learn в Python, которая имеет функцию поиска ближайших соседей в векторном пространстве. Это позволяет вам найти слова с близкими векторами к вашему запросу.

    Пример использования семантических весов слов в предложении

    Да, это можно сделать с помощью моделей, которые используют семантические веса слов, такие как WordNet или ConceptNet. Эти модели могут векторизировать слова и давать им веса, основанные на их семантическом значении. Затем вы можете использовать эти веса для перевода предложения.

    Почему не подходит использование дословного или семантического перевода предложения целиком?

    Это связано с тем, что в предложении могут быть слова, которые не имеют прямого отношения к переводу, такие как предлоги, союзы и другие части речи. Если вы будете переводить предложение целиком, эти слова также будут переведены, что может привести к неочевидным результатам. Поэтому лучше использовать семантические веса слов для перевода ключевых слов.

    1. Есть несколько моделей, которые можно использовать для векторизации слов и их перевода на различные языки.
    2. Модели, основанные на технологии word-embedding, такие как FastText или spaCy, могут векторизировать слова и переводить их на различные языки с учетом семантического значения.
    3. Технология поиска по векторному пространству позволяет найти слова с близкими векторами к вашему запросу без обучения или использования модели.


    • Используйте модели, которые используют семантические веса слов, такие как WordNet или ConceptNet, для перевода предложения.
    • Библиотека scikit-learn в Python имеет функцию поиска ближайших соседей в векторном пространстве.
    • Модели, основанные на технологии word-embedding, могут векторизировать слова и переводить их на различные языки с учетом семантического значения.


    Пример использования семантических весов слов в предложении
    Да, это можно сделать с помощью моделей, которые используют семантические веса слов, такие как WordNet или ConceptNet. Эти модели могут векторизировать слова и давать им веса, основанные на их семантическом значении. Затем вы можете использовать эти веса для перевода предложения.
    Написано
  • Как фильтровать вопросы на qna.habr.com с использованием 2х и более тегов?

    2ord
    @2ord
    Если бы код бэкенда открыли, то дело точно с мертвой точки сдвинулось бы.
    Написано
  • Возможно ли актуализировать старый дистрибутив Linux?

    2ord
    @2ord
    Александр Попов, тут может быть намек и на другие дистрибутивы.
    Написано
  • Как проверить, что строка содержит только цифры и символы?

    2ord
    @2ord
    Уточни.
    Может, это рациональное число. А, может быть, айпи адрес? Тогда нужно больше проверок.
    Написано
  • Допустимы ли REST запросы между сервисами в событийно-ориентированной архитектуре?

    2ord
    @2ord
    ИИ бот пишет


    Варианты реализации:

    1. REST запросы: ТГ бот может напрямую отправлять REST запросы к сервисам Подписок и Управления подключениями, чтобы получить требуемую информацию. Однако это может привести к следующим проблемам:
      • ТГ бот становится зависимым от конкретной реализации сервисов Подписок и Управления подключениями.
      • ТГ бот может получить доступ к внутренней логике сервисов, что может нарушить принципы разделения обязанностей и монолитности.


    2. Сервис справочной информации: Вы можете создать отдельный сервис, который будет хранить и обрабатывать справочную информацию о подписках и подключениях. ТГ бот будет отправлять запросы к этому сервису, а он, в свою очередь, будет обращаться к сервисам Подписок и Управления подключениями. Это может сделать систему более масштабируемой и гибкой, но требует дополнительных затрат на разработку и поддержку.
    3. События: Вы можете использовать события для передачи информации от сервисов Подписок и Управления подключениями к ТГ боту. Например, когда пользователь создает новую подписку, сервис Подписок может отправить событие о создании подписки, а ТГ бот может обрабатывать это событие и обновлять информацию о подписках пользователя.


    Обработка события "создания нового подключения":

    1. REST запрос к СП: СУП может отправлять REST запрос в СП, чтобы получить информацию о текущей подписке пользователя. Это может быть нормальным подходом, если СУП не имеет доступа к информации о подписках и не может обновлять эту информацию напрямую.
    2. Запаковывать информацию с заявкой: СУП может запаковывать информацию о текущей подписке пользователя в заявку на создание подключения. Это может быть нормальным подходом, если СУП имеет доступ к информации о подписках и может обновлять эту информацию напрямую.


    В общем:
    Выбор подхода зависит от конкретных требований и ограничений вашей системы. Если вы хотите сделать систему более масштабируемой и гибкой, то создание отдельного сервиса справочной информации может быть хорошей идеей. Если вы хотите сохранить систему простой и понятной, то REST запросы или запаковывание информации с заявкой могут быть более подходящими вариантами.
    Написано
  • Как есть способы соединения сервера с нейронными сетями с приложениями клиентами?

    2ord
    @2ord
    Alexey,
    если что передача по tcp и http разные вещи.
    а можно ли подробнее?
    Написано
  • Стоит ли делать отдельный микросервис для Баз данных?

    2ord
    @2ord
    А как данные распределены между сервисами? У каждого свой огород или все на одном? Есть ли дублирование данных между собой?
    Написано
  • Насколько безопасно хранить фото для сайта на яндекс диске?

    2ord
    @2ord
    Можно почитать что Яндекс пишет про гарантии сохранности данных на Яндекс Диске в пользовательском соглашении.
    Написано
  • Насколько безопасно хранить фото для сайта на яндекс диске?

    2ord
    @2ord
    Не храни незаконный контент или тот, который противоречит правилам использования сервиса, и будет (относительно) безопасно.
    Или есть опасения о безопасности в другом отношении? Стоит поделиться.
    Написано
  • Почему меня не запускается программа Capture One?

    2ord
    @2ord
    The exit code 3221225477 is a hexadecimal value that corresponds to the Windows error code 0xc0000005, which is a generic error code for an access violation. This error code suggests that the Capture One application attempted to access a memory location that it was not allowed to access.

    Приложи отчет приложения о сбое.
    В любом случае, за такими вопросами стоит обращаться к разработчику ПО.
    Написано
  • Какая минимальная конфигурация ноутбука для программирования?

    2ord
    @2ord
    Так же есть вариант поставить линукс, там еще большая вероятность что дольше 16 никогда не понадобится.
    с GUI в Linux не идеально по потреблению RAM
    Написано
  • Какая минимальная конфигурация ноутбука для программирования?

    2ord
    @2ord
    8 ГБ - это слишком мало. Когда работают веб-браузер, IDE (без учета остального ПО), то ОС часто будет затыкаться и уходить в своп. Особенно при разработке фронтенда.
    Написано
  • Как поменять версию Python в терминале хостинга?

    2ord
    @2ord
    последняя версия aiogram: 3.10.0. Не пора ли обновиться?
    Написано
  • Как удалить линии из видео?

    2ord
    @2ord
    Roman, овчинка выделки не стоит.
    Написано
  • Как удалить линии из видео?

    2ord
    @2ord
    Гиблое дело, обреченное на провал.
    Написано
  • Как провести реверс инжиниринг файлу типа png jpd svg?

    2ord
    @2ord
    ar4angeel, а зачем тебе это нужно? Не ошибся ли ресурсом?
    Написано
  • Какие есть решения на 2024 год для определения дубликата изображений на PHP?

    2ord
    @2ord
    А решения для определения дубликата изображений за предыдущие года проверялись?
    Написано