Ответы пользователя по тегу Яндекс
  • Как связать YandexGPT с базой данных?

    @rPman
    При наличии доступа к весам llm, мощностям для finetuning и переобучения, специалистам по нейронным сетям, можно сделать ряд сопроводительны нейронок, которые будут помогать принимать решение о дальнейших действиях, закодировать большое количество 'дорожек' из llm к формальным базам данных, и сделать задачу якобы решенной.

    По факту llm будет решать одну единственную задачу - текстовый интерфейс на естественном языке к интерфейсу к базе данных. Т.е. набор функционала и запросы, которые можно делать к базе нужно будет закодировать заранее.

    Если не углубляться
    - во первых, тебе нужно на основе llm сделать классификатор, который будет из текста пользователя понимать, intent - какое именно действие он желает сделать (для этого обучают нейронку на основе pretrained llm, возможно убирают последние слои, заменяя их на новые, веса которых нужно будет найти и обучить на основе подготовленной базы вопросов пользователей и соответствующих им реакций, с некоторой долей вероятности можно попробовать без обучения спрашивать у умной llm типа chatgpt4, к сожалению chatgpt3.5 и сравнимые с ней плохо с этим справляются, точнее это вопрос творческий и возможно вместо одного универсального промпта тут нужно готовить франкенштейна из большого количества разных, llm-ка от яндекса не подойдет).
    - во вторых, это сбор информации, отличный пример - человек спрашивает брать ли завтра зонтик, мало сети понять что для ответа на вопрос нужно знать какая будет погода завтра (а завтра это через сколько часов?), нужно понять где этот человек находится и возможно задать наводящий вопрос... это я еще молчу про контекст беседы, может пользователь обсуждает о том что взять с собой в поездку на следующей неделе, т.е. вот уже другое время и место (фраза взять с собой может подразумевать - положить в багаж).
    Я видел примеры промптов, с помощью которых из лога беседы можно вытягивать элементы информации (список этих элементов придется заранее забивать соответственно тому интерфейсу, который выбран как целевой на первом шаге), что то типа проанализируй, достаточно ли в данном тексте информации для ответа на вопрос, выделяя в промпте цель, собранную информацию и часть лога беседы, может сжатой через саморизацию с фильтром - нужную для данной задачи (этакая симуляция большого окна контекста).
    Вот тут у директора по развитию ии от яндекс спрашивали как раз

    Не получится брать сырой поток сообщений, добавлять к ним промпт и надеяться получить сразу результат, это кропотливая работа, по преобразованию потока сообщений в некую выжимку, работа с ней разными запросами и заранее подготовленными нейронками (это на порядок эффективнее, кстати то где слабые сети еще могут давать результат, повторяю, нужен доступ к весам, оборудованию и собирать датасеты)

    p.s. С некоторой долей риска можно просить на ходу нейронку генерировать sql запросы на основе вопросов пользователя, результат будет с большими ошибками, чем умнее llm-ка тем сложнее эти ошибки будет обнаружить (в автоматическом режиме я имею в виду).

    upd. вот тут из гигачата сделали внутреннюю базу и как то интегрировали нейронку чтобы ею пользоваться, подробности не сообщили но в статье и комментариях есть ссылки на работы и технологии
    Ответ написан
    1 комментарий
  • Как избежать перенаправления англоязычной версии Яндекса (com) на русскоязычную (ru)?

    @rPman
    Язык по умолчанию в браузере стоит ру? Сделай en, интерфейс тоже изменится на английский но именно от сюда многие сайты выбирают какую часть сайта выдать. Хабр например выдает английскую
    Ответ написан
  • Если бы сайт со слитыми данными пользователей Яндекс еды распространял трояны(в том числе на айфон),было ли бы это уже известно?

    @rPman
    благодаря закрытости и ограниченности функционала, айфоны очень надежные железки (уязвимости были, даже очень опасные вида - открыл sms с картинкой и ты взломан, но обновления выходят оперативно), сам факт использования веб сайта не крадет ничего (да, есть click jacking attack, когда атакуемый сервис открывается во фрейме с 100% прозрачностью а пользователя под разным предлогом заставляют кликать в нужных для злоумышленника местах, но это не уязвимость устройства а атакуемого сервиса)

    на android устройствах все то же самое, но нужно добавлять контроль за используемым браузером, некоторые считают за браузер встроенный в какое либо приложение webview и глупо вводят в такой свои пароли, но это опять не уязвимость устройства а фишинг.

    p.s. ну и само собой, такие вещи как разрешить веб сайту геолокацию, доступ к микрофону, камере и т.п. так же нельзя наывать кражей, вы ведь сами разрешили
    Ответ написан
    Комментировать
  • Вопросы яндекса на career day санкт-петербург?

    @rPman
    первая задача решается элементарно :)
    1. выбираем одного ведущего (не обязательно среди студентов)
    2. Ведущий загадывает случайное число в уме (достаточно большое, сравнимое со обычным средним баллом * N) и говорит его первому студенту 'на ушко'
    3. Каждый последующий студент прибавляет к этому числу свой балл и сообщает результат другому

    4. по окончании последний студент так же шопотом говорит свою сумму ведущему
    5. ведущий вычитает свое число из результата и делит его на N

    т.е. никто не видит всей картины, а значит никаких вычислений провести не сможет (даже если кто то услышит случайно чью-то сумму, это ничего не даст).
    Ответ написан
    5 комментариев