Какие нейросети имеют доступ к страницам сайте в интернете?

Question

weranda @weranda

Нейронные сети

Какие нейросети имеют доступ к страницам сайте в интернете?

Приветствую.
Попытался несколькими доступными нейросетями получить доступ к страницам сайтам — почти никто не может этого (из того, что мне удалось попробовать). Хотел скормить нейросети несколько страниц сайтов по ссылке для анализа — тщетно. Можно было бы скачать код этих страниц и скормить их сети, но этот код буквально не влезет им на вход из-за большого количества символов.
Мысль такая: дать нейросети n-страниц на вход, попросить проанализировать и выдать объективные данные. К примеру, выделить контент со всех страниц и скомпоновать в один; выделить какие-то основные части; рассказать, где лучше, хуже и т. п.
Что посоветуете?

P.S.
Попробовал Copilot — такой бред выдает. Наверное, еще рано к ним за таким обращаться?!

Вопрос задан 20 апр.
232 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Средний
Питон,нейросеть, алгоритм выхода из лабиринта?
- 3 подписчика
- 23 июл.
- 202 просмотра
2

ответа
Видео

+2 ещё

Сложный
Как сгенерировать видео для подтверждение локации?
- 1 подписчик
- 13 июл.
- 133 просмотра
1

ответ
Нейронные сети

Средний
Как в tensorflow построить модель с несколькими выходами?
- 1 подписчик
- 07 июл.
- 88 просмотров
0

ответов
Нейронные сети

Средний
Какие могут быть возможные причины изменения ответа LLM на один и тот же запрос?
- 3 подписчика
- 05 июл.
- 206 просмотров
4

ответа
Нейронные сети

Простой
Какая нейросеть генерирует голос?
- 4 подписчика
- 21 июн.
- 274 просмотра
2

ответа
Нейронные сети

Простой
Вопрос про настройку LLM сетей?
- 1 подписчик
- 18 июн.
- 169 просмотров
1

ответ
C#

+2 ещё

Средний
Возникла ошибка в примерах от LLamaSharp?
- 3 подписчика
- 18 июн.
- 284 просмотра
2

ответа
Нейронные сети

Простой
Возможно ли выгрузить часть слоёв в VRAM видеокарты AMD, если основная — NVIDIA?
- 1 подписчик
- 11 июн.
- 81 просмотр
1

ответ
3D

+2 ещё

Средний
Существуют ли нейросети для воксельных 3D-объектов?
- 2 подписчика
- 10 июн.
- 189 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Как скачать целую ветку форума 4pda и скормить нейросети?
- 5 подписчиков
- 08 июн.
- 568 просмотров
1

ответ
Показать ещё Загружается…

Преподаватель по нейросетям

CODDY

от 40 000 ₽

Младший аналитик

Сбер • Москва

от 130 000 ₽

Контент-менеджер

NUBES • Москва

от 120 000 до 150 000 ₽

Требуется HR-специалис

26 июл. 2024, в 23:58

10000 руб./за проект

Верстка дизайна

26 июл. 2024, в 23:29

15000 руб./за проект

Заставить работать приложение на react+php (найти активацию)

26 июл. 2024, в 22:36

5000 руб./за проект

Answer 1 · 2024-04-20 17:46:22

Ни одна нейросеть на базе gpt не умеет напрямую работать со страницами в интернете.

Нужна прослойка, которая, во первых, преобразует страницу в текст (это не так просто как кажется, нужно выделить на странице контент, точнее его группы (информационные блоки), понять где реклама, где навигация а где дизайнерский мусор, отличный пример - страница ozon, 90% экрана абсолютно бесполезный мусор, рекомендации (далекие от того что нужно покупателю), проплаченные карточки и т.п. найти среди этого хлама нужную информацию не просто. Плюс все это формируется в процессе, двигая элементы интерфейса туда сюда... работать с этим адом очень и очень не просто, особенно когда разработчики старательно сопротивляются любой автоматизации.

Мультимодальные сети (кстати, нормальных не существует, даже от openai слабовата, но она лучшая из универсальных) по уму должны уметь работать с веб-страницей как изображение, советую опробовать это самостоятельно на своих задачах, но не уверен что из этого можно получить что то стоящее. Такие сети могут получать изображения в качестве входа, а дальше позволяют вести текстовую беседу, учитывая их как часть контекста.

И главная проблема - ограничения на размер контекста. Большие объемы текста тупо не помещаются 4к..8к токенов это тот объем, в пределах которого сети работают хорошо, но чем больше размер контекста (даже если заявлены 16к или 32к) начинаются борьба компромисов, качества и стоимости. Может так получиться что вместо работы со всей информацией сразу, ее делят на части (еще одна проблема по анализу исходной страницы), а затем, набирая вопросы из текущего контекста (та еще задачка) задают их последовательно для каждой, собирая ответы в итоговый контекст и ее уже используют для дальнейшей беседы. Плюс есть еще алгоритмы саморизации. Плюс еще неплохо сюда multishot пристроить, с примерами.

На каждом этапе, возможно понадобится дообучать свои сети, а это значит собирать обучающую выборку с примерами, RLHF-ить на основе пользовательского опыта... и поддерживать это во времени, так как то что работает сегодня, завтра уже будет устаревшим.

В общем реализуете что то стоящее первыми, может даже озолотитесь, продавая готовое решение бизнесу.

Какие нейросети имеют доступ к страницам сайте в интернете?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт