Задать вопрос

kotofey

31

вклад
2

вопроса
40

ответов
28%

решений

Лайки

Как заставить Google принудительно переобойти страницу?

Владислав Яновский @kopcap_va
SEO Consultant

В Search Console есть раздел Сканирование → Просмотреть как Googlebot.
Добавляете URL, нажимаете сканировать/получить и отобразить, после чего появится кнопка отправить на индексацию.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как настроить АНГЛИЙСКУЮ морфологию в elasticsearch?

Dimonchik @dimonchik2013
non progredi est regredi

ну well оно и в африке

а потом уже только колодцы

вообще все сложнее и с лесом тоже

Ответ написан более трёх лет назад

Комментировать

Комментировать
Где можно найти базу данных для разговорного бота?

Andrzej Wielski @wielski
✔ Совет: Вам помогли? Отметьте ответы решением.

Хехехех, некоторые годами тренируют нейросети, чтобы они более-менее адекватно отвечали на вопросы пользователей. А могли бы просто базу скачать, всего то!

Ответ написан более трёх лет назад

Комментировать

Комментировать
Где взять данные для задач классификации?

Dimonchik @dimonchik2013
non progredi est regredi

https://www.kaggle.com/datasets

Ответ написан более трёх лет назад

Комментировать

Комментировать
Data Scientist/Engineer/Analyst. В чем разница?

Vlad_Fedorenko @Vlad_Fedorenko

Все всегда будут вкладывать разный смысл в эти слова, смотрите по требованиям и задам. Навскидку:
-Engineer, почему из БД пропала часть данных?
-Scientist, почему модель на валидации хорошая, а в проде беда?
-Analyst, сделай-ка запрос с джоинами и группировками

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как классифицировать текст с помощью нейронной сети?

d'Ivan @2ord

Если знаний в компьютерной лингвистке чуть больше чем ноль, то задачу решить получится не скоро ...
Почему-то поголовное большинство разработчиков тешутся надеждой, что нейронные сети магическим образом решат любую задачу в области искусственного интеллекта.

А какими примерами обучать нейросеть? Ведь не голым текстом... Типа, говоришь нейросети: "глянь, тут человека упомянули". Так что-ли? Для компьютера текст - это лишь последовательность байтов, поэтому он не может понять что для нас-людей представляет интерес. Компьютеру нужно всё разжевать и объяснить на языке цифер.
Ведь как носители языка понимают, что в тексте речь о людях? Есть набор запомненных слов (словарь), которые человек прочтя или услышав, сравнивает со своим словарным запасом и тогда решает, к какой категории относится слово в данном контексте.

Чтобы, проанализировав текст, понять, что "ищут ли какого то человека, мастера", необходимо вычленить некоторые ключевые слова, взятые из словаря: "ищу", "помогите", "подскажите", "посоветуйте", "требуется" и т.д., в сочетании с упоминанием людей (синонимы) и профессий (словарь профессий).
Нейронная сеть на этом этапе не нужна. Она поможет в классификации при работе с цифрами, фактами (булева логика). Так что перед анализом текста нужно извлечь факты и связи из текста и затем скармливать ими классификатор. Помимо нейронных сетей есть другие виды классификаторов, более простых и лёгких в использовании, такие как байесовский классификатор. Нейросети могут быть как с обучением, так и без.

В качестве вводной части имеет смысл начать с лекции Яндекс - Малый ШАД - Лингвистика в поиске.pdf
По практической части: Что такое Томита-парсер, как Яндекс с его помощью ...

Возможно, задача решается проще и без нейросетей.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Есть хорошие биржи фриланса без первого взноса?

Вадим @vshemarov

Можно еще здесь посмотреть: https://shikari.do/category/web-it-specialisty
Трехдневная подписка бесплатно

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какие вы знаете методы обнаружения подозрительной активности пользователя?

iSergios @iSergios
Python-разработчик

Поздравляю! Вы взялись просто за колоссальной сложности задачу. Крупнейшие корпорации тратят тысячи человеко-часов, годами корпят над этой темой, и при этом количество ложноположительных и ложноотрицательных срабатываний их систем защиты просто раздражающе велико.

Методов тоже уйма. Время захода, работы, отпечатки браузеров, диапазоны IP-адресов - это на поверхности, очень просто и нифига не продуктивно. В конечном итоге оно выливается в то, что клиент где-нить в командировке с IP местного провайдера и выданного на работе бука вынужден бороться с вашей системой. Сейчас копают в других направлениях. Например мышь. Для многих не очевидно, но паттерны движений курсора мыши уникальны для каждого человека. Там ведь не только наведение на элементы интерфейса, т.е. продуктивные движения, еще очень показательны т.н. холостые движения - к примеру, то, как вы крутите курсор, пока ждете загрузку чего-то. Только вот человек не постоянен. Стоит вам научиться выделять человека из прочих по тому, как он работает мышью, в каких ритмах набирает текст и т.п... как он ррраз! и заболел. И его вялое тыканье в элементы интерфейса начисто смажет вам всю картину) А если у него сдохла мышь, и он начинает пользоваться тачпадом?)

К чему это я. Сам буду рад услышать тех, кто в теме, но не рассчитывайте увидеть в ответах что-то действительно стоящее.

Ответ написан более трёх лет назад

2 комментария

2 комментария
Чем отличется обратное распространение ошибки от стохастического градиентного спуска?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

На самом деле, это немного разные понятия.

Backpropagation дает нам функцию, которую надо оптимизировать ( = найти минимум\максимум).

SGD находит минимум\максимум некоторой произвольной функции.

Кроме стохастического спуска, есть еще full-batch gradient descent (это тот самый, по умолчанию, когда изменяем коэффициенты после обсчета всей выборки), mini-batch gradient descent (промежуточный вариант, когда меняем коэффициенты после обсчета N элементов выборки), rmsprop, ADAM, имитация отжига и т.д.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Почему в Elasticsearch неправильно ищутся некоторые слова?

Alex XYZ @AlexXYZ
O Keep Clear O

Не совсем ответ, но есть форум, где осуждают проблемы с ES и морфологией в частности на русском (если существенно): https://discuss.elastic.co/c/in-your-native-tongue...

И стоит посмотреть issue проекта этого плагина (больше закрытые, т.к. по открытым нет ответов):
https://github.com/imotov/elasticsearch-analysis-m...

Автор плагина Игорь Мотов, я ему задавал вопросы.
У меня была близкая проблема при использовании wildcard, но оказалось, что это не проблема морфологии.

Ответ написан более трёх лет назад

Комментировать

Комментировать
JS API и REST API - это разные понятия?

Тимур Шемсединов @MarcusAurelius Куратор тега Node.js
автор Impress Application Server для Node.js

1. REST не имеет ни какого отношения к CURL.
2. Устоявшегося понятия JS API не существует, оно сложилось исключительно у Вас в голове.
3. Противоположностью REST (и STATEless) есть STATEful, т.е. связь без состояния и с состоянием. Без состояния каждый запрос отдельный и не переводит сервер в другое состояние, не переводит само соединение (или сессию) в состояние и не переводит клиента в другое состояние. На самом деле, практически все, что называется REST им не является, см. мою статью habrahabr.ru/post/204958
4. Скорее всего Вы хотите спросить про противопоставление HTTP API и RPC API. В отличие от HTTP API (которое обычно называют по незнанию или запудрпенности мозгов REST API) удаленный вызов процедур (RPC API) для можно делать на базе TCP, UDP, TLS или эмулировать для веба на WebSocket или HTTP+SSE или других протоколах.

Ответ написан более трёх лет назад

2 комментария

2 комментария
JS API и REST API - это разные понятия?

Алексей Уколов @alexey-m-ukolov Куратор тега JavaScript

Вы путаете теплое с мягким.
REST - это методология, работа с таким апи может быть реализована на любых технологиях (включая js), реализация на стороне сервера - тоже.
JS API - это уже конкретная реализация клиентской библиотеки. На сервере, с которым работает эта библиотека, при этом может быть REST апи.

Ответ написан более трёх лет назад

2 комментария

2 комментария
Как сделать привязку сервера с клиентом в случае сбоев в соединении, чтобы у клиента не оборвался процесс игры?

Philipp @zoonman
⋆⋆⋆⋆⋆

сделать

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как показать локальный проект заказчику через интернет?

webus @webus
Golang | Python | NodeJS | Java

https://ngrok.com/

Ответ написан более трёх лет назад

Комментировать

Комментировать
Возможно ли в node.js зашифровать исходный код?

index0h @index0h
PHP, Golang. https://github.com/index0h

Это глупо. На хабре как то была статья Твой код никого не интересует, увы это правда. Те, кто захотят его получить любой ценой - придут в ДЦ с ордером на обыск ваших серверов.

Ценность не в коде, а в задачах, которые он решает в конкретном проекте, конкретной инфраструктуры, конкретной компании. Как пример: думаю практически у каждого хранится копия проектов, с которыми он работал. Безусловно, бывают исключения, но в 99% случаев этот код остается только небольшим справочником в стиле "хм, такую задачу где-то я уже решал.. подсмотрю как.." Но при этом интеграция тупой копипастой обычно не катит, и все что вы получаете - это просто мысль, которую нужно записать в контексте нового проекта.

Вы не переживайте, напишите свою первую 100к строк - поймете, что в этом смысла нет))

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как бороться со страхом использовать Javascript на сервере?

Станислав Макаров @Nipheris

Я думаю страх очень простой - из-за отстуствия ощущения поддержки. Большого Брата вроде MS или Оракла не стоит за Node.js. Я конечно не хочу сказать, что всем на него плевать и никто не предложит поддержку - другое дело, насколько эти фирмы на слуху.
Смежным вопросом является доступность важных для коммерческой разработки вещей. Если вы ранее использовали WCF - не удивительно, что после такой махины, которая из коробки поддерживает огромное количество стандартов для олдскульных XML веб-сервисов (с безопасностью, адресацией и т.д.), и даже REST-сервисы, многие захотят идти в ноду и заново собирать себе там необходимые инструменты и библиотеки, даже если они есть (что конечно надо сначала проверить).
Ну и, наконец, основным субъективным фактором является желание использовать полученные навыки. У WCF довольно приличный порог входа, и разбираться нужно реально долго, прежде чем можно чтото применить на практике с пониманием происходящего. Это как с WPF последнее время народ негодует - все потратили N месяцев на изучение (один XAML чего стоит), а от майкрософта за последние 6 лет толком не новшеств ни обновлений не было, все смотрят на переписанный с нуля ASP.NET (который теперь всю платформу ведет в правильное русло), и завидуют. Так и вы приходите весь в белом и говорите - забейте на ваш багаж корпоративного дотнета, все идем в ноду.

Ответ написан более трёх лет назад

5 комментариев

5 комментариев
Что-то типо phpMyAdmin для node.js и mysql?

evnuh @evnuh
Поиск Гугл помог мне, впусти и ты его в свой дом

Это?

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Какая есть удобная библиотека для парсинга сайтов для nodejs?

Dialog @Dialog

habrahabr.ru/post/210166

Ответ написан более трёх лет назад

Комментировать

Комментировать
Стоит ли писать небольшую клиент-сервер игру на node без express?

Тимур Шемсединов @MarcusAurelius Куратор тега Node.js
автор Impress Application Server для Node.js

Есть куча альтернатив, например тут списком nodeframework.com или тут https://github.com/sindresorhus/awesome-nodejs#web..., а express весьма даже спорный инструмент, например habrahabr.ru/post/243945 и мой коммент habrahabr.ru/post/243945/#comment_8141311 А писать на чистой ноде для простых и сильно оптимизированных задач все еще эффективнее всего, но нужно готовиться к тому, что ничего их коробки не будет, нужно программировать головой и руками.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как разместить рекламу на одностраничном сайте?

Дмитрий Соломакин @solomakin
Head of online marketing

То есть хотелось бы видеть работу примерно следущим образом:
1 - пользователь делает запрос;
2 - в соответствии с этим запросом сайт формирует контент;
3 - далее в этот контент динамически и релевантно добавляются одна-две рекламные ссылки;
4 - все это добро показывается пользователю.

Путь 1:
1 - поисковик записывает cookie в браузер, а вы можете "подсунуть" свою рекламу с размеченной UTM-метками ссылкой, например: vpohod.ru?utm_source=yandex&utm_medium=cpc&utm_campaign=palatki&utm_term=palatka_pohod&utm_content=palatka_pohod
2 - пользователь кликает по вашей ссылке, скрипт на сайте обрабатывает содержимое метки, если он находит соответствующее значение из своей базы, например: utm_content=palatka_pohod ---> показать слайдер с палаточным пешим лагерем и тексты про палатки. В это время, если у вас на сайте размещены блоки контекстной рекламы, они читают все cookie, которые пользователь нацеплял до того, как ввести запрос "палатка в поход"
3 - рекламные системы смотрят, какую рекламу будет выгоднее показать прямо сейчас, и покажет в итоге наиболее интересную по версии своего алгоритма, совсем необязательно рекламу палаток
4 - все это добро показывается пользователю
_________________________________________________________
Путь второй: вы партнеритесь с сайтами из тех тематик, на которые вы привлекаете трафик к себе.
В базу скрипта, который читает UTM-метки вы добавляете базу рекламных блоков, в которых в зависимости от содержимого меток будет прописано релевантное рекламное объявление от партнера.
Скрипт читает метку, формирует контент и ищет подходящее объявление и показывает это добро пользователю.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

Drno
- 3 ответа
- 0 вопросов
Виктор Новицкий
- 3 ответа
- 0 вопросов
n4d3sh1k
- 1 ответ
- 1 вопрос
shupike
- 1 ответ
- 1 вопрос
aleks-th
- 1 ответ
- 0 вопросов
Stick202
- 0 ответов
- 1 вопрос