Какой великий смысл изучать PHP, зная Python? Лучше углубите свои знания по Python, станьте настоящим профессионалом, а не распыляйтесь по взаимозаменяемым технологиям.
Ну, допустим, тот же diffbot.com бравирует своим AI, с помощью которого анализирует контент. Скорее всего, хорошо обученная нейросеть.
Решения типа Goose и Readability работают без использования нейросетей, насколько я знаю, но выдают вполне приемлемый результат. Понятно, что 100% качества никто не даст, но 98% сайтов в plain content превратить можно.
Собственно, и хотел узнать, какие нынче тенденции на этом рынке.
Вот меня и интересуют готовые решения, которые будут определять полезный контент. Использовать для этого гугл... слабо представляю себе как. Сниппеты могут браться откуда угодно, их может вообще не быть - решение совершенно не универсальное. Лучшее, что я видел - это diffbot.com, есть ещё подобные сервисы (на западе популярно направление content-анализа "всея веба"), но все они довольно дороги на объемах от миллиона страниц.
Вы не поняли. Мне нужно забирать полезный контент из ЛЮБОЙ html-страницы. Например, я скачаю 10000 разных страниц с разных сайтов - предлагаете для каждой вручную разработать правила извлечения полезного контента? А 100000?
Вы не поняли. Мне нужно забирать полезный контент из ЛЮБОЙ html-страницы. Например, я скачаю 10000 разных страниц с разных сайтов - предлагаете для каждой вручную разработать правила извлечения полезного контента? А 100000?
Я недавно разбирался в Elastic и толкового решения по выгрузке из MySQL не нашел. Возможно, плохо искал. Отчасти поэтому и выбрал Solr. Что касается ответа на ваш вопрос - можно выгружать порциями по 500-1000 записей из MySQL и через bulk insert вгружать в Elastic. Если можете писать на .NET или PHP - написание подобного скрипта не займет много времени.
Спасибо за Ваши старания, но они мне мало помогли. К сожалению, отключение диспетчера задач указанным Вами способом отключает его так же и у администратора, а у администратора он мне необходим. Так же как и выполнение "только указанных приложений" - администратор должен иметь возможность выполнят любые необходимые приложения.
Ну вы тоже не очень-то вчитываетесь в вопрос. В вопросе я указал, что "Я сделал вход в терминал с запуском конкретной программы". Это означает, что пользователь не видит меню "Пуск", рабочий стол и прочие элементы операционной системы - он видит только программу, которая запускается при старте сеанса. Однако, пользователь может нажать Win-R, к примеру, и запустить какую-то несанкционированную программу (даже если она находится в Program Files). Также пользователь может нажать Ctrl-Shift-Esc - и попадает в Диспетчер задач, где видит список всех залогинненных пользователей (уж не знаю почему - у него нет прав администратора, только права "Пользователи" и "Пользователи удаленного рабочего стола"). Так вот, повторю вопрос - как запретить группе "Пользователи" пользоваться этими горячими клавишами? В административных шаблонах подобных пунктов не обнаружил.