• Как защититься от парсельщиков?

    zoonman
    @zoonman
    ⋆⋆⋆⋆⋆
    Существует несколько способов борьбы.

    Вектор усложнения доступа к информации

    Информация отдается с сервера с постоянной меняющейся структурой. Например блоки меняются местами и CSS генерируется налету, причем классы собираются рандомной цепочкой и имеют абсолютно рандомные названия. Это может повлиять на SEO.
    Если этого мало, то контент рендерится с помощью JS аналогичными алгоритмами. Сам JS тоже генерируется и обфусцируется. Доставка контента происходит через сложные технологии, например через WebRTC DataChannel или WebSockets. Про SEO не может быть и речи, плохо работает через мобильник.
    С подобным подходом прийдется писать парсер под ваш сайт. Скорее всего он будет делать скриншот и скармливать его распознавалке.

    Вектор контроля доступа к информации

    Доступ к информации предоставляется определенному кругу лиц. Например клиентам. Объемы доступа регламентированы и превышение карается расторжением договора или штрафом.

    Вектор ограничения доступа к информации с помощью каптчи

    Для идентификации клиентов используются evercookie+fingerprinting. Используется рейтинг адресов и подсетей.
    Для недоверенных подсетей (ip принадлежат в основном разного рода хостинг-провайдерам) captcha отображается сразу. Аналогично при появлении трафика из необычного места, например внезапный трафик из Индии или Китая.

    Вектор "медленный сервер"

    Анализируются поведенческие характеристики с помощью машинного обучения. Строится эталонная модель.
    Все, кто не попадает под модель, упираются в медленный сервер. Сайт начинает отдавать контент сразу, но очень медленно, например страница может открываться секунд 30. Причем попытка параллельного запроса приводит к ошибке. Если сайт велик, то подобные штуки останавливают парсильщиков на ура. Вдобавок дополнительно контролируются определенные вещи, вроде "пользователь загрузил js и css", провел мышкой там и там.

    Вектор для реального отваживания воришек

    Кроме выше перечисленных способов, есть очень простые, но действенные способы. При обнаружении парсинга, парсильщику отдается неверная/искаженная определенным образом информация. Например, если есть подозрение на конкурента ворующего цены, можно отдать цены чуть выше настоящих и немного подменить название товара, например заменить определенным образом букву "а" на "a". Затем такая штука ищется поисковиком и находится сайт конкурента.
    Далее вопрос решается так, как это удобно бизнесу. Обычно жалуются на нарушение копирайта. Ну или у конкурента внезапно сгорает склад. Тут уж кто на что горазд.

    А это специально для любителей парсить чужие сайты: cломанные пальцы очень сильно мешают набирать на клавиатуре будьте осторожны, в большинстве случаев воровство контента того не стоит.

    Подытожим. В большинстве случаев защита от парсинга вредит SEO.
    Если у вас воруют контент, значит он хороший. Защищайте его с умом. Простые средства вроде копирайта и успешные дела за воровство контента отвадят воришек от вашего сайта. Просто придайте делам огласку. Отслеживайте воровство и жалуйтесь в поисковые системы.
    Используйте технические средства для отслеживания воровства, например непечатаемые символы и стеганографию в картинках.
    Используйте внутренние ссылки и привязки к контенту и его автору. Например логические отсылки на свои предыдущие работы или другие товары, которые можно купить только у вас.

    Если у вас воруют статьи, просто требуйте обратную ссылку.
    Если воруют описание товаров, предложите продать его, а на вырученные деньги улучшите свое или увеличите оборот или потратьте их на рекламу.
    Еще одна рекомендация - сделайте все, чтобы поисковики узнавали о вашем контенте раньше, чем у воришек.
    Ответ написан
    6 комментариев
  • В чем смысл ВУЗа?

    @Programmir
    Я окончил школу с золотой медалью, получил высшее образование на факультете менеджмента, а теперь с этой корочкой даже продавцом не берут. Столько лет зря потратил. Учись на чужих ошибках. Чтобы заработать миллиарды Гейтсу и Цукербергу не нужно было высшее образование. А некоторые с высшим образованием за копейки не могут найти работу.
    Ответ написан
    13 комментариев
  • Можно ли сделать онлайн игру на С ++, в интернете (io game)?

    saboteur_kiev
    @saboteur_kiev Куратор тега C++
    software engineer
    Хочу начать с чего-то простого (например. сделать 2D игру) и хочу сделать что-то интересное и чтобы приносоло прибыль на следующие разработки, начинаю с 2D, так как невозможно одному сделать


    Вы вообще не с той стороны подходите к вопросу.
    Если вы хотите заработать и получить прибыль - УСТРОЙТЕСЬ НА РАБОТУ, ГДЕ ПЛАТЯТ ЗАРПЛАТУ.

    Если вы хотите написать что-то технически крутое, то 99% что вы не сможете это продать.

    Нужно четко понимать, что продают не красивое техническое решение. Продают то, за что клиент готов заплатить деньги. У вас есть клиент? У вас есть понимание кто купит вашу программу? Если нет - идите в студию, набирайтесь опыта работы с аудиторией.

    Программисты слишком часто думают, что они умнее всех, и знают как заработать.. Но это далеко не всегда так.
    Ответ написан
    Комментировать
  • В чем смысл ВУЗа?

    @Anthony7
    Лохотрон это, просто попробуй связаться с работодателями с интересной для тебя вакансией, скажи что знаешь все что они хотят, но диплома у тебя нет. Если согласятся, забивай на ВУЗ. В наших вузах из полезного только столовая и телки. Я лично отучился и толку никакого, последние пару лет тролил преподов, что они тупее большинства студентов (мой ВУЗ сейчас в середине рейтинга лучших универов по стране). Они растягивают любую программу и добавляют туда воды, чтобы ты подольше платил)
    Ответ написан
    3 комментария
  • Где найти IT юриста?

    LEGALAID
    @LEGALAID
    Lawyer . Legl AID
    Если по простому -открываете интернет , делаете обзор понравившихся, а потом выборку из оставшихся. Ну а там, в зависимости от ситуации, какую вам надо разрешить. И кто по вашему мнению подходит. Либо это судебное представительство, либо это письменные или устные консультации, либо иная работа правового характера.
    Узкоспециализированных компаний для этой сферы хватает. Только определитесь вам штатник или на аутсорс, с зарплатой или по каждому шагу или договоренности ...в зависимости от ваших потребностей и возможностей.
    Ответ написан
    Комментировать
  • Какой выбрать таскменеджер для одного человека?

    zamboga
    @zamboga
    Аналитика данных, BI-аналитика, дашборды
    контролировать время, которое я трачу на те или иные задачи


    С описанием — те, которые опробованы мною.

    • https://Toggl.com — отдельный софт в трее, расширение под хром, приложение на андроид. Интеграция с кучей сервисов (трело, асана и т.д.). Хоткеи тоже есть. Бесплатного тарифа вполне достаточно. автотрекинг
    • https://RescueTime.com - только в автоматическом режиме логирует, в каких приложениях/сайтах проводите время, и выводит подробную статистику. Бесплатного аккаунта хвататет за глаза.
    • https://TimeDoctor.com — платный. Есть отдельный софт в трее, хоткеи. Интеграция с кучей сервисов.
    • https://pomelloapp.com — простой помидоро-трекер, интеграция с трелло. Хоткеи есть, в трее не сидит, простенький бар поверх всех окон
    • https://PomoDoneApp.com — простой помидоро-трекер, интеграция с трелло. Хоткеи есть, в трее показывает таймер с обратным отсчетом времени.
    • https://tmetric.com — простой трекер, интеграция с трелло, есть десктопное приложение, помидорок нет. Хоткеи есть, сидит в трее
    • https://www.timecamp.com — есть куча интеграций, расширение хром, приложение в трее, автотрекинг
    • https://ManicTime.com - мощный стэндалон тайм-трекер. Очень гибкий в настройках, сидит в трее, есть хоткеи, разные типы таймеров. Платный. Статья danila.org.ua/otrabotannyie-chasyi-moy-podhod
    • https://toptal.com/tracker/
    • ○ Grindstone https://www.epiforge.com/grindstone/
    • https://www.primaerp.com
    • https://tahometer.com
    • https://aTimeLogger
    • https://myhours.com
    • https://wakatime.com
    • savemytime.co

    Статьи
    Ответ написан
    1 комментарий
  • Как сделать онлайн-папку для программирования с другим человеком?

    evnuh
    @evnuh
    Поиск Гугл помог мне, впусти и ты его в свой дом
    эта папка называется "git репозиторий". Сделать её легко: git init
    Ответ написан
    1 комментарий
  • Где найти IT юриста?

    @other_letter
    Вы ищете не то. Серьёзно.
    Вам нужен не юрист, а эксперт. Настоящий аккредитованный эксперт, экспертиза которого будет проведена за деньги и признана Судом.
    Ответ написан
  • Какую среду разработки советуете поставить для "поиграться"?

    sim3x
    @sim3x
    emacs
    vim
    Ответ написан
    Комментировать
  • Где найти IT юриста?

    Из наиболее "думающих" www.it-lex.ru и runetlex.ru/. Они наиболее в тренде и в теме.

    Чтобы он понимал что такое сайт / домен.

    Для решения вопроса по ГК РФ
    (Расторжение договора, неосновательное обогащение)


    Это практически любой адекватный юрист, главное чтобы вы ему доверяли.

    Где найти квалифицированно IT юриста ?


    Реально такие больше ориентированы на зарубежный рынок.
    Ответ написан
    1 комментарий
  • Phpstorm. Требует установить JAVA_HOME (failed to create jvm: error code -6). Как решить эту задачу правильно, чтобы заработало?

    serii81
    @serii81 Автор вопроса
    Я люблю phр...
    Вот еще раз скриншот для переменных:
    b65f452265b74fca8c64983a4e023dfa.jpg

    а вот еще скриншот ошибки phpstorm.exe :

    bbde74109dbe42888df2bd215421069e.jpg

    Спасибо всем, кто решились мне помочь, я ожидал развернутого ответа, но не дождался, пришлось решить задачу самому. Нашел в ютубе один ролик, где на английском рассказывают, как правильно подключить системные переменные.
    Здесь следует сказать, что у меня 64-разрядная система, и я скачал файл jdk только для 64-битной конфигурации. Затем подключил, как показывают в роллике. Вот он:
    https://www.youtube.com/watch?v=Wp6uS7CmivE&t=1s

    После проделанной работе, нужно перезагрузить компьютер, так как сначала у меня ничего не работало. И только после перезагрузки случилось чудо. Спасибо Всем, вопрос закрыт. Может кому-то поможет мой опыт, всем пока.
    Кстати, а как закрыть вопрос?
    Ответ написан
    2 комментария
  • Как правильно изучать Java?

    sergey-gornostaev
    @sergey-gornostaev Куратор тега Java
    Седой и строгий
    Ответ на похожий вопрос. Упор делать на язык и платформу. Хорошо разбираясь в них, библиотеки и фреймворки осваиваются быстро.
    Ответ написан
    Комментировать
  • Как находить и участвовать в проектах на гитхаб?

    sim3x
    @sim3x
    Делаете работу
    В процессе находите ошибку в стороннем коде
    Находите ее источник
    Пишите багрепорт и тесткей
    Так как всем пофиг
    Сами фиксите баг
    Неделю стучитесь мейнтейнеру, чтоб он принял ваш пушреквест
    Он вас посылает, тк ето не баг
    Ответ написан
    10 комментариев
  • Эффективна ли такая методика обучения английскому?

    Griboks
    @Griboks
    Самая эффективная методика - разговоры. Вы должны просто разговаривать с преподавателем. Диктанты? Вы что, переводить статьи собираетесь? Грамматика, синтаксис, пунктуация. Ну это за пару недель можно выучить.
    Эффективно, это речь вида "я глагол домой и глагол прил. собаку, которая глагол нареч." Вы переводите и учите непонятные слова, и все.
    4 месяца из 5 вы должны учить слова и практиковаться в разговорной речи. Никогда не учите предложения и тексты наизусть.
    Ответ написан
    9 комментариев
  • Эффективна ли такая методика обучения английскому?

    Эффективна ли такая методика обучения английскому?
    Если конкретно вы чувствуете от неё эффект - конкретно для вас она эффективна. Если нет - нет.

    Это самый точный и подробный ответ, который возможно дать на такой вопрос - у всех мозг работает по разному и то, что хорошо работает для одного человека окажется бесполезным для другого.

    Обратитесь с этими проблемами к преподавателю. Если он не сможет вас убедить - выбирайте курсы, где методика лучше подходит вам.
    Ответ написан
    1 комментарий
  • Кто нибудь проходил курс от skillbox "как открыть веб студию"?

    angrySCV
    @angrySCV
    machine learning, programming, startuping
    ну я думаю ни один создатель успешной веб студии не проходил этих курсов, с другой стороны, полезно послушать какого нибудь руководителя про его историю создания, к каким походам и схемам работы он пришел, и как развивался
    полезно?-> думаю да
    похожие -> на ютьюбе завались бесплатных историй от создателей веб студий.
    стоит ли это 40К? -> хз, ценность не очевидная, вам все равно нужно будет искать свой путь, и набивать шишки, через это перескочить не получится.
    Ответ написан
  • Где находятся IT-центры в США?

    opium
    @opium
    Просто люблю качественно работать
    Надо просто обратить внимание что зарплаты коррелируют с жильем все таки, а от этого понятное дело если вы в силиконовой долине будете копить десять лет, то и в других видимо тоже
    Ответ написан
    Комментировать
  • Какие знания нужны, чтобы пройти игру Human Resource Machine, целиком основанную на алгоритмах и являющуюся метафорой языка ассемблера?

    @asd111
    Подсказка-Спойлер. Есть только одна логическая операция сравнения "jump if zero" значит надо любую логику сравнения сводить к сравнению с нулем.
    Например чтобы сравнить равенство двух чисел надо их вычесть и делать jump if zero.

    Ассемблер знать необязательно, т.к. здесь обычная логика с условными и безусловными переходами.
    Ответ написан
    3 комментария