Тоже хотел оставить ролик в тему (другой), а сейчас увидел, что ваш ролик - на того же автора foo52ru !
В общем, у него там много чего можно посмотреть и по теме вопроса, и не по теме - тоже интересные очень.
Почему первая проблема не решается в принципе? Если по каждому файлу хранить только URL архива, где он есть - то легко "разжать" его всегда из сотни байт до пары мегабайт.
Вот в имеющихся условиях - да, наверное это правильное решение. Ну или overlayfs (когда в файлухе виртулки - только данные). Но это - с учетом имеющихся условий. А мне интересно, что, вдруг условия другие и может быть можно просто простую и надежную дубовую схему с .tar.gz так оптимизировать.
Да, это и смущает. Не полностью решает проблему, сложно делается и высокие риски из-за человеческой ошибки или сбоя (в масштабе небольшой компании нельзя сделать хранение надежное).
Хочется именно чтобы архиватор знал, что "этот файл публичный, широко распространенный, его можно выкачать с debian.org". Одна такая глобальная база для всего человечества. Тогда можно и паковать быстрее гораздо, и использование проще будет.
Это воркэраунд, да. (про него и написал, как инкрементальный). Но все таки это немного хуже - очень много дублирования:
- Первый бэкап для виртуалки будет полным (хотя все файлы можно с debian.org скачать)
- Если виртуалок много, и они все почти одинаковые, то у каждой будет полный первый бэкап (хотя с этой идеей сокращения их по хешам, можно все сократить почти до нуля).
Бэкапы же часто делаются, долго хранятся - но редко используются :-) Хочется выжать максимум из этого (чтобы были маленькими, легко копировать, хранить. И пусть даже распаковываются чуть дольше).
Я изначально немного неправильно понял идею CPA (думал, что это программа конкретного рекламодателя и надо искать их, регаться и у каждого свой немного интерфейс итд). Сейчас, как я вижу, это гораздо больше мне подходит. Спасибо!
Спасибо! Это уже вариант решения проблемы. Немного смущает, что нужно либо всю жизнь один сервис рекламировать, либо же каждую неделю-месяц самому "ротировать рекламу" (сегодня рекламируем godaddy, завтра reg.ru). Мне кажется, что реклама одного товара-услуги постоянно - не очень эффективна. Посредник, который сам бы ротировал - снял бы кучу забот и повысил эффективность => выгодность. (на рекламу годадди и reg.ru кто-то не клюнет, а вот на рекламу третьего регистратора - уже клюнет.)
Именно персональный блог. Не "ежедневная газета". То есть, нерегулярно, раз в 3 дня или раз в месяц (возможно это вы и имели в виду под "мертвым") - новый пост, тот, который мне кажется важным и интересным, эдакая фильтрация всего, что я вокруг вижу, и на блоге - только на самом деле интересное. Идея в том, что подписка "есть не просит", человек подписывается, его не раздражают регулярные скучные посты, зато каждый новый пост - очень интересен.
Пробовал. Дешево и гадкий сервис, негодный для практического применения. :-)
Так что, во-первых, этим методом уже каждый фейковый голос будет стоить несколько рублей
во-вторых, смс-рег перепродает те же номера, так что какая-нибудь десятая фейковая регистрация через смсрег будет на тот же номер, что и первая. И можно в этом случае первую задизаблить.
Я через них в ВК фейковый акк делал для игры — мне сразу написали, что на мой номер привязана другая анкета, я все равно зарегал. А через месяц — еще кто-то зарегал и мой акк отвязался. :-) Нечто подобное тому, что смсрег предлагает неудобно и за деньги, каждый сам может себе сделать легко, регая миллион анкет по очереди на свой один номер телефона — это будет тоже «все на один номер» как через смсрег, но хотя бы бесплатно будет. :-) Кстати — на сообщения в личке они не отвечают, а сообщения в форуме — премодерируются, поэтому выглядит, будто бы все их сервисом довольны. Шлю им лучики поноса через хабр! :-)
для EugeneOZ — у меня немного другая практика. Карта от Elance (по сути то же, что и oDesk), получал платежи с еланса, потом старого клиента тоже перевел платить на нее же (прямым платежем). Сначала все было ок, потом прямые платежи закрыли, причем саппорт усиленно играл в «я такая загадочная»: «карта не для прямых платежей, а для платежей от партнеров, вот когда будет много партнерских платежей — снова разрешим прямые». Сколько при этом надо было партнерских, какой должен быть баланс, хоть какие-то прикидки — никак не говорили. А поскольку тот заказчик не с еланса, я спросил про пейпал — так вот пейпал они считают использованием по назначению. Практика подтвердила — да, платежи с paypal пришли, более того, после них разблокировались прямые платежи.
Другими словами:
1. На payoneer карту можно принимать платежи напрямую но на непонятных условиях, в любой момент могут прикрыть по желанию левой пятки — никак правила не озвучены, так что и соблюсти их невозможно.
2. Даже если карта получена от одного из партнеров (elance), можно принимать платежи от другого партнера (paypal)
3. Можно просто заказать эту карту через paypal.
Я не юрист, так что если что — следователю на меня не ссылайтесь :-) Но по работе (DLP) с этой сферой сталкиваюсь, и именно с этим вопросом, поэтому интересовался. Если вы один из участников переписки, то тот факт, что информация была передана вам письмом (бумажным, электронным) никак не влияет на ее статус. Если вы никаких обязательств на себя не принимали (в виде подписания NDA или подобных документов) — то можете. Этически это может быть иногда не хорошо, но юридически (опять же — насколько я знаю) — с этим нет проблем.
УК РФ, ст. 138 — про третьих лиц (почтальона, системного администратора) которые не должны иметь данные о вашей переписке с кем-то, но технически могут это.
Если хотите более авторитетных мнений от юристов — поищите комментарии к 138 статье, часто в статьях о DLP и утечках информации этот вопрос обсуждается.
каждый раз новое соединение для запроса или через один keepalive коннект запросы шлет? Если каждый раз новое, то iptables, через модуль recent вполне может автоматически блокировать. Это снизит нагрузку и на диск и на проц и на сеть. Не решит проблему совсем, конечно же, но кое что. Только не ставьте слишком жестокие границы, чтобы легального пользователя не зацепить. Лучше по количеству коннектов в минуту отрубать, тогда каждый бот сможешь ддость не более минуты.
Попробуйте сделать strings на оригинальные и зараженные файлы, и потом diff результаты. Мало ли, но если вдруг в новый файлах найдутся емейл адреса, хостнеймы или IP адреса хостов, перечень файлов которые нужно троянить — это может оказаться очень интересно.
Кроме того, погуглить md5 и sha1 хеши. В идеале, вы должны найти их упоминание либо на форумах в темах «караул, меня сломали», либо в описаниях официальных пакетов от дистрибутива.
ну к вам же требования какие-то конкретные предъявляются? (напр чтобы не сработал поиск по «скинхедам») или в общем виде?? (ничего эротического, ничего жестокого). Если в общем — тогда это, конечно, ужас, но и то, тогда можно прицепиться к методике проверки — по каким запросам проверяют. Но технически, если есть список правил, то можно предотвратить нехороший поиск, и даже если при проверке комиссия придумает запрос с переподвыподвертом «молодые люди с татуировкой свастики и очень короткой стрижкой» — его можно было бы тут же через UI включить в блок-лист. Технически это реализовать возможно.
Не решение, а просто вопрос из любопытства. А вам бы помогло, если б фильтр был в обе стороны? С одной стороны — как и сейчас, пытается фильтровать нехорошие входящие странички, а с другой — фильтровал бы запросы (напр если в форме поиска есть «порн» или «скинхед» или «гитлер», то отклонял бы ее)?