По-моему, в простейшем варианте вполне достаточно управляемых L2-коммутаторов и port-based VLAN. Всё остальное нужно лишь в случае, если юзерам позволено произвольно дёргать за сетевые кабели.
User782, поскольку similar_text безразличен к семантике, орфографии, словоформам и пр, и оперирует только символами - да. Но т.к. изменение алфавита приведёт к изменению "похожести" - нет.
similar_text даёт нечто, посчитанное по двум параметрам и измеренное в попугаях, от чего толку, как по мне, ноль. Но если Вам нравится - используйте.
Vitsliputsli, он ничего не создавал. Он сохранял сериализованные объекты и позволял с ними работать. Поиск и извлечение отдельных свойств, сравнение/изменение/слияние и пр. Нет, понятно, что можно было и создавать, но это побочный эффект.
Я что, бабка-гадалка? откуда я знаю. Вы же не то что не показали того, что я перечислил в первом комментарии, но даже не сказали, что это действительно проделано, и списки существуют.
Вообще-то у Каспера есть "Security для виртуальных и облачных сред" - по-моему, самое то. И лицензий необязательно приобретать целую коробку, они и по одной прекрасно продаются.
Вы обратитесь к приличному партнёру Каспера в Вашем регионе - и проконсультируют, и подберут именно под Ваши реалии, и потом, если надо, поддержат.
Вы определили список угроз, от которых нужно защищаться, и список объектов, подлежащих защите? И каково точное назначение защищаемого сервера - от этого сильно зависит выбор продукта для организации защиты.
Бессмысленный и беспощадный скрипт... 9 триллионов итераций. К тому же он даже не думает над тем, какую запись из пары похожих удалить.
Ну и similar_text, с его O(N^3), тоже не подарок.
А главное - даже приблизительно не видно, что тут можно улучшать, хотя бы в теории. Кроме поиска более вменяемого алгоритма оценки похожести.
Я бы пошёл по пути разборки записей на токены (слова) и выделения групп записей со значительным совпадением набора токенов. Тоже не сахар, но на 3кк записей речь шла бы, наверное, о нескольких часах.
Caxann, ну формально я JSON (и PHP serialize) ещё на 4-й версии использовал, для чего были написаны чуть не с полсотни разных функций. И работало, и даже сравнительно шустро. Но по сравнению со нынешними встроенными - конечно, черепаха, даже если найти тексты. А если надо тупо хранить и отдавать как есть, без обработки - да, пишем в TEXT и не заморачиваемся.