Применять это дело надо не в языке программирования, где я могу воротить как хочу, а у производителя DLP, который только с помощью regexp позволяет описать "Стоп слова" и чувствителен к регистру :)
На самом деле бд эта защищается, так как как минимум оттуда можно что-то выпилить или подменить её. Это самые простые варианты. Вопрос был в том, как)
Что касается размера сигнатур, конечно он важен, ибо если она слишком мала, то есть вероятность что мы будем ловить все подряд, и нужное и ненужное, а если большая то ничего не найдем совсем..