Стоит помнить, что информационное пространство — дорога с двусторонним движением: админ тоже может знать много нелицеприятного о компании/её начальстве и т. п.
При создании поискового индекса (что в sphinx, что в solr/elasticsearch/lucene) слова сначала нормализуются, чтобы не раздувать индекс. Т. е. две разных словоформы должны одинаково приводить к хиту. Поэтому то, что предлагает 1010101001000100110100111 выглядит идиотизмом (в смысле, загнать в индекс все словоформы).
Вы все равно хотите подсвечивать хиты из индекса. Оно, конечно, относительно дорого, но реалистично. Далее Вы берете токенизатор и проходите по всему тексту, нормализуя слова и проверяете каждое встретившееся впервые на наличие в индексе. Если индекс влезет в память — будет быстро, если нет — такова судьба.
Стеммер Портера не лучшее решение, хотя и простое. Например, Иванов и Иванова будут иметь разную норму (Иван и Иванов, соответственно).
Кроме того, если код Ваш — то всегда можно сделать двойную лицензию для использования в случае GNU-ненависничества. Причем, Вы можете спокойно лицензировать и под коммерческой лицензией. Сложности возникают, если право владения кодом коллективное.
И там, и там создаются подключения. Если они оба на eth, то отключить автоматическое подключение и выбирать руками в виджете/апплете/nmcli networkmanager'а.