livemirsi: со словарями - это просто жесть. надо минимум делать через POS-деревья. Вы не придумаете столько словарей.
"Сколько их там всего было?" => kinoart.ru/archive/1997/03/n3-article1
livemirsi: пока мне сложно, т.к. нужен конкретный пример. Т.е. список того, что именно выцепляем из текста (какую информацию).
Вот пример:
"Ёжик со слона зелёного цвета вприпрыжку возвращался в свой тесный красный дом."
Вопросы контекстного поиска (вопрос-ответ):
1. Какого цвета дом у ёжика? (красного)
2. В чей (имя собственное/существительное) дом возвращался ёжик? (в дом ёжика, в свой же дом)
3. Какого размера ёжик? (со слона)
4. Какого размера красный дом? (тесный)
5. Откуда возвращался ёжик? (со слона?!)
6. Ёжик умеет прыгать? (да)
Вот можно протестить....
И это лишь один частный случай из "моря" вариантов.
livemirsi: "проявляется вся крутость от занятия кодингом" - я ежедневно этим занимаюсь (кодингом такой сложности и выше) и могу сказать, что строк мало, а времени и сил уходит нереально много, и не так это просто и весело...
livemirsi: решение вопроса в последнем предложении - это самое вкусное и интересное))) все что выше - гораздо проще. про смещение - нужно "растекаться", а не смещаться.
livemirsi: либа почти ничего не умеет....
по поиску: Левенштейн и JaroWinkler - это устаревшие варианты....
все остальное - это просто туча правил и словарь.
по определению части речи - там вообще нет ничего.
по работе с деревьями - тоже ничего: максимум двумерные массивы и сдвиг)))
я бы не стал юзать её для любых своих нужд...
livemirsi: чтобы оценить объекты - нужно понимать отношения местоимений: *котор* [некоторые, которые, которую,....] и [неё, её, его, оно, им, и т.д....] во всех лицах и падежах. Тогда по поиску связок внутри одного предложения П*С*П, Г*С*Г, П*М*П, Г*М*Г, где С-сущ, П-прилаг., Г - глагол, М - местоимение. и после - уже анализировать вектора мыслей по объектам...
livemirsi: "зеленый сильный ежик" - нечеткий поиск, как раз, по ссылке, находит такие вещи.
Про остальное - это поисковые деревья (связи узлов с направлениями) различных частей речи.
Самое первое что нужно: уметь определять о чем весь текст (главную мысль = авто-заголовок). Если это получится сделать - остальное уже дело техники.
Касательно длины ёжика, может быть так: "ёжик со слона". Вот тогда что делать?
Дизайн, правда, не очень, а блоки и инфа - отлично.
И еще: не нужно писать: "без PHP*" (со звёздочкой) если все равно нужна поддержка PHP.
Этим Вы отталкиваете клиента. Попробуйте сделать:
1. ИЛИ реально без PHP
2. ИЛИ с PHP и другими нужными "феничками"
И лично у меня сразу вопрос к Вам:
А как Вы отслеживаете front-end копии? Купил человек скрипт, поставил себе и другой у него скачал с сайта и накопировал/начал распространять.
Просветите этот момент, пожалуйста.
Сергей: скелетон/болванка - я имел ввиду уметь строить минимальный каркас приложения, чтобы скомпилировался/заработал hello world. А чтобы начать что-то делать - нужно просто внимательно читать и понимать мануал и уметь быстро находить ответ на текущий возникший вопрос. Порог зависит больше от человека (как быстро он усваивает новую информацию), нежели чем от специфики средств разработки с использованием определённого ЯП.
Сергей: ну я бы сравнивал не по размерам, а по скелетонам. Т.е. какой минимум нужно знать, чтобы написать hello world. Можно писать как угодно и на Java функционально и на PHP объектно-ориентированно - это не показатель.
А про размер - это тоже не показатель. Чем меньше размер - тем меньше там ненужного хлама (функции в либах и неиспользуемые ресурсы, лежащие мёртвым грузом).