Задать вопрос
  • Посоветуйте книгу по Apache Nginx

    @bondbig
    По nginx. Рекомендую.
    Ответ написан
    Комментировать
  • Стоит ли на сервер для запуска стартапа устанавливать Solaris?

    @bondbig
    Стоит ли на деловую встречу надеть серый костюм или синий?
    ОС нужно выбирать исходя из конкретной задачи. Может для вашего стартапа вообще лучше подойдет Windows?
    Что за стартап-то?
    Ответ написан
    2 комментария
  • Ограничить роутинг OpenVPN одной сетью

    pietrovich
    @pietrovich
    так в OpenVPN можно per user настройки делать.
    задаем client-config-dir, в ней складываем персональные конфиги для разных юзеров. общие маршруты пишем в конфиг сервера, дополнительные каждому по необходимости и при коннекте клиент получает только то что задано для него. кому шлюз не нужен его не получат. правда придется вынести разадчу шлюзов в индивидульные настройки если она раньше pushилась из общего конфига. или поискать как ее в клиентском «затирать», может есть такая возможность да я о ней не знаю
    Ответ написан
    1 комментарий
  • Анализ и разбор текста

    @MikhailEdoshin
    У Apple в Newton'е был такой assistant, небольшой системный сервис, которому пишешь, например, «fax Bob», и он соображал, что нужно взять текущий документ, найти в адресной книге Боба и отправить ему этот документ по факсу. Принцип там был несложный, детали можно найти в Newton Programmer's Reference v2.0, ch. 18, Intelligent Assistant. (PDF можно найти в Google.)

    Если будете сами писать, советую присмотреться к такому методу разбора CYK — это универсальный bottom-up метод разбора, начинающий с выделения токенов в строке, и затем сворачивающий их по правилам грамматики. Целиком CYK вам не потребуется, скорее всего, потому что у вас основная проблема как раз в отсутствии грамматики, но основной принцип можно использовать примерно так:

    — Разбираете строку на слова

    — Классифицируете каждое слово. Например, пусть «ПН» будет порядковый номер, «ДН» — день недели, «М» месяц, "?" — неопредленное слово. Ваша фраза будет "?-ПН-ДН-М-?-?-?".

    — Ищете в строке паттерны (собственно, это как раз фаза свертки и получается). В данном случае паттерн «ПН-ДН-М», он у вас будет зарегистрирован для парсера дат. В другой строке у вас будет, например, «В среду по первому кино» — "?-ДН-?-ПН-?". Паттерна «ДН-?-ПН» в датах у вас не будет (вряд ли такая комбинация может обозначать дату), поэтому парсеру дат пойдет только «ДН», а «ПН» либо проигнорует, либо отдаст, например, парсеру телеканалов.

    Такой подход удобен тем, что грамматика не нужна, а подходящие паттерны вы можете определить по мере обработки данных. Я как-то писал такой парсер для адресов — неплохо разбирал, грамотно различая, например, разные «St» в «St Patrick St». Хотя и не со стопроцентной точностью, попадались там двусмысленные паттерны.
    Ответ написан
    2 комментария
  • Придать нормальный вид форме?

    @Kane
    Не делайте её горизонтально как советуют выше. Вертикальные формы читаются и заполняются проще :)
    Ответ написан
    1 комментарий
  • Надежный сервис для проверки WHOIS доменов свободен/занят списком?

    @2Lebedev
    а что значит «надежный»?
    Ответ написан
    Комментировать
  • Доказать работодателю эффективность современных технологий при создании сайтов?

    char
    @char
    Жизнь слишком коротка, чтобы что-то доказывать дуракам.
    Ответ написан
    Комментировать
  • Какой логотип лучше?

    printf
    @printf
    Ем детей.
    Вы сделали меня плакать кровью.

    Оставьте тот, где кроме надписи ничего нет, пожалуйста, от лица всего сообщества свободного ПО, я вас умоляю.
    Ответ написан
    2 комментария
  • Мультиязычный транслит на PHP?

    @dmiceman
    Боюсь, ничего готового гугль не находит. И это действительно очень сложная и комплексная задача, совсем непохожая на работу mb_strtoupper(). С изменением регистра символов все просто — есть символы юникода, есть таблицы соответствия. А вот таблиц «близости по звучанию» — нет. И что-то мне подсказывает, что создать их вне зависимости от контекста языка невозможно.

    Даже в фонетических языках есть большой произвол в звучании одних и тех же букв в зависимости от контекста. А та же кириллица используется во многих языках, звуча при этом немного по разному.

    Что уж говорить про иероглифы, которые кодируясь одними и теми же последовательностями байт, звучат различно для разных народов их использующих. Тем более, что звуки языков с переменной тональностью довольно сложно передать посредством ASCII.

    Но вот, в частности нашел таблицы для русского: textpattern.ru/html/transliteration-tables.htm
    Ответ написан
    1 комментарий