• Комментирование CSS+HTML: стандарты, утилиты и т.п?

    @vitstr
    Front-end developer
    была статья по поводу cssdoc habrahabr.ru/blogs/css/87406/
    Ответ написан
    Комментировать
  • Комментирование CSS+HTML: стандарты, утилиты и т.п?

    kaluzhanin
    @kaluzhanin
    Для CSS есть даже проект стандарта: cssdoc и его (неполная) имплементация на ruby: css_doc. Насколько это востребованно, не скажу, но логика подсказывает, что раз этим кто-то занимается, значит это кому-то нужно.

    По HTML — информации не имею, да и не думаю, что это нужно. Все-таки в CSS можно указывать, когда применять данный стиль, а HTML говорит сам за себя.
    Ответ написан
    Комментировать
  • Вопросы по sqlalchemy

    DeNnEr
    @DeNnEr
    Потребности людей ростут, люди устали от статики и хотят больше динамики.
    Увы, SQL-based СУБД не созданы для динамических схем. Если ты будешь часто менять схему, то проиграешь в производительности, очень сильно проиграешь. А это ещё при том, что SQL(а тем более с использованием SA) не так и шустр.

    Советую обратить внимание на более современные решения — документ-ориентированные бд. Точнее — на MongoDB и MongoKit как средство для создания и манипулирования схемами.
    Дело в том, что документ-ориентированные СУБД созданы как-раз для динамических данных, где схема может часто меняться. Документ в такой БД, тоже самое что и запись(строка, row) в SQL-based, в реляционных БД.
    Документ представляет из себя JSON-структуру данных, в которой всё можно менять, дополнять, удалять.
    У документа нет «схемы». Т.е. захотел сделать документ с постом пользователя, вот и делай:
    db.posts.save({id:1, author:«James», text:«Howdy!»})
    Однако, схемы бывают нужны, поэтому для них делаются программные решения вроде MongoKit.
    Например, можно указать в MongoKit такую схему:
    {
    name:unicode,
    data:{unicode:unicode}
    }
    Что позволит оперировать словарём data как хочется.
    Схема для поста, например:
    {
    id:int,
    author:unicode,
    text:unicode
    }

    В общем, советую почитать:
    www.mongodb.org/
    namlook.github.com/mongokit/
    Ответ написан
    Комментировать
  • Подскажите чем отправлять рассылку на PHP

    Используем собственную обертку для mail(), на стороне сервера как почтовик стоит exim.

    Строится очередь подписчиков, и письма отправляются порциями, примерно по 100 писем в минуту, по крону пока не уйдут все. Релазиовать на php такую систему в принципе довольно просто.

    Замечено, что сервер больше грузит не сама отправка сообщений, а приходящий поток ответных писем (подписчики — в основном различного рода юрлица, и у многих стоит автоответчик вида «спасибо, ваше письмо получено» и т.д.) — этот поток писем обрабатывается спамассасином и подгружает сервер. Чтобы с эти бороться просто сделали чтобы ящик, с которого идет почта, не проверялся спамассасином
    Ответ написан
    Комментировать
  • Анализ и разбор текста

    @MikhailEdoshin
    У Apple в Newton'е был такой assistant, небольшой системный сервис, которому пишешь, например, «fax Bob», и он соображал, что нужно взять текущий документ, найти в адресной книге Боба и отправить ему этот документ по факсу. Принцип там был несложный, детали можно найти в Newton Programmer's Reference v2.0, ch. 18, Intelligent Assistant. (PDF можно найти в Google.)

    Если будете сами писать, советую присмотреться к такому методу разбора CYK — это универсальный bottom-up метод разбора, начинающий с выделения токенов в строке, и затем сворачивающий их по правилам грамматики. Целиком CYK вам не потребуется, скорее всего, потому что у вас основная проблема как раз в отсутствии грамматики, но основной принцип можно использовать примерно так:

    — Разбираете строку на слова

    — Классифицируете каждое слово. Например, пусть «ПН» будет порядковый номер, «ДН» — день недели, «М» месяц, "?" — неопредленное слово. Ваша фраза будет "?-ПН-ДН-М-?-?-?".

    — Ищете в строке паттерны (собственно, это как раз фаза свертки и получается). В данном случае паттерн «ПН-ДН-М», он у вас будет зарегистрирован для парсера дат. В другой строке у вас будет, например, «В среду по первому кино» — "?-ДН-?-ПН-?". Паттерна «ДН-?-ПН» в датах у вас не будет (вряд ли такая комбинация может обозначать дату), поэтому парсеру дат пойдет только «ДН», а «ПН» либо проигнорует, либо отдаст, например, парсеру телеканалов.

    Такой подход удобен тем, что грамматика не нужна, а подходящие паттерны вы можете определить по мере обработки данных. Я как-то писал такой парсер для адресов — неплохо разбирал, грамотно различая, например, разные «St» в «St Patrick St». Хотя и не со стопроцентной точностью, попадались там двусмысленные паттерны.
    Ответ написан
    2 комментария