• Формат архива с индексированным поиском

    alekciy
    @alekciy Автор вопроса
    tar должен пройти весь архив что бы найти нужный файл. Когда файлы десятки Гб и файл в самом конце архива, то занимает достаточно много времени. Я даже на erlang-e писал индексатор tar архива, но хочется что-то «нативно» на уровне самого архива. Но мне казалось, что в том же zip-е метаинформации для быстрого поиска нет, по всему выходит, что заблуждался.
  • Многоязычный сайт… не блог… как?

    В gettext-е есть возможность задавать числительные через plural forms. Тема с падежами там вроде тоже как была, хотя для русского языка вроде не так все однозначно. Тема с контекстом на самом деле не сильно актуальна и возникает крайне редко. Ведь в gettext храниться кусок текста полностью как есть. Целая фраза или предложение. Я в своей практике не припомню случая, когда переводчику понадобился бы контекст. Поэтому приведенную схему считаю оптимальный и удобной для поддержки в проекте. И ни чего более удобного я пока еще не видел.
  • Востребованность open-source панели управления хостингом

    >то зачем нам разные языки если есть асм и си
    Затем, что на PHP, RoR, ...,… выходит дешевле и быстрее. Дешевле в смысле комплексно: сложность поддержки, стоимость разработчиков. Абсолютно просто экономический расчет.

    >Или зачем такое количество CMS на PHP?
    Ни одна из них не может конечному клиенту (не разработчику!) предоставить требуемый функционал за приемлемый для него бюджет.

    >это незачем в моей ЦА — им предоставляют DNS провайдеры.
    Эту аудиторию обычно устраивает ISP либо люди вовсе могут сделать сами все из консоли. Имхо, правильное направление — кнопка «создать сайт». Должен создаваться vhost, база для сайта, ftp изолированный аккаунт, создаваться записи на уровне DNS. Ибо DNS нужен даже тем, кто может их и сам прописать. Просто нужно логиниться и делать это все руками сейчас, а панель бы могла это автоматизировать. Лично я на протатипе использовал API от reg.ru. Тут можно и домен создать, и все нужные для него записи в DNS зафигачить.

    >как можно снять с плеч панели ответственность за ПО и оставить только функцию контроля
    Парсинг с лексером? Все равно остается вопрос интерпретации (на туже валидность и допустимые значения) распарсеных сущностей. И мы снова упираемся в суппорт панели для разных версий. Имхо, бесперспективный вектор.

    Киллерфича любой панели должна быть большая кнопка «Сделать все хорошо». Просто у каждой ЦА она должна быть своя (решать разные задачи).
  • Оплата труда за рубежом и из-за рубежа

    Это на УСН-е. А так же не забываем про фиксированные взносы в 2МРОТ-а которые так же нужно закладывать в расходы.
  • Как масштабировать систему для снижения нагрузки?

    Диск кстати очень легко отследить. В atop-е это сразу видно.
  • Как правильно соединяться с базой в нагруженных проектах?

    Зачем писать велосипедный пуллер когда есть, к примеру, PgBouncer?
  • Apache, www-data, права на файлы и директории?

    1) Нет, не нужно.
    2) Можно настроить, что сможет. Но если этого не требуется, то на log директории нужно ставить 0570/u1:nginx, а на сами лог/кэш файлы 0460/u1:nginx. Тогда u1 сможет получить листинг log директории и прочесть из ней файлы, но изменить их или отредактировать не сможет.
    3) Аналогично п.2, хотя в целом вопрос мне не очень понятен. Если файла загруются по ftp с правами u1, то и файлы в этом случае будут принадлежать ему. Какая маска прав будет использоваться зависит от установленной umask (чаще всего это 022, и получаются права 0660 и nginx не сможет их редактировать).
  • Как настроить свои страницы для 5xx ошибок сервера или куда переехать, что бы их не было?

    Если на сайте нет ничего выходящего за рамки закона, то могу за те же деньги предложить место на своем дедике. Возможный минус — отсутствие apache и соотвественно htaccess ибо я ратую за скорость работы сайта и использую только nginx.
  • После отключения APC на веб-сервере с LAMP сайты начали работать быстрее и разгрузился процессор. WTF?

    Второй тоже в принципе все еще жив. Начал поддерживается новым человеком с 2012 года и теперь живет на гитхабе: github.com/eaccelerator/eaccelerator, но вообще и до этого был форк который tony2001делал. Я его использовал к примеру в этом тесте: Smarty VS ctpp и остался доволен.
  • Почему сервер не дает загрузить файлы по FTP?

    Потому что umask не решает проблему. Задаем umask 027 для apache. Запущенный от www-data:www-data он создает папку у которой получается маска прав 750. ftp пользователь dasty:dasty получает «Permission denied» потому что для него срабатывает хх0.

    Только невежество приводит к незнанию о SuExec или php-fpm. А игрища с umask-ами и группами обычно приводят к возможности атаки через соседей.
  • Почему сервер не дает загрузить файлы по FTP?

    И при чем тут

    Читаем внимательно исходную ситуацию:
    когда какой-либо из скрипов создает папку на сервере, к примеру если я устанавливаю CMS которая сама себя распаковывает из архива, в эту папку я не могу ничего загрузить. FTP-клиент выдает ошибку

    Происходит это когда криворукий хостер оставляет настроки веб сервера по умолчанию. Обычно это debian и веб сервер работает от www-data:www-data, а ftp работает от какого либо системного пользователя, к примеру dasty:dasty. И umask в 027 тут не поможет, т.к. ftp пользователь dasty:dasty для папок созданных www-data:www-data получает «Permission denied», т.к. упираемся в хх0 когда даже внутрь папки входить запрещено.

    Тема с выставлением 777/666 прав (приведенных в линке script88 ) является типичным решением недобросовестных хостеров.
  • Почему сервер не дает загрузить файлы по FTP?

    И выставлять 777/666? Тоже плохой вариант. Потому как при таких настройках возможен взлом через соседей.

    Давно уже можно запускать веб сервер с правами определенного пользователя, от него же и выполнять ftp запросы.
  • Куда переехать для создания команды

    Тогда поддержу комментаторов выше. Единственное дополню список пожалуй еще только Ульяновском. От нас туда часть народу очень даже адекватного съехала, кто-то изначально был из тех мест. Опять же на любителя там есть erlang, там есть Валкин. Для развития, имхо, самое оно.
  • Выбор СУБД под задачу

    Лично я использую postgresql + schema (используется как одноуровневые namespace-ы) + EAV. Контент менеджер через веб интерфейс создает объекты (стиральные машины, дома, пользователи) и атрибуты. Любой атрибут может быть связан с любым объектом. Все структура умещается в 5 простых таблиц. Выбрал именно реляционную схему потому что: 1) РСУБД это старые и хорошо себя зарекомендовавшие системы; 2) структура таблиц простая поэтому код легко поддерживать и расширять; 3) легко найти разработчиков способных работать с такой системой; 4) сложившиеся практики правильного использования таких СУБД. Тестировал на дедике с 80 тыс. объектов (дом) по 10 атрибутов на объект => 800 тыс. элементов (дом1, дом2… по 10 элементов на объект), 8 мил. свойств. Поиск по 10 значением параметров из которых 2 это диапазон значений занимает ~0.8 мс. Считаю такой показатель хорошим.

    Но в целом, имхо, выбор СУБД вопрос конечно важный, но погоду делает код который будет с этой СУБД работать.
  • Как использовать limit_req и не зарезать поисковики

    А они туда и не попадут. На основании базы IP-шников (проверенных PTR-ами) и User-Agent-а запрос попадает в location с высоким или отсутствующим limit_req. Можно конечно базироваться чисто на User-Agent-е, но шерстящие боты зачастую очень любят использовать User-Agent от Яндекса или Google и получается, что цель озвученная в топике достигнута не будет.
  • Какова все-таки надежность софтверного RAID-1?

    Сразу возникает вопрос, какой же это у автора дистрибутив.

    P.S. Ставлю на CentOS :-D
  • Правильно организованный выбор языка для сайта

    А для поисковиков есть sitemap и hreflang атрибут. Впрочем hreflang стоит приметь и в обычной разметке. "Internationalization Best Practices: Specifying Language in XHTML & HTML Content" в помощь.

    В общем с поисковиками больших проблем нет, если следовать рекомендациям и сложившимся практикам.
  • Как безболезненно уйти с Delphi?

    Им не нравится именно веб интерфейс и то, что надо запускать программу в веб браузере.

    Вопрос решаемый Chromeless-ом (XULRunner). Как выглядит при этом веб приложение зависит от авторов приложения, а выглядеть он может как угодно.

    Плюс есть момент, когда к компьютеру необходимо подключать дополнительное оборудование, наподобие сканера штрих кодов, считывателя карт и т.п, или еще что нить по COM порту.

    Решается плагинами (XPCOM).

    Вообще если ценник решения на делфи и веб приложение будут сильно отличаться, то нужно думать многих уже перестанет напрягать необходимость работы из браузера.
  • Декодировать данные, закодированные индивидуваьным алгоритмом

    В сутках 86 400 секунд. На 20 000 страниц это около 4 сек. в однопоточном режиме. Время более чем достаточное не только на построение DOM, но и сетевые задержки. Если параллельно запустить насколько таких парсеров, то можно и быстрее, чем сутки без проблем все спарсить. Это проще и быстрее, чем расковыривать пачку JS-ов.
  • Какая скорость работы с диском вашего VDS?

    Конфигурация EX 4S случайно не на SSD диске? Уж больно скорость подозрительно высокая.

    У меня дедик еще по старому тарифу NHS-1:

    dd if=/dev/zero of=tempfile count=512 bs=1024k conv=fdatasync
    512+0 records in
    512+0 records out
    536870912 bytes (537 MB) copied, 8.65944 s, 62.0 MB/s