Ответы пользователя Zorkus — Хабр Q&A

Задать вопрос

Ответы

J2EE и высокие нагрузки?

Zorkus @Zorkus

Примеры нагруженных проектов из топа Алексы, юзающие Java: Amazon, eBay, LinkedIn, Google.

Очень много на Java в банках (особенно в инвестиционной аналитике), в биржевых приложениях, как уже было сказано.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Для чего нужна ORM?

Zorkus @Zorkus

написал статью тут — habrahabr.ru/blogs/programming/123293/

Ответ написан более трёх лет назад

2 комментария

2 комментария
Для чего нужна ORM?

Zorkus @Zorkus

Сам по себе ORM, именно как maaping, в крупных проектах нужен как раз очень сильно. Опишу здесь свой опыт. Если понравится кому, может и статью потом.

Итак.
Представьте себе — у меня есть очень крупная система, и есть в ней таблица orders, в ней скажем, 50 колонок (на самом деле у нас 150, ну да ладно. Нормализаторы, молчать! Про нормальные формы я тоже знаю). И вот надо значит вам выбрать один ордер и показать его на экране. Допустим, вы пишете селект, неважно. Дальше что делать, в промежуточном слое? Вы не же вызываете хранимую процедуру (запрос) напрямую с, скажем, JSP страницы (я надеюсь), вам все равно надо получить данные и передать их как-то.
Так что, передавать их в виде массива, ArrayList-a, ассоциативного массива имя колонки/значения? Ну так дико громоздно, неудобно, и очень легко ошибиться. А если вам надо несколько ордеров, тогда что, создавать вложенные коллекции для конвертации результатов? Неудобно же.

Потому, очевидно, нам нужен объект Order, имеющий все нужные property, и нужен код, который умеет конвертировать результаты скл запрос в эти объекты (или коллекцию этих объектов).

Далее, очевидно, что писать руками _все_ запросы трудно и нудно, легко ошибиться, т.к. в Java они будут представляться в коде в виде строк (а значит, никакой статической типизации и compile-time проверок и прочее и прочее), и их надо держать либо в Java коде (если они мелкие), либо, если побольше, выносить в отдельные XML файлы.

В общем, ORM в больших проектах нужен для упрощения рутинной части. Без него — никуда :)

Безусловно, обойтись ТОЛЬКО ORM не получится. Есть у нас масса мест, где сложная логика написана в хранимых процедурах в 500-1000 строк на PL/SQL, написанная через ORM /Java она бы занимала в 10 раз больше и работала в 2 раза медленнее (при этом, она была бы еще и менее понятная, т.к. есть такая логика, которые в терминах реляционной алгебры описывается куда проще, чем в терминах ООП :), следовательно ложится на ORM со скрипом). Сколько нибудь сложные запросы с подзапросами, юнионами, хитрыми джойнами тоже писать через чистый ORM громоздко. Оптимизировать запросы, работающими в таблицах где, хотя бы, несколько сотен миллионов записей, без доступа к планам SQL оптимизатора и статистики/средствам мониторинга уровня СУБД тоже крайне сложно. Так что без SQL тоже — никуда :)

Ответ написан более трёх лет назад

3 комментария

3 комментария
Где стартапу искать программиста?

Zorkus @Zorkus

вы дадите долю акций?

Ответ написан более трёх лет назад

8 комментариев

8 комментариев
Хорошая ли идея использовать в качестве ID (первичного ключа) мд5 хеш?

Zorkus @Zorkus

Просто вот это — дырками после удалений (если использовать просто инкремент айди) — а в чем тут проблема? Ну будут дырки и будут. Это же суррогатные ключи.

Да, если уйти глубоко в стек, можно поговорить по clustering factor на индексах и прочем ;) но это уже мелочи.
Повторю, я бы использовал внутри СУБД именно этот подход.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Хорошая ли идея использовать в качестве ID (первичного ключа) мд5 хеш?

Zorkus @Zorkus

Какие веские причины не использовать autogenerated surrogate key?

Ответ написан более трёх лет назад

2 комментария

2 комментария
Автомобильный GPS навигатор, лучшее из дешевеньких?

Zorkus @Zorkus

www.texet.ru/news/4952.html

Ответ написан более трёх лет назад

Комментировать

Комментировать
Автомобильный GPS навигатор, лучшее из дешевеньких?

Zorkus @Zorkus

У меня TeXeT 505, всем доволен.

Ответ написан более трёх лет назад

Комментировать

Комментировать
В какую сторону лучше двигаться с JAVA

Zorkus @Zorkus

Java востребована и больше всего платят (среди Java-разработчиков) в области нагруженных Enterprise web и всяких нагруженных систем обработки данных.

Из нагруженных сайтов с миллионами посетителей с Back-End на Java (по крайней мере частично) — это Amazon, LinkedIn, eBay.

Системы обработки данных — это биржевые систимы (требуется ultra-low latency), банковские системы (распределенные системы для расчета рисков в инвестиционном банкинге), геоданные (в связке с O-Spatial, как было связано), обработка статистических данных, всевозможные кластерные вычисления и InMemoryDataGrid-ы, наконец та отрасль где работаю я — Data Mining в области Retail индустрии.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как вы храните свои пароли?

Zorkus @Zorkus

LastPass.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Идеи по поводу развития блога Java

Zorkus @Zorkus

В целом я поддериживаю идею — заранее публиковать своеобразный «тизер», что ли, и спрашивать -кому было бы интересно прочитать.

Потому что на самом деле хорошая глубокая техническая статья — это 1-3 дня на исследования, эксперименты и гуглинг, и день на собственно на написание статьи.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Идеи по поводу развития блога Java

Zorkus @Zorkus

У меня есть в черновиках несколько статей по Java и JVM тематике, но все никак руки не дойдут их допилить и выложить, извините :(

Был бы признателен если кто прокомментирует — чего бы больше хотелось почитать. Тогда я как то приоретизирую и постараюсь найти время в ближайшее время.

1) Java — Atomitcs и неблокирующие алгоритмы в Java, concurrency.
2) Java — как работает внутри Reflection.
3) Groovy — как работают внутри замыкания, мемоизация замыканий, рекурсивные замыкания и лямбды.
4) Метапрограммирование в Groovy — AST-трансформации и Meta-Object Protocol.

Ответ написан более трёх лет назад

6 комментариев

6 комментариев
Amazon S3 - структура директорий для хранения мелкой статики (e.g. картинки)

Zorkus @Zorkus

Если взглянуть чуть дальше, возникает вопрос — а зачем хранить картинки на амазоне?

Просто у нас был проект в котором миксовались сервера арендованные в обычном датацентре, и сервера в Amazon EC2.

Так вот, если у вас ноды Амазона работают с более менее ровной нагрузкой в режиме 24/7, то арендовать сервер в датацентре возможно будет выгоднее.

Просто идеальное применение для нодов Амазона — это когда вы их запускаете на короткое время для вычислительных задач (скажем, мы запускает там на 15 нодах расчет прогнозов в некоторой задаче моделирования, которой мало времени отпущено на выполнение. Или когда вы подключаете сервера, когда в пике ваши собственные не справляются.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Библиотеки для работы с DJVU и PDF

Zorkus @Zorkus

Для PDF — iText.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Что должен знать настоящий программист?

Zorkus @Zorkus

Добавлю к перечисленному — еще настоящий программист должен (ящитаю) знать хотя бы основные структуры данных (массив, связный список, стек, очередь, деревья, графы) и алгоритмы, все это не привязываясь к конкретному языку. А так же понимать хотя бы минимально понятие ассимптотической сложности (О-большое) по времени и по памяти.

Без этого трудно писать не-быдлокод.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как защитить БД с критичными данными от произвола медленных запросов?

Zorkus @Zorkus

Мне, как Ынтерпрайзнику, вообще кажется чем-то диким давать юзерам, которые не является девелоперами / support инженерами, и не знают хорошо SQL и базы данных «вообще» прямой SQL-level доступ к большой нагруженной БД с критичными данными (кстати, что значит доступ по TCP? Вы имели в виду — возможность запускать вручную запросы из mysql клиентов, типа SQLYog?)

Вам так необходимо, чтобы Ваши юзеры могли запускать собственноручно криво написанные запросы? Они не могут обходиться набором заголовленных репорт-запросов, или чем-то таким? Они не могут посылать запросы, которые хотят исполнить, специальному грамотному чуваку, который будет их ревьювить и запускать? А как вы предотвращаете нечаянные удаления данных и прочее? Юзеры имеют read-only привилегии на все объекты БД?

Если же Вам прямо так критично давать юзерам такой доступ… Тогда, как тут сказали тут, делать slave-сервер с репликацией, либо настраивать user resource quotas по поводу использования CPU, IO-bandwidth, памяти каждым пользователем (под которыми ваши юзеры коннектятся у БД). Сам в mysql не силен, потому не знаю, как у него с квотами ресурсов.

Ответ написан более трёх лет назад

Комментировать

Комментировать
MS SQL Server. T-SQL. Организация "истории изменений"

Zorkus @Zorkus

По первой части вопроса могу сказать — да, дизайн вполне нормальный. Я использую примерно такой же подход (СУБД Oracle).

По части отслеживания того, какой конкретно юзер сделал определенное изменение — это зависит от того, как вы храните информацию о юзерах. Если юзеры хранятся в базе в отдельной табличке, как я предполагаю, то можно делать так.

Добавьте колонку last_modified_by_user на таблицу mytable, и, соответственно, таблицу mytable_history.
Соответственно, когда какой-то пользователь выполняет операцию (insert / update / delete), вы выставляете ID-шник этого юзера, и при срабатывании вашего after-insert, after-update, after-delete row-level триггера этот айдишник перенесется в таблицу аудита.

А как вставлять айдишник пользователя изначально в таблицу mytable? Ну, создавать server-side user-context в котором хранится имя-id пользователя, ассоциированный с пользовательской сессий, и при выполнении запроса с уровня бизнес логики — заполнять это поле.

Как-то так.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Связка apache + oracle на этапе установления https-соединения?

Zorkus @Zorkus

А зачем вам обращаться к Oracle во время проверки клиентского сертификата? У вас сертификаты хранятся в БД?

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Какие сертификаты можно получить и где?

Zorkus @Zorkus

habrahabr.ru/blogs/java/84405/ — я в этом топике описывал свой опыт сдачи двух (тогда еще Sun-овских) сертификатов по Java, может найдете что-то для себя полезное.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
ErWIN пользуетесь ли вы?

Zorkus @Zorkus

Мы используем PL/SQL Developer / TOAD / Oracle SQL Developer.

Проектирование схемы БД — это скорее умственный и архитектурный процесс, чем девелоперкий. Так же как код писать в блокноте неудобно (большинству), а удобно в IDE, а вот архитектуру придумывать без спец инструментов для работы с UML отлично можно — точно так же и SQL запросы писать удобно в тех инструментах, которые я выше привел — а схему можно и без спец. тулов придумывать.

В том числе сложные схемы из десятков / сотен таблиц с денормализацией, партишинингом и прочим.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

rPman
- 2 ответа
- 0 вопросов
Мизам
- 1 ответ
- 1 вопрос
sketch_dude752
- 0 ответов
- 1 вопрос
Денис Бирюков
- 1 ответ
- 0 вопросов
Kabron287
- 1 ответ
- 0 вопросов
Алексей
- 1 ответ
- 0 вопросов