Ответы пользователя mayton2019 — Хабр Q&A

Задать вопрос

Ответы

Как сделать дизайн (GUI) на C++?

mayton2019 @mayton2019
Bigdata Engineer

Вопрос звучит неправильно. Сам по себе С++ не имеет никаких встроенных в себя технологий для отрисовки графики. Это уже - задача библиотек которые будут зависеть от ОС или оконного менеджера.

И здесь Qt, Gnome, KDE, WTL просто производные от ОС.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Используемые технологии в создании игр?

mayton2019 @mayton2019
Bigdata Engineer

Технология - обычная. Может быть Unity. Может быть WebGL или OpenGL если - Windows приложение или игровая консоль.

Но в этой графике есть особенность. Она - изометрическая. Тоесть снята камерой отодвинутой на бесконечность.
С углом поля зрения в 0 градусов. Есть еще другие особенности типа 30 градусные углы между горизонтом
что дает возможность видеть прямоугольные объекты (дороги и стены домов) под фиксированными пропорциями
типа 1:2. Синус 30 градусов - удобен для расчетов.

Это очень красиво для пиксельной графики. Легко рисовать. И можно комбинировать 3D и пиксельную (растровую) графику два в одном. Так например делали в StarCraft старых версий.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как найти дубли в массивах postgres?

mayton2019 @mayton2019
Bigdata Engineer

Реляционная алгебра практически не умеет оперировать горизонтальными коллекциями. Такова она есть. И SQL создавался для других дел.

Самое правильное что можно сделать - создать временную табличку. Слить туда твои массивы с разворотом в 90 градусов и выполнить простейший (! реально простейший!) запрос с группировкой.

Это решение будет идеологически правильней, чем нагружать SQL не-свойственными ему задачами.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какие способы разгрузить БД на django?

mayton2019 @mayton2019
Bigdata Engineer

Делаешь две БД. И пишешь в одну все записи удовлетворяющие HASHCODE(primaryKeys, 2) == 0
а во вторую БД HASHCODE(primaryKeys, 2) == 1. При запросах соотв. делаешь запрос в две БД и объединяешь результат.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какая приоритетная очередь быстрее?

mayton2019 @mayton2019
Bigdata Engineer

Господи как все сложно. Берешь и делаешь столько очередей - сколько надо приоритетов. И все.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как преобразовать любой файл в картинку png?

mayton2019 @mayton2019
Bigdata Engineer

Автор пытается делать стеганографию. Тоесть в картинке скрывать информацию. Здесь выбор PNG полезен тем что инфа лежит плотно и в случае "гладкого" характера информации сжимается. Наподобие архиватора.

SVG - не подходит т.к. векторный и расточительный.
JPG - тоже не подходит т.к. повреждает информацию. Ее потом нельзя будет извлечь из файла без потерь.

По поводу дополнения файла до размера кратного длине строки (padding). Там не 00 не FF не подходит. Так как в оригинальном файле тоже могут быть эти константы и алгоритм даст сбой. Надо почитать как делается в криптографии. Там есть специальный workaround. Если его не реализовать правильно то при обратном декодировани картинки в файл мы можем получить ложное удлиннение файла на размер хвостика последней строки пикселов. Насколько это большой дэмедж для исходного файла - ХЗ. Но лучше конечно его не нелать чтоб обратное декодирование было надёжным с точки зрения длины файла.

Ответ написан более трёх лет назад

6 комментариев

6 комментариев
Какой тип баз данных самый быстрый?

mayton2019 @mayton2019
Bigdata Engineer

Самым быстрым являются хешмапы в памяти приложения. Но вопрос на самом деле более сложный. Как только нам нужно делать join 2-3 таблиц тогда - работает сложная квантовая механика оптимизатора и вариантов быстроты становится целая матрица.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как узнать запаролен ли rar-файл?

mayton2019 @mayton2019 Куратор тега Java
Bigdata Engineer

rar имеет консольный тул. Его можно вызвать как то так
$ rar -l <namefile>
И проанализировать листинг. Там скорее всего напротив каждого шифрованного файла будет какая-то пометка или символ.

Автору - неприлично спрашивать такой вопрос совсем не подготовившись.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Почему не работает 'Быстрая сортировка'?

mayton2019 @mayton2019
Bigdata Engineer

Вызывать ее надо по другому. Создать массив и указать его как аргумент в quicksort(..)

Ответ написан более трёх лет назад

4 комментария

4 комментария
Правильно ли я спроектировал таблицы в бд?

mayton2019 @mayton2019
Bigdata Engineer

На практике таблицы со связями 1:1 никто не создает. Есть конечно исключительные случаи. Они связаны с обходом ограничений использования BLOB полей и прочего но это точно не ваш случай.

Можете смело соединять две таблички в одну и все будет прекрасно. Если вы не ошиблись с нормализацией.

Ответ написан более трёх лет назад

4 комментария

4 комментария
Чем обрабатывать естественую речь?

mayton2019 @mayton2019
Bigdata Engineer

Если речь идёт о русском языке - то читать про стемминг и лемматизацию.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как быстро сортировать в большой таблице по часто изменяемому полю?

mayton2019 @mayton2019
Bigdata Engineer

Зачем вам сортировать все 50 миллионов? Задача топа - чтобы взять например top 10.
Сделайте себе временную табличку и по триггеру сливайте в нее по правилу паретто или больше 95%
где баланс больше X. И там будет не 50 миллионов а 100 тыс.

И эта мелкая табличка легко отсортируется и опубликуется.

Ответ написан более трёх лет назад

4 комментария

4 комментария
Как грамотно удалять дублирующиеся строки/связи в базе данных?

mayton2019 @mayton2019
Bigdata Engineer

Зависит от ценности этой информации. Если эту схему рассматривать как историю - то ничего удалять не надо. Просто перепишите ваши отчоты чтоб они делали GROUP BY и DISTINCT и просто игнорировали дубли.

Если вы - владелец этой системы и данных - то вы вправе поставить любой констрейнт уникальности так чтобы дубль в принципе невозможно было всунуть. Но это вопрос не технический а организационный.

Удалять - советчиков много. Но все они - безотвественные и если вам не стоит слушать советов по чистке данных именно здесь в тостере то вы рискуете какраз потерять нужные данные.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как найти самый длинный префикс среди строк и сгруппировать по нему?
mayton2019 @mayton2019
Bigdata Engineer
Как по мне - задача поставлена неверно. Или не хватает доп-условий. Например я считаю что общий префикс должен быть такой.

+-----------+------------------------+-------+ | parent_id | path | count | +-----------+------------------------+-------+ | 7 | val1 | 6 | +-----------+------------------------+-------+

Ответ написан более трёх лет назад

2 комментария
2 комментария
Как определить на ранних стадиях что в PostgreSQL что-то начало сбоить?

mayton2019 @mayton2019
Bigdata Engineer

Если носитель информации - ненадежный - то к нему добавляют дополнительные коды типа Хэмминга которые восстанавливают поврежденные биты после сбоя. На 99% нормальных носителей это реализовано аппаратно. Если твоя флешка сбоит или не очень надежна то желательно купить новую. Если ты всё таки хочешь наковырять золота в навозе - посмотри в сторону утилиты par2 manpages.org/par2 она на десяток процентов увеличит размер твоих бэкапов но будет гарантировать фиксацию нескольких бит если такое будет. Она работает поверх обычной файловой системы и ее коды контроля будут просто дополнительными файлами рядышком.

А проверить восстановистя ли бэкап в принципе - невозможно. Как в той философской мысли - нельзя узнать какой пудинг пока ты его не съел. Поэтому и гарантировать целосность бэкапа на логическом уровне можно только проведя симуляцию его полного восстановления в БД.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Что быстрее LSAPI или FastCGI (Nginx + PHP-FPM)?

mayton2019 @mayton2019
Bigdata Engineer

Это архитектурный вопрос. Я имею в виду что выбор сервера приложений - это матрица стратегий. И ее нельзя сводить к простому вопросу - что быстрее. Это как дети обычно спрашивают - что лучше : грузовой трак или гоночный болид. Профанация выходит.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Gradle. Почему сборка на windows намного медленнее?

mayton2019 @mayton2019 Куратор тега Java
Bigdata Engineer

Linux быстрее создает процессы (fork()). Это особенно видно при работе с консольными тулзами. И с теми-же тулзами которые портированы под Windows к примеру. Это одна причина. И вторая - это файловая система. Linux/Ext4 обычно менее затратная в обслуживании огромного количества мелких операций чем Windows/NTFS. Например проверка атрибутов безопасности в Linux - это проверка битовой маски. В Windows - чуть больше действий.

Ко всему конечно могут быть и другие различия в имплементации java под Windows которых я не знаю.

Ответ написан более трёх лет назад

4 комментария

4 комментария
Где найти параллельный алгоритм нахождения максимального паросочетания в графе?

mayton2019 @mayton2019
Bigdata Engineer

Интересный вопрос. Кмк форд-фалкерсон либо плохо параллелится. Либо после параллелизма просядет в блокировках вершин и ребер, что сделает его худшим по эффективности чем непараллельный.

Тут надо подумать.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Часто задумываюсь о смене стэка программирования, это плохо?

mayton2019 @mayton2019
Bigdata Engineer

Изучение Go, Rust я поддерживаю. Это развитие. Это хорошо.

Во фриланс особо не рвись. Я за свою жизнь не видел качественных продуктов в основе которых стоял бы фриланс.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как программирование связано с информатикой?

mayton2019 @mayton2019
Bigdata Engineer

Информатика и вычислительная техника и ЭВМ это немного архаичное название современных it наук таких как собственно программирование, FP, GA, NN, MV.

Старые слова можно много где встретить в старых книгах. У того же Дональда Кнута есть отсылки к алгоритмам сортировки на магнитных лентах.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

Вячеслав Васильев
- 2 ответа
- 0 вопросов
Alevtina38
- 1 ответ
- 0 вопросов
Elworld
- 1 ответ
- 0 вопросов
Dyikot
- 0 ответов
- 1 вопрос
Иван Кулаков
- 0 ответов
- 1 вопрос
Сергей Пуговкин
- 0 ответов
- 1 вопрос