Задать вопрос
  • Почему boolean использует больше памяти чем byte?

    mayton2019
    @mayton2019
    Bigdata Engineer
    С точки зрения ассемблера - удобнее делать операции над целым числом (DWORD) 32bit. Он - же int.
    В масштабах современной памяти - безразлично выделять 1 байт или 4 байта. Все равно
    другие структуры больше захватят тысячекратно. А простота компилируемого кода - здесь важнее.

    Вот поэтому компилляторы и собирают boolean в int. А язык С++ позволяет проводить аналогии
    между int и boolean. В зависимости от контекста число может быть как числом так и логической
    величиной. (Тесная связь с ассемблером да).

    А если речь допустим идет о массиве boolean - тогда смысл в экономии есть. В Java например
    такой массив действительно будет использовать биты внутри байта.

    В базах данных например (Oracle) вообще нет булевого типа с точки зрения хранения. Там предлагают
    символьный тип 'Y' или 'N'. Это связано с дисковыми структурами хранения данных в datarow.

    Поэтому sizeof(булевый тип) будет всегда парадоксом в разных системах программирования и языках.
    Как компиллятору удобнее так и соберет.
    Ответ написан
    Комментировать
  • Как расшифровать внешний диск?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Я не понимаю твоей проблемы. Ты пишешь

    Был у меня диск на ноуте, полностью шифрован veraCrypt, Именно шифрованием диска. Вводил пароль при загрузке. Все хорошо но пришло время апгрейда и диск был поменян.


    Зачем тебе нужен старый диск если ты уже переехал на новое железо? У тебя уже новые MyDocuments. Отформатируй его к чорту. И зашифруй заново если хочешь.
    Ответ написан
  • Калькулятор C++ как убрать 1.33333e+06 подобные результаты вычисления?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Предположительно ты работаешь с типами данных float или double.
    Эти типы не имеют однозначного отображения в десятичную
    систему. Такова их природа.
    Ответ написан
    Комментировать
  • Можно ли идентифицировать человека по измененному голосу?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Ну если человек по жизни - шепелявый то какие питчи не накладывай то все равно будет шепелявый.
    А вообще задачу надо смотреть более широко. Не только голос но и согласные буквы. Слова-паразиты.
    Паузы. Кашель. Шмыгание носом. Просто грамотность речи. Все это маркеры которые просто
    приближают метрику к нужному человеку. Опять-же эти маркеры нужно было собирать заранее для всей выборки людей.

    Вообще во всех задачах распознавания нужно брать как можно более широкий вектор параметров.
    Ответ написан
    Комментировать
  • Как лучше сделать архитектуру сервиса с Cassandra?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Объем данных - терабайт в день. 90 МБ/с траффика в пике.
    Скорость ответа сервисов и мгновенная запись не важна, важно записать данные.


    Между первым и вторым сервисом можно поставить Kafka. Это позволит смягчить ситуацию частичной
    недоступности пишущего сервиса. Я здесь далее по топику предполагаю что Kafka и Cassandra - это облачные
    решения
    которые в приципе не падают. А если и падают то очень редко и по крайне жестким авариям датацентров.

    В этом случае в качестве точек сбоя можно просто рассматривать два ваших микросервиса.

    Еще вариант. Вообще убрать пишущий микро-сервис. Я не знаю как в кассандре. Но в bigdata есть огромное
    число т.н. коннекторов. Это что-то типа драйвера который позволяет писать стриминг в базы и наоборот.
    Например есть коннектор который пишет сразу из Kafka в таблицы Databricks. Скорее всего для кассандры
    тоже есть нечто подобное. Мне кажется с коннектором архитектурно получается проще.
    Ответ написан
    2 комментария
  • С чего начать практику администрирования без скучных книг?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Сколько тебе лет? Учишся? Работаешь?

    Протяни домашнюю сетку для игр. Сделай DNS/DHCP. Создай видео-архив чтоб все участники сети могли смотреть.
    Ответ написан
  • Как запустить Processing (Java) код при уже запущенной программе?

    mayton2019
    @mayton2019 Куратор тега Java
    Bigdata Engineer
    Есть несколько способов это сделать.

    Использовать встроенную в Java машину Nashorn которая по идее реализует JavaScript. Там такое можно сделать.

    Подключиться дебаггером к приложению запущенному в debug mode. Там по идее тоже можно выполнять какие-то команды на вычисление выражений и видеть результат.

    Но сама идея влезать в работающее приложение - не очень хорошая идея. С точки зрения безопасности и надежности. Возможно те вещи что ты хочешь могут быть закрыты через Logging или JMX или заранее протестировать все кейсы JUnit тестами в оффлайне. Сам факт того что ты хочешь чего-то в runtime говорит
    о нехватке тестового покрытия.

    Еще посмотри на jschell. Может пригодится.
    Ответ написан
  • Решить проблему This class should provide a default constructor (a public constructor with no arguments)?

    mayton2019
    @mayton2019 Куратор тега Java
    Bigdata Engineer
    Добавь такой конструктор.

    public AlarmService() {
            super();
     }
    Ответ написан
    Комментировать
  • Какой ноутбук выбрать для Linux?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Я покупал HP-15" с установленным Windows-10 лет 7 назад. Там был диск на 512G. После того как я снес Windows с удивлением обнаружил ... еще один раздел на 512 который был типа служебным. Для саппорта. Переразбил для себя. Вот теперь у меня 1 Тб и Ubuntu. Profit.
    Ответ написан
    Комментировать
  • Как определить размеры посылки на картинке?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Можно попросить пользователя положить на угол посылки спичечный коробок. И далее - как-то по пропорциям.
    Ответ написан
  • Как убедиться что атомарные операции будут выполнены точно правильно?

    mayton2019
    @mayton2019
    Bigdata Engineer
    В данном исходнике нет проблемы атомиков. Но здесь есть проблема отсутсвия синхронизации потоков а и b.
    Нужно наладить синхронизацию и дальше атомики станут приносить ощутимую пользу.
    Ответ написан
    Комментировать
  • Как сделан обход NAT в i2p?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Если гора не ходит к магомету...

    Скорее всего клиентский софт i2p сам инициирует соединение.
    Ответ написан
  • Как установить максимальное количество строк в таблице?

    mayton2019
    @mayton2019
    Bigdata Engineer
    По постановке это похоже на буфер очереди сообщений. Вам нет смысла синхронно удалять хвостовые строки.с
    Пускай это делает отдельный джоб раз в сутки например. Вам - же не принципиально если пол дня табличка будет в 1001 строку?

    А консистентный снимок top 1000 строк вы всегда можете получить запросом с сортировкой и лимитом. И это будет решение в духе баз данных а не Java-буферов с блокировками.
    Ответ написан
  • Возможно ли обучение нейросети на обработанных статическим алгоритмом изображения?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Во первых непонятно что такое статический алгоритм? Ну я знаю статические переменные класса например. Алгоритм... это что-то новое.

    Во вторых ты являешся постановщиком задачи. И у тебя на выходе есть критерий качества. Не знаю. Ну например confusion matrix. И производные. Precision. Recall e.t.c. Или какие-то коэффициенты удачного распознавания. Вот сделай два эксперимента - и будет самый исчерпывающе-правильный ответ. И безо всяких советов отсюда.

    В третьих. Я не знаю как в графике. А в машинном обучении для big-data всегда есть фаза предварительной обработки данных человеком. Data Preparation. И там прямо протокол: фильтрация выбросов, заполнение gaps, нормализация, фиксация неконсистентных данных. Вот. В случае обучения с учителем - теггирование данных.
    Вобщем идея такая что нельзя мусор толкать на вход нейросети. Вот. И глубину твоего участия в фильтрации ты сам определяешь.
    Ответ написан
    Комментировать
  • Ошибка пи запуске программы на с++?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Мне кажется что проблема в том что это One-Drive. Попробуй скопировать содержимое в другое место.
    Ответ написан
    1 комментарий
  • Как вычислить Info Hash torrent файла?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Утилита transmission-show показывает содержимое torrent-файла.
    Ответ написан
    Комментировать
  • Куда расти дальше?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Я не специалист по C# поэтому по качеству кода не смогу ничего сказать. Но могу сказать по другой части.

    Проект создан в 2 коммита. Это обман. Так не бывает. Программисты не делают проект в 2 шага. Обычно
    идет некий итерационный процесс когда в течение дня. Либо в течение итерации разработки какой-то
    фичи делается бранч. И вмерживается в мастер. Или делается отдельный коммит в мастер с описаием что делалось.
    И тогда проект приобретает ИСТОРИЮ изменений. По истории видно как авторы работали. Что изменяли.

    У проекта нет документации. Надо описать что это для чего и так далее. Нет инструкции по сборке.
    Каждый разработчик должен иметь возможность собрать любой проект с гитхаба прочитав инструкцию.
    Сборка - это не программирование. Это отдельный скилл. Почитай что такое сборщики. И это не среда
    разработки. Это отдельный продукт. Обычно в консоли работает. Чтоб на сервере собирать проекты
    в режиме автономного процесса без участия человека.

    У проекта нет модульных тестов. Это говорит о том что нет возможности бытро проверить не сломалась
    ли логика после изменений. Тесты надо добавить.

    Нет внешних метрик здоровья проекта. Непонятно в каком состоянии щас он находится. Компилируется ли вообще? Посмотри как другие проекты в гитхабе выглядят.

    В исходники нужно вставить текст лицензии. Подойдет любая из опен-сорцных.
    Ответ написан
    Комментировать
  • Дистрибутив для работы с сетями и кибербезом?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Обычно свежесть обратно пропорциональна количеству пользовательского тестирования. Поэтому в некоторых консервативных отраслях как кибер-без я-бы вообще не гнался за свежестью как за целью.

    Воообще... Что вы ожидаете из свежатинки? Новый свежий сетевой протокол? Или новый алгоритм шифрования?

    Вот Fedora бравируют скоростью своих обновлений а RedHat плететься в хвосте. Но когда речь идет о безопасности - обычно берут RedHat.
    Ответ написан
    1 комментарий
  • Какой пет проект можно реализовать на Java?

    mayton2019
    @mayton2019 Куратор тега Java
    Bigdata Engineer
    Я делал себе такие проекты типа - индексирование текстовых фалов в /My Documents. Или раскладывание фоток по датам фотоснимков на основе exif тегов.

    Выбор пет проекта несет в себе тяжкое бремя само-постановки и само-организации. Зная что твой проект никто не проверит и качество его реализации никого не интересует я-бы предложил ничего не делать если оно тебе не надо практически. А если есть практическая задача - то делай ее для себя и сам принимай ее.

    Почему я давлю на результат и на приёмку? Потому что 99% таких проектов успешно начинаются и потом забрасываются потому что человек выгорает еще на старте. Чтоб не выгорать - нужно ТЗ. Нужел девелопмент план. И нужен хоть какой-то человек который взглянет на результат.

    Если этого нет - пет-проект уйдет на свалку истории. Как впрочем и большая часть контента github. Это унылые копи-пасты, туториалы и незаконченные произведения.
    Ответ написан
    1 комментарий
  • В чем причина неэффективного обучения DQN-агента посредством python?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Я не смотрел код. Но могу предположить следующее. Возможно сеть пытается выучить наизусть все
    пути ведущие к победе. Их порядка 8 тысяч.

    Нужно ввести в сеть искусственные подсказки. Как в шахматах пару функций оценки позиции которые
    говорят хорошая позиция или плохая получается на данном ходе. Например 2 крестика в ряд - это плюс один
    к хорошей позиции. С учетом возможности поставить крестик в свободное место.

    Я думаю даже в альфа-зеро такие вводили. Например учет камней.
    Ответ написан
    4 комментария