Задать вопрос

mayton2019

Bigdata Engineer

1382

вклад
26

вопросов
2788

ответов
19%

решений

Комментарии

Как открыть программу на биос?

mayton2019 @mayton2019

Ты подойди к преподу и спроси как "оно" должно выглядеть.

Вывести Hello World на ассемблере - не очень сложно. Но все эти дополнения по поводу bios - могут усложнить
задачу на 1000%.

Тебе-же это не надо? Зачем жизнь усложнять?

Написано более трёх лет назад
Какая база знаний подходит для небольшой группы системных администраторов?

mayton2019 @mayton2019

Антон, лет 5 назад я создавал акк. Там есть пробный период типа 30 дней. За этот период можно понять нужен ли вам конфлуенс или нет. А дальше надо что-то платить.

Написано более трёх лет назад
Как написать это на паскале с ассемблерной вставкой?

mayton2019 @mayton2019

luxurypluxury, я погуглил. Что-то не нахожу хороших примеров. Мой опыт - релевантен к старому MS-DOS Turbo-Pascal. Какой сейчас в моде - я ХЗ.

Какой у тебя? Free-Pacsal? Gnu-Pascal?

Написано более трёх лет назад
Как оптимизировать большое количество регулярных выражений?

mayton2019 @mayton2019

DeadAndDieFox, ну если это - решение то отпишите его в ответы. Поставлю плюсик.

Написано более трёх лет назад
Как оптимизировать большое количество регулярных выражений?

mayton2019 @mayton2019

А покажи фрагмент текста. Может там как-то по другому можно сделать.

Написано более трёх лет назад
Хочу разобраться в коде java, не понимаю как работают несколько строк. Объясните как работают эти строки?

mayton2019 @mayton2019 Куратор тега Java

Dmitry Roo, тогда это очень плохой пример для обучения мультипоточности.

Написано более трёх лет назад
Не могу сделать аналог вывода простых чисел. В чем проблема?

mayton2019 @mayton2019

Да ты гонишь так форматировать сорцы. Неудивительно что запутался. Посмотри примеры правильного формата JS.

И не пиши так много лирики. Никому это не надо. Пришел задать вопрос - так задай только вопрос.

Написано более трёх лет назад
Как написать это на паскале с ассемблерной вставкой?

mayton2019 @mayton2019

Тут ... с хитростью подойти надо.

Тебе размер этой вставке не сообщали? Значит может быть любая. Напиши на паскале эту формулу как есть. И приаттачь сюда. И дальше уже на ассемблере мы придумаем что приклеить сбоку.

Написано более трёх лет назад
Хочу разобраться в коде java, не понимаю как работают несколько строк. Объясните как работают эти строки?
mayton2019 @mayton2019 Куратор тега Java
У меня есть замечание к этой последней строке.

Thread.sleep(2000); isStopped = true; Thread.sleep(1000); }

Кто может объяснить как число 1000 было расчитано?

Написано более трёх лет назад
Какой стек технологий лучше выбрать для разработки чата?

mayton2019 @mayton2019

Daniel~, давайте не будем судить автора за короткую память. О себе я такое сказать могу. Да. Забываю иногда.

Написано более трёх лет назад
Какой стек технологий лучше выбрать для разработки чата?

mayton2019 @mayton2019

Daniel, это - мотивация. Когда платишь - то точно закончишь обучение до конца. По себе знаю.

Написано более трёх лет назад
Что учитывать при линейной регрессии?

mayton2019 @mayton2019

Cipo, я себе это так вижу. Есть цена дома и цена с учотом налогов. Это - одно и то-же. Корреляция будет равна примерно единичке. Зачем нам брать во внимание эти две абсолютно связные характеристики. Никакой новой информации в модель эта цена с налогами не превносит. И ее можно выкинуть.

Насчет количества комнат - я-бы оставил.

Написано более трёх лет назад
Существует ли быстрый алгоритм поиска общих подстрок во множестве больших строк?

mayton2019 @mayton2019

GaalSpear, странная методика тестирования. Мне кажется - достаточно дорогая в реализации. Можно было как-то больше гипотез вызвинуть об искомом шаблоне. Иначе получим транс-вычислительную задачу.

Вобщем по поиску строк из теории я помню КМП и Боуер-Мур. Ввиду того что у нас нет никаких шаблонов - практически невозможно построить эффективный индекс.

Как можно оптимизировать по скорости? Я думаю в вашем случае - только экстенсивно. Наращивая количество узлов в вашем кластере. Сколько у вас? 12 executors. Вот разделите ваш датасет по хешу на 12 partitions. И пускай каждый исполнитель работает над своим объемом. Не забывайте про fork-join. Освободившиеся исполнители обязаны взять часть работы у других которые еще работают. Потом в конце их результаты надо свести в общий итог.

Что можно поисследовать. Можно построить гистограмму "тригамм". И если какие-то триграммы будут иметь больше количество попаданий - то надо идти за ними в строку и делать соотв. поиск вправо и влево добиваясь макимасльного соотвествия. Учитывая длины строк (по 150Г) возможно я не прав и триграмм будет мало. Берите "квадро-граммы", "квинто-граммы" и так далее до достижения более яркого проявления подстрок-дублей.

Написано более трёх лет назад
Что учитывать при линейной регрессии?

mayton2019 @mayton2019

Почему один столбец?

Написано более трёх лет назад
Нужна ли математика в Data science?

mayton2019 @mayton2019

Математика может понадобиться чтобы объяснить заказчику почему на данном датасете какая-то гипотеза не сработала.

Также нужно уметь видеть какие-то признаки (выбросы) которые говорят о том что данные - грязные и не годятся для обучения. Строгих критериев тут мало и надо разбираться глубоко в мат-статистике чтобы озвучивать например такие заключения.

Написано более трёх лет назад
Существует ли быстрый алгоритм поиска общих подстрок во множестве больших строк?

mayton2019 @mayton2019

Что-то с биологией или генетикой?

Написано более трёх лет назад
Какая максимальная скорость LAN портов у роутера при одновременном подключении к ним устройств?

mayton2019 @mayton2019

Я-бы усугубил вопрос. Какая скорость копирования файла по TCP будет между двумя
компами соединенными напрямую кросс-овер линком?

При условии что порты гигабитные.

Написано более трёх лет назад
Какой api использовать для подсчёта количества предметов на изображении?

mayton2019 @mayton2019

freeExec, ему вроде как надо подсчет количества. Возможно эта постановка более простая чем классификация.

Написано более трёх лет назад
Как можно реализовать алгоритм замены подстроки в строке?

mayton2019 @mayton2019

Не знаю как реализован в шарпе string.Replace(...) но скорее всего это алгоритм из двух частей.
Первое - это собственно поиск строки. И второе - это генерация новой строки на основе замен старой.
Из алгоритмов поиска я помню 2 штуки. Кнута-Морриса-Пратта и Боуера-Мура. Вот можно в эту сторону
смотреть.

Я думаю что string.Replace(...) реализует вполне себе хороший алгоритм. И если автор хочет делать замены
в гигабайтных строках то стоит наверное глубже изучить предметную область. На что делаем упор? На очень
длинные строки? Будет ли вследствие замен строка сильно увеличена в размере? Какой аллоцировать объем
для билдера? (приблизительо). Будет-ли string.replace работать на регулярной основе.

Может имеет смысл строку индексировать? Но опять-же это можно обсуждать только зная данные.

Вобщем подытоживая. Знайте ваши данные.

Написано более трёх лет назад
Найти в строке два одинаковых фрагмента?

mayton2019 @mayton2019

Я предлагаю искать в задаче не 2 фрагмента а ВСЕ фрагменты.

Написано более трёх лет назад

Самые активные сегодня

whattttov
- 5 ответов
- 0 вопросов
Ash Arutam
- 3 ответа
- 0 вопросов
#
- 3 ответа
- 0 вопросов
Сережа Молодец
- 1 ответ
- 1 вопрос
Ded20ded
- 0 ответов
- 2 вопроса
MarvinD
- 1 ответ
- 1 вопрос