Задать вопрос
  • В рдп и рдс работают только сотрудники организации или доступ может быть выдан поставщикам услуг, аутсорсингу?

    @rPman
    rdp это буквально привести человека в офис и посадить за компьютер, человек, подключенный по rdp (и любому другому протоколу удаленного доступа к десктопу) будет иметь доступ к приложениям и локальной сети.

    Когда говорят корпоративные сети, подразумевают что 'там все настроено', есть отдел безопасности и ведется мониторинг утечки данных (если это имеет смысл), возможно в этой конфигурации есть роли удаленного оператора, которому и доступ разрешен на управление и возможности ограничены, чтобы лишнего не напортачил.

    Рядовой пользователь настроить подобный уровень безопасности настроить не сможет. Выдавая доступ 'поставщикам услуг' что бы это не значило, держите это в голове.

    p.s. когда мне нужно было что то показать на своей машине другому человеку, я обычно настраивал песочницу с помощью виртуальной машины (это заметно проще сделать, не пуская машину в сеть) и давал удаленный доступ к ней.
    Ответ написан
    2 комментария
  • Как конвертировать чат в вопросы и ответы?

    @rPman
    Сядь и подробно опиши, как ты будешь описывать эту работу человеку, причем максимально далекому от темы, не очень сообразительному но внезапно эрудированному (считай что написанное этот человек будет понимать сразу, с учетом опечаток, сленга и т.п., этому обучать не придется).

    Разработай правила, возможно что то реализуется без ИИ, простыми алгоритмами, по которому ты сможешь выявлять цепочки рассуждений, когда один участник чата общается с другим. Не каждый раз для ответа пользуются кнопкой - ответ, но почти наверняка ответ будет написан сразу после исходного. Эти цепочки обрабатывай отдельно, не смешивая. Кстати можно разработать набор вопросов для ИИ для выявления этих цепочек.

    Разработай чеклист, серию вопросов, на которые этот гипотетический человек должен ответить, обрабатывая каждое следующее сообщение, лучше брать срез из нескольких выше+ниже по времени или количеству, причем этот срез нужно делать для каждого сообщения в чате. Это может быть выявление темы беседы, или буквально - 'какой вопрос обсуждают участники чата'. Это и будет то что ты должен отправлять в промпт к языковым моделям. Экспериментируй.

    Постарайся использовать языковые модели с большим контекстом, в них можно собранную информацию от других языковых моделей (более простых и дешевых) собирать в виде большого промпта, в которой объединена не только информация о текущей части беседы но и собранная информация о списке к примеру искомых 'популярных вопросов' чтобы сеть могла не выдумывать каждый раз новый, а брать уже ранее созданный, дополняя ответ.
    Ответ написан
    Комментировать
  • Как написать нейросеть способную распознать улицы на которых ведутся работы через NLP?

    @rPman
    У тебя ошибка в терминах - работой с текстами занимаются языковые модели, а 'распознавание текста' это работа с изображением или звуком с целью преобразования его в текст.

    С нуля этим заниматься будет очень сложно, нужны большие датасеты, причем большие - это порядка сотен миллионов или миллиардов токенов, причем размеры моделей могут быть не слишком большими. До эпохи трансформеров алгоритмы работы с текстом 'не понимали смысла'.

    Лучшее что сейчас есть готовое это LLM на основе трансформера (GPT). Предобученных моделей огромное количество, из открытых и более менее рабочих - opt (не доступна нормальная 175b и кажется только английский) и bloomz (мультиязыковая, смотри таблицу разных размеров) но они значительно слабее chatgpt35 и никто не приблизился к chatgpt4. По ссылкам подробное описание, там есть информация как использовать примеры. К сожалению работа с языковыми моделями требует очень дорогое оборудование, а на процессоре они работают в сотни раз медленнее (код так написан, он оптимизирован для gpu).

    Что значит слабее - это значит хоть знаний в этим модели влито огромное количество, но воспользоваться ими можно будет качественно только после fine tuning - дообучения на своих данных (примеры вопрос - ответ например, но не обязательно), главное тут то что количество данных для этого может быть очень маленьким (тысячи или даже сотни примеров). Есть алгоритмы peft - которые вместо тюнинга самой модели, работают с весами токенов запроса, это не вносит новых знаний в модель но увеличивает качество ответа (этим пользуются во время проведения бенчмарков сравнения моделей, например prompt tuning), я слышал что для этих алгоритмов количество примеров может быть еще меньше - десятки.

    p.s. llama одна из лучших 'доступных' моделей (мультиязычная от 30b) но использование ее без разрешения facebook нелегально, и ее можно даже не дообучать (но рекомендуется добавлять в запрос хотя бы один-два примера, сколько позволит мизерный размер контекста в 2к токенов), с ее качеством можно буквально анализировать смысл текста простыми вопросами.

    llama.cpp - код по запуску (не обучению) gpt моделей, не только llama, на процессоре (есть слабая поддержка gpu) оптимизированно на столько хорошо, что медленее дорогих сборок с gpu в десяток раз (а десктопные могут работать сравнимо с топовыми cpu), например llama30b обрабатывает 250мс на токен запроса и 500мс на генерацию (65b - 1100мс на генерацию).

    Из недостатков - слабая логика и плохая детекция конца ответа (может уйти в генерацию мусорного текста), требует определять логику завершения генерации 'снаружи', например часто достаточно выставить финишным текстом ### (управляющие символы, часто встречаются в галюцинациях и могут использоваться для оформления запроса)
    Ответ написан
    1 комментарий
  • Как доказать Google, что мой аккаунт разработчика не связан с другим?

    @rPman
    Что то мне говорит что вот тут ты ответ не получишь, если вопрос хороших денег, лучше идти в суд (само собой не российский), и искать адвоката, который уже работал по таким делам, но понимая что 'наш мир сломан', я не верю в успех этого дела (именно такие события показывают на сколько мир в жопе из-за того что компании типа гугл уже стали новым государством и правительством и становятся важнейшей частью жизни).

    Закон больших чисел говорит что гугл уже набрал достаточно опыта в таких делах и заведомо выйдет победителем (у него больше денег, больше информации, больше заранее подложенных соломинок в лиц. соглашении).

    Сейчас ты общаешься с роботом, да и с человеком ты будешь общаться либо нижнего уровня саппорта (не слишком отличающегося от робота по возможностям) либо с адвокатами, если дело пойдет в суд, и там у обывателя мало шансов.
    Ответ написан
    1 комментарий
  • Почему процессоры gpu не любят разветвлений в программе?

    @rPman
    не совсем верно это помещать в ответ, я не уверен.

    Если я верно понимаю, код в GPU общий для всех ядер (там правда разные типы, не только вычислительные, и у каждого свой язык и правила, но мы говорим про конкретно вычисления), это значит когда ты запускаешь kernel, инструкции выполняются одновременно на всех ядрах синхронно,.. прыжок по условию это пропуск какой то секции инструкций, это значит ядра, у которых выбран пропуск инструкций будут ждать когда другие ядра, для которых нужно пройти эту секцию, завершат вычисления (гуглить thread divergence).

    Но это было актуально на заре появления gpgpu, возможно сейчас все сложнее, внутри чипа ядра распределены по нескольким блокам, сами блоки как то разделяют память, есть своя регистровая и кеш память.

    Кстати на практике большее значение имеет работа именно с оперативной памятью, там она блоками разбита, как именно блоки общаются между собой вопрос (единая шина или матричная структура это хз) но в любом случае если код ждет память, его будут ждать все (соответственно все в пределах секции)... компилятор почти наверняка кеширует данные из глобальной памяти в разделяемую и регистровую (для блоков и соответственно ядер), т.е. все будет зависеть еще и от работы оптимизатора.
    Ответ написан
    4 комментария
  • Табличная бд, вопрос: как читать данные?

    @rPman
    Чтобы ответить на вопрос 'как хранить?', нужно задаться вопросом 'как будешь искать и читать?'.

    Типовой вопрос - нужен ли порядок в строках и колонках? не спроста ведь ты колонки и строки назвал цифрами. Беда в том что sql не очень эффективно работает с упорядоченными данными (там O(n) = n*log(n) трудоемкости с оговорками) и для того чтобы строки упорядочить, нужно будет либо хранить дополнительное поле для сортировки (иногда хватает pk id с autoincrement но до тех пор пока записи не удаляешь)

    Так же есть вопрос на многопользовательский (точнее одновременный в несколько сессий) доступ к данным на запись (или запись + чтение). Наличие такого требование значительно поднимает сложность задачи, sql базы для этого предлагают транзакции и блокировки.

    Следующий вопрос, нужно ли искать/сортировать по значению. И отрицательный ответ на этот и предыдущий вопрос могут вообще дать ответ - не пользуйся sql.

    Универсальный способ хранения матриц переменной размерности это таблица, где каждая запись - одно значение ячейки, с полями (int x,int y,value) где x,y - номер колонки и строки соответственно. Этот же метод самый неэффективный, особенно когда таблицы большие.

    Таблицы маленького фиксированного размера (колонок), при отсутствии необходимости тосовать порядок колонок в запросе, можно хранить как есть, по одной строке матрицы в строке базы данных, в таблицах (y,x1,x2,x3,x4,x...) где x1,x2,x3 это значение колонок с номерами 1,2,3 соответственно а y - номер строки
    Ответ написан
    Комментировать
  • Проблема с выделением ресурсов виртуалке, как исправить?

    @rPman
    В настройках виртуальной машины смени тип контроллера диска и сетевой карты на virtio-iscsi и для сетевой карты virtio-net, это устройства, работающие без симуляции настоящего, работающие через драйвера и на максимальной скорости

    Для гостя windows почему то штатные guest-additions не устанавливают драйвера для этих устройств, по крайней мере последние версии. Нужно искать в сторонних местах (по ссылке выше например)
    Ответ написан
  • Потребление ресурса записи ssd и как потребление памяти уменьшить?

    @rPman
    При просмотре фильмов и тем более стримов на диск ничего не записывается, за некоторыми исключениями (их надо исследовать).

    Про исключение - если ты смотришь фильм из интернета в браузере (не youtube), который там размещен в виде .m3u8 списка мелких кусков (это видно в инспекторе, на закладке network), те в свою очередь - статичные файлы, то, если на сервере не прописано для них запрет на кеширование, то браузер каждый такой кусочек видео будет кешировать на диске, а значит тратиться ресурс того ssd, на котором размещен профиль браузера, по умолчанию системный диск.

    Есть еще файл подкачки, тот файл про который ты говоришь 'карта памяти на диске', так вот он используется интенсивно только если оперативной памяти не хватает, и там без разницы что ты делаешь, будет много записей (в этом случае кстати можно разместить файл подкачки на 'виниле', но лучше само собой докупить оперативной памяти).

    Торенты так или иначе лучше писать на жесткий диск... за исключением ситуации, когда у тебя гигабитные скорости (жесткий диск работает в худшем на 10-15мб/с, может и медленнее если свободное пространство сильно фрагментировано но это решаемо).

    Многие роутеры, особенно с возможностью подключения диска, умеют запускать торент, так что да, ищи эту возможность там (иногда ее нужно доустановить). Как минимум роутер может расшарить подключенный диск, например по протоколу smb (можно подключить как диск в windows), соответственно в клиенте на компьютере можно так же настроить каталог для загрузки файлов на этот сетевой диск, но нужно понимать что даже гигабитная сеть в сумме даст 100мбайт/сек (а по smb даже меньше) а роутеры не очень производительны и скорости будут заметно ниже.
    Ответ написан
    Комментировать
  • Что более надежное VNC и RDP?

    @rPman
    VNC и RDP кардинально разные технологи, первая предназначена для трансляции консоли машины (буквально, то что подключено к монитору и клавиатуре с мышкой) а вторая - для множественных подключений к серверу, с симуляцией консоли (т.е. не настоящий монитор, клавиатура и мышка). В десктопных ревизиях windows rdp кастрирован и лимитирован только физической консолью.

    Второе различие качестве реализации, vnc (и всякие anydesk/teamviewer/steam remote/.., основанные фактически на том же) транслируют содержимое экрана без привязки к его обновлениям (с оговорками), когда как rdp в основе своей работает с фактическими обновлениями win32 gdi (правда там наплодили версий и последние серверные могут гораздо больше чем просто их трансляция), в результате на слабых линиях связи и не графических приложений (перерисовывающих весь экран постоянно) rdp может оказаться отзывчивее чем vnc... с другой стороны какой-нибудь steam remote при хорошей ширине канала и низким пингом даст будет эффективнее и менее лагучий для сложных приложений.

    Теперь по поводу надежности - очень важно, настраивать инфраструктуру максимально защищенной и отделенной от интернета какой-нибудь специализированной прослойкой, типа VPN или ssh (например в linux x2go из коробки работает с ssh), любой сервис, открытый в интернет без защиты - это +1 к уязвимости, еще одна вероятность появиться багу и дополнительное время на ожидание его закрытия.

    p.s. rdp в windows очень лакомный кусочек для хакеров, а зная как майкрософт лажает из года в год, ставить на то что это будет надежно я бы не рекомендовал.
    С другой стороны у vnc тьма реализаций (приложений клиент и сервер), и скорость исправления багов (и ответственность за это) в них значительно ниже чем у майкрософта.

    поэтому поставь vpn по надежнее
    Ответ написан
    1 комментарий
  • Разделение ответственности или производительность?

    @rPman
    Дублируй, это не недостаток, а прямое следствие оптимизации
    Ответ написан
    Комментировать
  • Какими из этих трех искробезопасных реле (преобразователь сигналов) можно закрывать и открывать задвижку?

    @rPman
    один из вариантов - реле внутри герметичного корпуса, да еще и газ какой-нибудь типа аргона (но это оверкил, дешевле полупроводниковый использовать)
    Ответ написан
    Комментировать
  • Как ввести логин в окно входа в Steam?

    @rPman
    Потому что твой xpath явно неверный (ты не указал весь код)
    <input type="text" class="newlogindialog_TextInput_2eKVn" value="">
    ...
    <input type="password" class="newlogindialog_TextInput_2eKVn" value="">

    Правильно - ищешь все input без фильтра и каждый проверяешь на подстроку в названии класса и значение type, еще можно искать по координатам, запрашивая у каждого getBoundingClientRect, пропуская заодно с нулевым размером
    Ответ написан
  • Возможно ли эмулировать данные о компьютере отдельно для определённой программы?

    @rPman
    процессор, в принципе железо, ОС, и так далее
    без использования виртуальных машин это будет невозможно, это и есть основное их назначение.

    еще такой софт называют гипервизор, и специалисты могут запилить специализированный (на одну маленькую функцию типа подмена id) очень маленький, влезающий к примеру в биос материнской платы (так пилят трояны, заражающие биос и ничем больше не вычищаемые кроме выпаивания микросхемы)
    Ответ написан
    Комментировать
  • Возможно ли получать сообщения из телеграм канала в другое приложение?

    @rPman
    Свое приложение, некоторые довольствуются сырыми http запросами api telegram.

    Нужно различать разные типы сущностей в телеграм:
    1. бот
    2. канал - это поток сообщений от имени аккаунта канала
    3. группа - это чат, в котором могут общаться другие участники (возможны выверты когда забанены все кроме админа)
    4... есть еще приватные чаты, субгруппы, чаты сообщений канала, группы разного уровня объема (они по разному мониторятся, точнее так было раньше, возможно сейчас все свели к одному)

    У тебя 2 подхода:
    1. официальный, у тебя должен быть бот, который ты добавляешь на группу (только туда и как админа) как участника и он мониторит сообщения пользователей
    2. неофициальный, используя библиотеки (их десятки) симулирующие работу полноценного клиента

    Самый гарантированно работающий - модифицировать официального клиента, исходники публикуются (правда так плохо что многие мейнтейнеры дистрибутивов отказались этим рулить). Почему это важно - как минимум прошлые несколько лет в telegram заметно менялся именно механизм работы с группами (особенно крупными, там есть разница) и разные сторонние библиотеки и клиенты не могли нормально работать с ними (т.е. приваты работают а группы с ошибками и проблемами получения уведомлений).

    Посмотри например python-telegram, примеры вполне понятные даже тем кто питон в первые в жизни видит

    p.s. ну на go еще есть, неожидал что есть активность в репозитории для php и т.п. ищи там по тегам telegram-api, mtproto-api или tglib
    Ответ написан
    Комментировать
  • Может ли слететь биос после переноса системы в другой корпус?

    @rPman
    отзывается только тогда, когда нету видеокарты
    значит проблема с высокой вероятностью а ней, чтобы в этом удостовериться, поставить другую, гарантировано рабочую.

    Есть ещё один кандидат на проверку - это блок питания.

    Лучший способ это проверить, отнести в ремонт на диагностику, стоит обычно это пару сотен рублей.
    Ответ написан
  • Как из любой точки мира передать сообщение на ESP32 или любую ардуинку без установления подключения?

    @rPman
    в чем заключается вопрос то? указанной информации не хватит для ответа.

    Либо ты устанавливаешь посредника между твоим устройством и интернетом, чтобы физически между ними было какое то подключение (например компьютер, к которому устройство подключается например по usb/com/lpt/ir), либо снабжаешь свое устройство модулем ethernet/wifi/мобильные сети и, в зависимости от выбранного стандарта, реализуешь в прошивке необходимый фунукционал.

    Первое очевидно дороже но у тебя огромный простор в выборе форматов коммуникации, так как компьютер мощнее, позволяет настроить защиту от ddos и есть большое количество готового кода, второе сложнее (и занимает заметное количество ресурсов) и ограничивает общение самыми простыми протоколами, даже просто http запрос реализовывать заметно сложно.

    p.s. напоминаю, что выпускать в интернет порты, обслуживаемые слабым оборудованием, не способным противостоять минимальным ddos, глупо.
    Ответ написан
    Комментировать
  • Что будет, если включить ScrollLock?

    @rPman
    win32 api DeviceIoControl IOCTL_KEYBOARD_SET_INDICATORS

    нашел тут

    p.s. майкрософт лет 10 назад сломало документацию, я точно помню когда смотрел в похожих ситуациях, там на странице была информация о методах где используется константа, примеры использования и т.п., а теперь без вспомогательной информации понять как этим пользоваться невозможно.
    Ответ написан
    5 комментариев
  • Собственное поле для ввода на чистом JavaScript?

    @rPman
    Первый же запрос в гугл выдал
    Очевидно свой input потребует закодировать огромное количество ситуаций, выделение в т.ч. по дабл- и трипл-клику, вставка через буфер, работу с правосторонними шрифтами и вообще мультиязычная поддержка это ад (невидимые символы, меняющие поведение)
    Ответ написан
    Комментировать
  • Почему не открываются программы?

    @rPman
    Если проблема возникает сразу после установки из официального репозитария, то это уже повод бить тревогу (что то с железом? но слишком специфическая ошибка)

    Наибольшая вероятность - вирус, причем написанный с ошибкой (не все вирусы обнаруживаются антивирусами).

    И еще момент, даже если 'ничего левого не качать', вирус/троян может проникать из локальной сети 'провайдера' при использовании слабых паролей на машине (типа admin/12345678) и отключенном фаерволе. Вирус может быть запущен просто с флешки или соседнего диска (на сколько я помню действие по умолчанию все еще запуск приложения, прописанного в autorun.inf)

    ну и самое главное, 'левое' у каждого это разное, нужно понять, после установки какого приложения происходит поломка файлов, и исключить его из установки в следующий раз, выявить это сложно но реально, делать все в виртуальной машине, создавая снапшот перед установкой каждого следующего приложения
    Ответ написан
    Комментировать
  • Как показывать рекламу только для тех кто заходит через Wifi?

    @rPman
    Что такое 'заходит через Wifi'? если я расшарил свое мобильное соединение по wifi, то все кто его используют уже должны смотреть рекламу?

    Без установки специализированного по на устройстве раздачи интернета по wifi, определить этот факт будет очень сложно (но есть хаки, если не использовать https, то можно просканировать локальную сеть на javascipt, открывая что то типа http://192.168.0.1 и попытаться измерить скорость до роутера, в 99% случаев ip адрес которого известен).
    Ответ написан
    Комментировать