Ответы пользователя rPman по тегу «Веб-разработка» — Хабр Q&A

Задать вопрос

Ответы пользователя по тегу Веб-разработка

Как сделать так, что бы open server не кешировал JavaScript?

rPman @rPman

Измени подход к разработке, к имени скрипта добавляй версию, время последнего изменения или хешсумму например так main.js?3a7b (все веб сервера корректно это обрабатывают со статикой)

Делать это лучше простым скриптом, который запускать каждый раз перед тестами и при публикации релиза, так как эта проблема с кешем вылезет там ещё больнее

Ответ написан 03 июн. 2023

Комментировать

Комментировать
Как работает открытие сокета на сервере?

rPman @rPman

Во первых веб браузеры не умеют работать с обычным универсальным tcp/udp советами, им нужен определенный протокол, т.е. приложение, которое слушает сокет (socket_listen) должно работать по совместимому протоколу (сейчас это http, его расширение websocket, а для udp - webrtc).

Когда браузер подключается к сокету, слушала приложение получает событие и сокет клиента - соединение от браузера и дальше уже работает с ним (обычно такие приложения делают асинхронными, чтобы можно было одновременно обрабатывать несколько подключений, иначе клиента будет ждать, когда он освободится, или вылетают по таймауту)

Про 'ваш сервер', я встречал виртуальный хостинг, обычно точно дешёвые так делают, когда сервер сидит в локальной сети, а порты по тарифу подбрасываются nat, т.е. Только разрешенные порты так работают

Ответ написан более года назад

Комментировать

Комментировать
Как вытащить аудио с сайта?

rPman @rPman

Этот сайт использует встроенный в браузер (который скорее всего использует штатный API операционной системы) синтезатор речи, разные ОС и браузеры выдают разный результат. Это видно по коду сайта (2 клика в инспекторе браузера, потом поиск по имени функиции).

https://developer.mozilla.org/en-US/docs/Web/API/S...

Если тебе нужен не обязательно этот синтезатор, воспользуйся инструментами своей ОС, для windows это SAPI, очень удобный инструмент, есть миллион готовых утилит и прочее прочее. гуглить к примеру command line SAPI (первая же статья гуглится, однострочники от powershell до visual basic script), так же куча биндингов для языков типа питон, в т.ч. кроссплатформенных, в общем уточни с чем ты можешь работать, поможем погуглить.

Ответ написан более года назад

1 комментарий

1 комментарий
Защита данных в API?

rPman @rPman

Обычно два направления атак, от которых нужно защищаться:
1. защита от кражи передаваемых данных провайдером (любым, на пути следования пакетов, например публичный wifi)
2. защита от подмены передаваемых данных, так же провайдером
Для первой задачи нужно шифрование HTTPS, для второй хватит цифровой подписи но при использовании HTTPS это не актуально, так как подменить зашифрованные данные не получится

Клиент должен не игнорировать предупреждения о невалидности цифровой подписи (любят тут люди вместо корректной настройки последних версий openssl отключать контроль curl --insecure).

Есть еще защита от фальсификаций истории действий клиентом и сервисом (как доказать что ты отправил сервису сигнал на покупку и он его принял, а серверу доказать что ты отправлял этот сигнал), это реализуется цифровой подписью, сервер и клиент сначала обмениваются ключами шифрования (или просто солью для хешей) и каждое свое сообщение подписывают, если клиент будет хранить всю коммуникацию, эти цифровые подписи будут доказательством.

Ответ написан более года назад

Комментировать

Комментировать
Как правильно хранить image на сервере (в mysql)?

rPman @rPman

Хранить в файлах
Можно не генерировать имя файла а использовать идентификатор из базы данных (не обязательно числовой, можно брать hex от его байтового представления), чтобы не заморачиваться с расширением, его можно либо стандартизировать либо не указывать (но тогда либо где то храни его mime type либо каждый раз высчитывать его с помощью утилиты file). Если будет расширение файла, то веб сервера смогут отдавать такие файлы максимально эффективно статикой, напрямую без бакэнда (при унификации типа файла это не требуется).

Так же для удобства обслуживания действительно больших баз (миллионы изображений) можно раскидывать их по подкаталогам, считая имя каталога как некоторые биты от идентификатора, к примеру имя файла 00f1b3f3.png но хранить его в подкаталоге 00f1/b3f3.png в этом случае один каталог не будет содержать файлов больше некоторого лимита (в данном случае 2^16 - 65536, с таким объемом вполне сносно работают почти любые утилиты)

p.s. хранение в блобах сопряжено с некоторыми проблемами обслуживания базы данных, так как транзакционные базы работают с блобами заметно медленнее, особенно на запись, то восстановление многотерабайтовой базы может занять очень много времени (сутки и даже недели), когда как простое копирование файлов отработает за часы.

p.p.s. бонус от хранения в блобах можно увидеть как унификация обслуживания базы данных, не нужно синхронизировать файлы и базу данных (расхождения возможны при сбоях) а так же можно настроить штатную репликацию БД и получить красивую репликацию данных на лету на ноды кластера...

Ответ написан более года назад

Комментировать

Комментировать
Какие подходы позволят написать зашифрованный сайт, у которого нельзя расшифровать код?

rPman @rPman

Специально на такой поток вопросов написал ответ

p.s. по теме, почти наверняка у тебя какой то косяк в идеологии проекта, такие вопросы задают только от абсолютного непонимания что зачем почему и как.

Есть возможность, через web assembler собирать вплоть до .net приложений с win forms (наберись терпения)... не защита но неплохой путь обфускации кода

Ответ написан более года назад

Комментировать

Комментировать
Зачем хранят изображения сайта на отдельном сервере?

rPman @rPman

Единственный смысл разделения хранилища раздачи статики и динамического контента - это различия в стоимости серверов под эти задачи

Бакенду нужен процессор но нет нужды в емком хранилище, а серверу раздачи статики он не нужен совсем, но нужны ёмкие и/или быстрые диски, а так же выше сетевой трафик.

Статичные файлы проще реплицировать, т.е. геораспределенный кластер с ними удобнее обслуживать...

Само собой разницу можно будет заметить только на больших объемах, и речь о терабайтах

Ответ написан более года назад

5 комментариев

5 комментариев
Какие данные можно узнать о пользователе, который зашёл на сайт?
rPman @rPman
Если пользователь не сопротивляется (например специфические настройки и приватный режим браузера, плагины-блокировщики, виртуализация и т.п.) то:
* информация о железе - ос, параметры экрана и от сюда вплоть до конкретной модели мобильного устройства, ну по классам, наличие видеоускорителя, бенчмарки процессора и много чего еще
p.s. кстати webgl это огромная дыра, при должном старании как я понимаю можно даже содержимое экрана получить, буквально чем занимается пользователь вне браузера.
сюда же можно докинуть шрифты и алгоритмы их отрисовки, к примеру при должном старании можно понять, установлен ли тот или иной софт (крупный, какой-нибудь cad) по тому как браузер отрисовывает тексты шрифтами, устанавливаемыми этим софтом.
* fingerprint - набор технологий позволяющих вытянуть из поведения браузера идентификатор пользователя (читай куки) даже если он сопротивляется этому
* наличие плагинов/расширений браузера, по каждому расширению нужно проводить свои проверки но детектировать можно все
пример:
посчитай время, необходимое на запрос

fetch('moz-extension://d81669f0-2f9c-4ccc-b20e-e6942bb9b2ec/options/index.html')

если без ошибок то значит установлено расширение Simple Translate

* поведенческий анализ, стиль работы с мышкой и клавиатурой, можно оценить реакцию пользователя на раздражители

полагаю при должном старании можно даже что то о характере пользователя понять
мат анализ и теория вероятности, позволяют вытягивать кучу информации и предсказывать на очень странных зависимостях, отличный пример, когда то давно давно был проект анализ авторства текста, так вот выяснилось что для определения авторства достаточно было таких метрик как количество знаков препинания, размера предложений и т.п.

* если ты - рекламная сеть (точнее куча веб сайтов устанавливают твой аналитический код да просто изображение-пиксел) то ты можешь знать, какие твои сайты посещал пользователь, вплоть до открываемых страниц и даже мониторинг поведения (если баннерная сеть ставит свой javascript код на сайт, то она может собирать буквально всю информацию, например нажимаемые кнопки), это самая вкусная информация, особенно для крупных сетей, ведь видно все интересы пользователя с историей

* банальщина вида - подменять содержимое clipboard, браузер позволяет его устанавливать на реакцию пользователя, типа клик(одно время и читать тоже, но это поменяли), как с этим можно смошенничать догадывайся сам

Ответ написан более года назад

2 комментария
2 комментария
Как правильно бэкапить файлы в Yandex Storage?

rPman @rPman

Инкрементальные бакапы
Каждый архив должен содержать только разницу между предыдущим состоянием файловой системы и текущим

Каждый инструмент резервного копирования использует свой формат хранения такого снапшота

Если делаешь свой, то учитывай не только новые и измененные файлы но и удаляемые. Существуют binary diff утилиты, вычисляющие приблизительную разницу между двумя бинарными файлами для экономии места в бакапе, вместо полного копирования измененного файла

p.s. недостаток инкрементальных бакапов в том что для восстановления состояния нужно "применить снапшоты" за все время с момента первого сохраненного состояния

решают эту проблему тем что ограничивают количество промежуточных состояний и с каждым новым модифицирют стартовое состояние, применив к нему самый старый бакап (который после этого удалят)

p.p.s. btrfs имеет встроенные механизмы получения инкрементальных бакапов между снапшотами без сканирования всех файлов (что актуально для ОГРОМНЫХ архивов)

Ответ написан более года назад

3 комментария

3 комментария
Как устроены сайты по типу хабра?

rPman @rPman

Ответы другими пользователями даны абсолютно верные

Но хочу все же напомнить что вполне возможно существование веб сервиса который создает на каждую страницу реальный файл на диске при создании и редактировании поста как механизм кеширования (дублируя информацию с базой данных), так как современные веб серверы (nginx например) работают с таким файлами (это называется статичные файлы) невероятно эффективно, на порядок эффективнее чем делать это на лету при каждом запросе, так же он может быть заранее сжат (deflate, gzip, br) что позволит сэкономить еще и на сетевом трафике., да веб сервер и так это делал бы на лету, но за счет процессора.

Ответ написан более года назад

Комментировать

Комментировать
Колокольчик уведомлений на сайт?

rPman @rPman

Это счетчик непрочитанных новостей
Варианты реализации:
- для каждого пользователя у каждой новости есть отметка boolean (например в базе данных связь М - М, наличие записи - прочитана, отсутствие - нет), количество новостей без таких отметок для пользователя и есть искомое число (можно оптимизировать триггерами в базе данных на создание новостей)
этот вариант подходит, если есть возможность и необходимость мониторить прочтение каждой новости
- для каждого пользователя сохраняется дата последнего его захода на сайт (чтения страницы новостей), соответственно количество новостей с датой выхода больше сохраненной у пользователя - искомое число
этот вариант сильно быстрее работает но дубовый и не учитывает что пользователь мог не прочитать новости

Ответ написан более года назад

Комментировать

Комментировать
Какой стек использовать для разработки SPA?

rPman @rPman

Для обучения нужно работать с минимумом фрейморков в идеале вообще без них, буквально
Чтобы было понимание 'как это работает на самом деле'

Без этого понимания любой фреймворк для тебя будет черным ящиком, и любые даже минимальные проблемы решить самостоятельно не сможешь!

Ответ написан более года назад

3 комментария

3 комментария
Чем можно скачать страницу сайта кроме wget?

rPman @rPman

гугли offline explorer или offline browser (там много разного софта было)
когда то это был единственный способ бакапить сайты со скриптами.

если сделать самому - то пишешь или ищешь примитивный http-сервер или прокси, собирающий все запросы, гарантированно их кеширующий, игнорируя настройки, и соответственно отдавай в следующий раз только закешированную версию

p.s. содержимое сайта с вероятность 99.(9) скам, будь осторожен

Ответ написан более года назад

Комментировать

Комментировать
В какой операционной системе выполняется браузер?

rPman @rPman

Напрямую узнать ОС нет, только семейство (т.е. liunx/windows/macos), например window.navigator.platform вернет "linux armv8l", то же самое вернется для linux машины на таком же железе (arm процессоре).

Но можно косвенно провести анализ по работе компонентов браузера (в т.ч. gpu, это самая незащищенная компонента в браузере)

Есть готовые библиотеки, например https://github.com/bestiejs/platform.js

Ответ написан более года назад

Комментировать

Комментировать
Как отключить обращения к яндекс.метрике при локальной разработке?
rPman @rPman
ты на сайт добавил код счетчика яндекс метрики, это буквально

<script> ... </script>
так вот заверни все его содержимое в

if(document.location.hostname=='127.0.0.1') { ... }
или любое другое условие, которое тебе подходит, в ообще его можно просто удалить метрику, вернув в момент публикации

Ответ написан более года назад

7 комментариев
7 комментариев
Какой стек технологий лучше выбрать для разработки чата?

rPman @rPman

зачем все так усложнять

рабочий чат на websocket лежит в примерах наверное любой документации к websocket, первый же нагугленный проект (бакэнд на go но там код на 20 строк все понятно) на столько простой что даже непонятно что непонятно

а еще есть webrtc, эта технология дает еще один механизм коммуникации между пользователями вообще минуя сервер, добавь сюда шифрование и failover при неработающем webrtc и получишь готовый проект

Ответ написан более года назад

Комментировать

Комментировать
Какие минусы для сайта с огромной аудиторией, если он заблокирован в стране?

rPman @rPman

Главный минус - в попытках удержать аудиторию (иначе проект превратится в проект с не огромной аудиторией, т.е. никому не нужен), это борьба с блокировками (юридическая и техническая), беготня по другим доменам, приложениям, и т.п. проблемы с рекламодателями (обычно через них монетизация, но хз как у тебя) и прочие убытки, причем эти убытки никак не гарантируют что все получится.

Ответ написан более года назад

1 комментарий

1 комментарий
Выбор архитектуры: web или desktop?

rPman @rPman

Web - на два порядка проще (читай дешевле) для разработки за счет повышенного требования ресурсов на клиентской стороне.

Десктоп - возможно создание очень эффективных приложений но за счет очень дорогой поддержки всего разнообразия устройств и операционных систем (в веб этим занимается браузер и даже в этом случае приходится напрягаться)

И главное, из веб приложения достаточно легко (например с помощью electron) можно сделать десктопное приложение.

p.s. как бы я не нелюбил веб, который тянут даже туда где не надо, но его плюсы неоспоримы а страдающие клиенты от тормозов приложений, требующих топовое железо для простого чата... кто нас слушает?

Кстати, один момент, тормозные веб приложения это не потому что веб такой плохой, это потому что разработчики ленятся делать все как следует. Рынок заполонили низкокачественные разработчики на основе веб. Помни об этом!

Ответ написан более года назад

Комментировать

Комментировать
Как удалить вирус с сервера?

rPman @rPman

Решение prgrant наиболее простое.

Если нужно разобраться, то разворачиваешь последний бакапп (или устанавливаешь все с нуля, в общем делаешь рабочую чистую от вируса копию) и начинаешь сравнивать по файлам (и базы данных тоже, бывают проекты от не очень оригинальных архитекторов, которые хранят код в базе, отличным примером может быть следующее - в проекте есть уязвимость, при которой ряд запросов со стороны клиента запускают скрипт на сервере, поэтому достаточно в шаблоне, который хранится в базе, добавить скрипт этого заражения и вот, первый клиент автоматически запускает код на сервере)

Другим способом, т.е. чисто аналитическим, разобраться бывает нереально сложно, тем более у тебя много проектов развернуто.

Вирус может лежать в базе данных, в файлах проекта, во временных файлах, в логах, в изображениях, в расширенных атрибутах файлов, вечно в оперативной памяти (вариант когда вирус появляется после запроса злоумышленника через дыру в проекте) и т.п.

p.s. само собой цель - не только найти и удалить файлы вируса, но найти дыру и закрыть ее, так как если этого не сделать, вирус вернется. Обычно обновляют кодовую базу сайтов и пролводят аудит безопасности, минимальный, хотя бы фаервол настроить и закрыть все что не должно торчать 'наружу'

Ответ написан более года назад

1 комментарий

1 комментарий
Как сделать сайт новичку, чтоб он одинаково корректно открывался старыми и новыми браузерами, в том числе смартфонами на Windows mobile 5, Symbian?

rPman @rPman

Простых рекомендаций нет.

Использование фреймворков заранее определит список устройств и браузеров (про устройства - важное замечание, так как банальный размер и наличие скалинга многое определяет), но сделает работу проще, а если делать все самому то будет эффективнее,больше гибкости и главное понимание что как работает и почему нет!

Бессмысленно делать поддержку для всех, нужно чётко определить свою целевую аудиторию, приобрести или настроитьсимуляцию всех используемых устройств и активно тестировать любое нововведение.

В подавляющем большинстве случаев проблемы появляются когда хочется сделать красиво и необычно, чем проще будет верстка тем легче ее поддерживать. Как пользователь скажу что практически любое украшательство, типа анимаций, резиновые изменения в элементах от скролинга, полупрозрачный и динамический контент в конце концов создают только раздражение но никак не пользу и комфорт.

Есть два основных направления разработки веб приложений, основные на месте генерации итогового html - на серверной стороне и на клиенте.

В чистом виде первый подход уже не встречается, так или иначе javascript используется, но можно выбирать где именно, а значит уменьшать вероятность сбоя из-за особенностей пользовательского устройства, из недостатков - это повышает нагрузку на сервер, но это актуально для нагруженнных проектов, и тысяча другая клиентов правильно разработанный бакэнд не нагрузят.

Второй подход, его ещё называют SPA, переносит все что касается интерфейса на сторону клиента, оставляя серверу бизнеслогику, это сильно уменьшает затраты на разработку бакэнда и снижает затраты ресурсов сервера, причем на столько, что даже миллионы пользователей потянет один сервер (защита ддос, CDN и т.п. можно считать фичей провайдера), но затраты на разработку со стороны браузера возрастут именно при необходимости поддержи большего количества устройств..

Для начинающего я бы рекомендовал первый подход, с оглядкой на постепенный переход к SPA.

Ответ написан более года назад

Комментировать

Комментировать

Самые активные сегодня

#
- 4 ответа
- 0 вопросов
Rsa97
- 4 ответа
- 0 вопросов
Everything_is_bad
- 4 ответа
- 0 вопросов
alexalexes
- 3 ответа
- 0 вопросов
Bobbi86
- 3 ответа
- 0 вопросов
Wataru
- 2 ответа
- 0 вопросов