• Возможно ли назначение устройства в качестве шлюза, если для выхода в интернет на нём необходимо поднимать VPN?

    @Drno
    возможно сделать то что Вы хотите, но Вы можете за это огрести вплоть до увольнения
    пишите служебки, пусть админы делают то, что нужно Вам для работы
    Это самый логичный вариант
    Ответ написан
    Комментировать
  • Как проверить 500 000 файлов word,exel,pdf ,txt что они не битые?

    @kisskin
    у doc/xls есть стандартный заголовок. Его наличие не гарантирует, что остальное целое, но с вероятностью 1E+12
    гарантирует что там был офисный документ.

    у pdf тоже есть и заговолок и маркер конца.

    Тектстовые файлы проверять на попадание в диапазон текстовых и т.п. символов. Либо на отсутствие непечатных символов. Можно регистры текста проверять, но тут будет немало ложных срабатываний.

    Такие варианты проверок будут самыми быстрыми, но софт придется самому делать, хотя тут делов на один вечер.
    Ответ написан
    1 комментарий
  • Как проверить 500 000 файлов word,exel,pdf ,txt что они не битые?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Я-бы поделил файлы word,exel,pdf ,txt на группы.

    1) Aрхивы docx, xlsx. Как выше заметил один джентльмен их можно проверить любой
    утилитой которая умеет читать zip и делать zip -t (test) с выводом статуса в errorlevel.
    Автоматизировать можно либо bash либо python скриптом.

    Если архив целый (контрольные суммы совпали) то и документ почти 100% не поврежден.

    2) Офисные документы старого формата (doc/xls). Здесь я-бы парсил их через apache POI
    (это java библиотека). Это разработка. Но простая. На 1 story point. Я думаю
    любой первокурсник напишет.

    3) Adobe документы. Масса вариантов. Есть автоматизация с помощью bash/python
    и консольными тулзами. Я перечислю тулзы которые есть под линукс и которые читают
    pdf.

    - pdfimages
    - pdfextract
    - pdftoppm

    Напомню что почти все они должны в случае неуспеха генерировать статус код не нулевой.
    Это будет критерий проверки.

    4) Прочие текстовые документы. Неструктурированные. Я тут честно не знаю как их проверять.
    Но допустим если они содержат текст в кодировке win-1251 то любой криптохакер
    с cryptohack вам быстро напишет скриптик
    для проверки что гистограмма или биграмма
    соотвествует примерно тексту и национальным признакам. Если файл будет в нулях
    или в рандомном шуме то какой-то критерий не сработает. Здесь надо подумать
    и просто глазами посмотреть на эти документы. Возможно большая часть из них
    это бланки - и тогда надо чекать наличие просто каких-то шаблонов.
    Ответ написан
    2 комментария
  • Как проверить 500 000 файлов word,exel,pdf ,txt что они не битые?

    Zettabyte
    @Zettabyte
    Проф. восстановление данных ▪ Вопрос? См. профиль
    "Новые" офисные форматы (.docx, .xlsx, ...) - это по факту zip-архивы.

    Новый (пустой) документ Excel распакуется в виде, ЕМНИП, шести папок и примерно десятка файлов.

    Соответственно, их целостность можно проверить с помощью 7-Zip.

    Но с .pdf такой фокус не пройдёт.

    Текстовые файлы можно проверить с помощью анализа энтропии. Но тут вам потребуется понимание этого дела и, с определённой вероятностью, базовое умение программировать.

    Анализаторы энтропии встроены в некоторые инструменты для data recovery, но они работают немного по-другому и с накопителями в целом.
    Утилиты для отдельных файлов я сходу не назову, хотя почти уверен, что она должна существовать. Поищите в составе инструментов для forensic в духе Kali Linux и подобного.
    Также посмотрите что используют те, кто анализируют прошивки, дампы чипов, и занимаются подобным реверс-инжинирингом.

    Когда мне несколько лет назад потребовалась схожая программа, отображающая энтропию, я подходящего ничего не нашёл, в итоге писал не самый прямой костыль сам.
    Ответ написан
    Комментировать
  • Как проверить 500 000 файлов word,exel,pdf ,txt что они не битые?

    @rPman
    Макросы msword, их даже с нуля писать не придется, так как там есть механизм записи макроса - запускаешь запись, делаешь какие то действия, останавливаешь - он показывает сгенерированный код макроса, выполняющий эти действия, добавляешь в код проверки на ошибку, заворачиваешь в цикл и готово - код простейший - взять следующее имя файла из списка, открыть файл, проверить на ошибку, закрыть файл, повторять до окончания списка.

    Так же можно делать все то же самое из любого другого языка программирования, я помню делал что то похожее на c# в visual studio, это удобнее чем писать на vbscript.
    https://learn.microsoft.com/ru-ru/dotnet/csharp/ad...
    Ответ написан
    2 комментария
  • Windows 2019 terminal server два вопроса по AppLocker, и по смене пароля ползователя?

    CityCat4
    @CityCat4
    //COPY01 EXEC PGM=IEBGENER
    А то первые тестовые юзеры без каких-то прав легко себе в профили левых браузеров понаставили,

    Вопрос не технический, а организационный. Во-первых, все это сносится - публично и с громким скандалом. Во-вторых составляется список, с которым идете к директору (хотя это может быть в третьих и вообще отложено - это смотря что за контора и какое у Вас там внутри нее положение). В третьих пишется регламент, который запрещает подобные выкрутасы, с ознакомлением под роспись каждого (Хотя вот это может быть и во-вторых).
    Ответ написан
    2 комментария
  • Windows 2019 terminal server два вопроса по AppLocker, и по смене пароля ползователя?

    @Quqas
    по поводу второго: не баг, а фича. т.е. или шашечки или ехать. хочешь чтоб через gui могли менять пасс nla должон быть выключен. ну это если не впадать в геммор и реализовывать смену пасса через iis

    а по поводу первого альтернатива remoteapp т.е. в принципе без раб.стола, а только полтора ярлыка нужных прог... но если всё это не 1м домене то гемморно
    Ответ написан
    1 комментарий
  • Windows 2019 terminal server два вопроса по AppLocker, и по смене пароля ползователя?

    pindschik
    @pindschik
    ФЫВА ОЛДЖ
    Яндекс-браузер - так и ставится в профиль пользователя. А поставить его крайне настойчиво предлагает сам Яндекс при посещени поисковика...

    С AppLocker есть проблема легкого обхода, тут даже на хабре были статьи. Плюс там надо делать хэш, а это значит что даже Хром и Edge при каждом обновлении будет выпадать из белого списка...
    Тем не менее - этот вопрос решается и решение не техническое, а организационное. Запрещаете приказом, знакомите с приказом, включаете при необходимости в положение о премировании, должностную инструкцию, трудовой договор.
    Потом делаете аудит и снижаете премию пойманным, с публикацией приказа внутри организации, чтоб остальным было неповадно. Рецидивистам делаете дисциплинарные взыскания и увольнения. И проблема решается - пусть и не техническими методами. В том числе с кадрами типа "ой, а оно само, я ничего не делалала, я в этом ничего не понимаю".

    Не очень хорошо, но можно сделать скрипт, пробегающий профили и всем исполяемым файлам (.exe, .com, .msi, .msp, .bat, .scr, .js, .dll), навешивает аттрибут запрет исполнения. При этом отбираете у профиля пользователя полные права на файлы профиля (только в разрезе смены прав и выполнения), и удаляете права для создателя файла. Потребуется немного в политиках объяснить системе, что без полных прав тоже приемлемо. Тогда скачать они смогут, запустить нет. При этом нужно запрещать создание папок на диске С и запрещать исполнение файлов на других сетевых ресурсах.
    Можно поиметь проблем с совместимостью с ПО, надо тщательно тестировать.

    Отключать проверку пароля на уровне сети - крайне опасная затея. Т.к. терминальная сессия становиться доступна без пароля и соответственно все уязвимости доступны злоумышленникам в полной мере. Особенно если она "светит" наружу.

    Система напоминает о скорой замене, по умолчанию за две недели, но многие пользователи обладают выборочной слепотой и не видят уведомление. Попробуйте настроить скрипт рассылки ИМ писем, когда пароль заканчивается и что его пора сменить. А для особо запущенных случаев, если не хотите, чтоб каждое утро у вас начиналось со смены паролей - есть жестокий способ - при обращении пользователя меняйте ему пароль, но на серийники от Windows XP или что-то подобное. После пары вводов такого пароля - они сразу и резко научаются их менять и перестают забывать (кроме отпусков).

    Еще не забывайте про утекшие пароли, через которые вам однажды занесут шифровальщика. Раньше такой проблемы не было, сейчас она очень острая. При чем атаковать вас будет не вирус, а человек оборудованный головным мозгом. Поэтому на внешних терминалах обязательно прикручивайте двухфакторку. Тот же MultiOTP бесплатен, и умеет дружить с Active Directory. А на смартфоне он совместим с кучей программ, вплоть до Google Authenticator.
    Уж если вам так хочется решить проблему паролей - сделайте их бессрочными, разрешите сохранять на клиентских устройствах, но оставьте проверку одноразового ПИН-кода из аутентикатора.
    Тогда пользователь при подключении введет пароль, поставит галку "сохранить", а дальше будет заходить фактически только по ПИНу, украсть который нереально (ну пока что).

    З.Ы.
    По возможности завязывайте с серверами 2019, 2016, 2012 и т.д. Сейчас актуален 2022. На 2019 уже начинается "проблема Windows XP".
    Ответ написан
    1 комментарий
  • Не понимаю, почему программа "тяжелая"?

    Maksim_64
    @Maksim_64
    Data Analyst
    Потому что вызовов рекурсивной функции происходит больше раз чем ты ожидаешь, и растет все это дело не линейно с увеличением n. Нужно оптимизировать рекурсивную функцию.
    from functools import lru_cache
    @lru_cache
    def F(n):
        print(n)
        if n <= 1:
            return n
        if n>1: 
            return F(n-1)+F(n-2)
    F(8)
    Вот твоя функция в точности, я добавил кеширование результатов, и print(n). Запусти с ним и без него и посмотри сколько лишних вызовов происходит. Если владеешь английским вот хорошая статья почитай как сделать своими руками, без встроенного декоратора, различные стратегии и т.д. https://realpython.com/lru-cache-python/
    Ответ написан
    1 комментарий
  • Как увеличить размер памяти флешки в угоду её длительности жизни при помощи команды devicehigh или loadhigh?

    CityCat4
    @CityCat4
    //COPY01 EXEC PGM=IEBGENER
    devicehigh или loadhigh не имеют никакого отношения к форматированию диска. Это просто команды загрузки драйвера устройства или любой TSR-программы в верхнюю память. Управляет этой памятью himem.sys.

    Возможно, что препод помнит времена драйвера 800, который грузился и каким-то хитрыми методами позволял отформатировать обычную 5.25" дискету емкостью 360к (DS/DD) на 800к обьема. Но проблема была в том, что:
    - такой финт ушами работал только при загруженном драйвере 800
    - он был крайне ненадежен
    Ответ написан
    8 комментариев
  • Правильно ли я понимаю устройство классов в python?

    Maksim_64
    @Maksim_64
    Data Analyst
    Нет у тебя абсолютно не правильное представление по все пунктам. Написание хорошего ответа на каждый вопрос потребует дней, при том что на все эти темы можно разговаривать на совершенно разных уровнях. Если хоть как-то в двух словах.
    1. OOP одна из парадигм в программировании в том числе поддерживаемая python.

    2. Объект это python абстракция для данных, все данные в python представлены в виде объектов или взаимоотношений между объектами. Отсюда и выражение все в python является объектом.

    3. В python каждый класс не явно наследуется от object класс. Да даже если мы не переопределим явно __init__ то он там есть. Например
    class MyClass:
        pass
    my_instance = MyClass()
    print(dir(my_instance))
    Там будет в том числе __init__ хотя мы его явно не определяли. __init__ это конструктор класса там могут быть заданы атрибуты которые будут в области видимости экземпляра класса, с которыми будут оперировать методы экземпляра класса, он выполнится при создании экземпляра класса.

    4. По скольку, ты еще совсем новичок, понятия "приватных" и "защищенных" атрибутов обсуждать совсем бессмысленно, к тому же их "приватность" она в ковычках, в python нет способа создать настоящий приватный атрибут, но это все совершенно лишнее для тебя сейчас и в обозримом будущем.

    5. В зависимости от того является ли определенный метод методом класса или методом экземпляра класса, то первый позиционный параметр метода это класс или экземпляр класса. Между программистами python их принято называть cls - для класса, self - для экземпляра класса. Так как ты в начале пути будешь работать с методами экземпляра класса, да и необходимость создавать методы класса она значительно реже.

    Не думаю что тебе хоть что то стало понятней. По этому бери и изучай понимание будет приходить медленно и со временем, а не пытайся понять все вопросы на раз два.
    Ответ написан
    3 комментария
  • Эффективны ли roadmapы в обучении?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Если отбросить англоицизмы, то на нормальном языке роадмап - это план обучения.
    Планы обычно пишут преподаватели.

    Нам здесь в хабре трудно оценить их эффективность. Это - примерно тоже самое
    что оценивать программу обучения ВУЗа.

    С моей субъективной точки зрения план - хороший. Если-бы я решил что он плохой
    то мне надо было-бы срочно предложить свой собственный план. У меня такого нет.

    А учитывая что ты плаваешь в понимании нужности Django и сокетов - то ты тем более
    не в состоянии даже критиковать этот план. Поэтому бери его. Учи. И скажи спасибо
    что хотя-бы такое есть.
    Ответ написан
    Комментировать
  • Существует ли какая- та тула, плагин или просто сервис который бы помогал улучшить код.?

    sergey-gornostaev
    @sergey-gornostaev Куратор тега Java
    Седой и строгий
    Как только такая появится, вы станете не нужны.
    Ответ написан
    Комментировать
  • Как записать iso windows на флешку из linux?

    @nehrung
    Не забывайте кликать кнопку "Отметить решением"!
    Есть такая кроссплатформенная утилита - unetbootin. С её помощью любой загрузочный iso-образ легко превращается в Live-USB-флэшку.
    Ответ написан
    4 комментария
  • Как стартапу найти себе продажника?

    @nrgian
    Нанять просто.
    Рядовая профессия.

    Но в одном вы правы - хорошему продажнику нужен очень хороший процент с прибыли.
    Ответ написан
    Комментировать
  • Как стартапу найти себе продажника?

    petermzg
    @petermzg
    Самый лучший программист
    Люди хотят ставку, так как не уверены в необходимости вашего продукта, что смогут выполнить обьем и на еду заработать не смогут.
    Покажите людям возможность заработать и они сами к вам потянутся.
    Для примера продажника в проекте можно заменить партнерской программой, если конечно ее хорошо продумать.
    Процент должен быть таким, чтобы продав за месяц N шт. хватало на хлеб с маслом и колбасой, плюс девушку в кино сводить.
    Ответ написан
    Комментировать
  • Как стартапу найти себе продажника?

    Maksclub
    @Maksclub
    maksfedorov.ru
    Теория нам говорит, что основная прибыль продажника - это проценты. Хороший продажник может получать на процентах больше денег в месяц, чем гендиректор.

    Реальность такая, что нужно продать вагон вагонов, чтобы из этого процента вышло что-то, на что можно купить продуктов, отвезти детей в садик и купить валерьянки.

    Когда на рынке правит кумовство, рынок падает, конкуренция более-менее и ваш продукт не топ-1 -- найти такого продажника достаточно сложно, тк такие в топовых компаниях.

    Продукт:
    Нельзя просто так взять и сказать -- продай и твое, тк вы возлагаете риски на менеджера. По сути бесплатную корову ищите, еще и с клыками кабана, скорость гепарда. По сути любой крикнет -- продай для меня товаров Х, а я тебе дам часть от этого -- если продукт на поверхности, то сразу вопрос -- зачем тогда вы ему? :).

    Вы должны дать ТОПОВЫЙ продукт, ЗАЩИЩЕННЫЙ продукт (от подделки, от тиража конкурентов -- чтобы спокойно работать и не увидеть заполненный рынок таким же Г через 2 месяца и потом сидеть без денег, юридически, рекламно и прочее), обеспечить товаром на год (лучше десять лет), обеспечить гарантии качества продукта, обеспечить смежные расходы полностью (телефон, офис, авто) и дать гарантии, что не схлопнитесь через 3 месяца работы продажника, когда у него уже наработаются клиенты и, самое главное, что заплатите за обязательства. Вы готовы такие гарнатии дать? уверен, что нет.
    Даже в фильме "Волк с Уолл Стрит" был офис, были акции и была очень большая маржа с этих акций, чувак просто на поток поставил мусор, но офис был, и был набор предпринимателей в портфеле.
    Работа 'с нуля'
    5cd96b691a89f857153391.jpeg

    Вывод: Продайте свой товар продажнику :--) Если вы сделали крутой сервис, который хотят, который полезен и который эксклюзивен -- найдете так или иначе, вопрос времени. Если нет -- готовьте страховку (оклад, рекламный бюджет, время)

    Кидалово из личного опыта: Меня один раз так кинули, чувак продавал склад говно-кондеев, закупил после аномальной жары в МСК, 2-3 года хламом лежали, решил сбыть за четверть цены, я сделал поток клиентов, а телефон моего поставщика не скрыл с сайта, который сделал под это..., нашелся клиент -- ушел напрямую, в итоге я потерял тысяч 10 и неделю (а мог и больше времени), и ничего не получил, и на кой мне такие отношения? А если бы были дети у меня?
    Ответ написан
    1 комментарий
  • Как стартапу найти себе продажника?

    Zoominger
    @Zoominger
    System Integrator
    Ого, вот это самомнение у автора. Сразу ему профи подавайте, да ещё чтобы бегал за ним.
    Очевидно, что "умные книжки", которые вы читали, являются переводос с английского, потому что с отечественными реалиями маркетинга вы явно не знакомы и в принципе в этой области никаких знаний, кроме теоритических, не имеете.

    И при этом никто не хочет работать за процент (ни от прибыли, ни от стартапа).

    Может, они видят, что на вашем стартапе много не заработать? Ну и ещё вы пытаетесь сидеть на троне в то время, как за вас будут делать всю грязную работу.

    просто не умею находить с ними общий язык

    This.

    Не в обиду, просто высказываю мнение в рамках обсуждения.
    Ответ написан
    1 комментарий
  • Влияют ли фотографии на продвижение и рейтинг сайта?

    delphius
    @delphius
    engineer
    Обобщил и структурировал комментарии к видео ув. тов. Demi Murych

    Работа с изображениями, это точно такой же сложный процесс, как и работа с сайтом в целом. И факторов ранжирования у изображение намного больше, чем просто формальное - уникальное изображение или нет.
    Вы знаете как сильно влияет соотношение сторон изображения?
    Как сильно влияет качество изображения?
    Как влияет то - коммерческий запрос или нет?
    Как в связи с качеством запроса (коммерческий или нет) влияет контрастность изображения?
    Начните с справки от гугла о _базовых правилах для изображений товара_, где они рекомендуют ЧТО надо делать. Продолжите это же справкой из мерчант центра. А потом попробуйте провести опыты на своих проектах, соблюдая хотя бы эти базовые рекомендации.
    И это не говоря о более тонких сентенциях, вроде крайне сильного влияния тех изображений которые висят в топе уже давно, на то каким нужно быть чтобы их вытеснить.

    Бот сейчас оценивает очень много параметров к фото:
    0. Качество исходного изображения.
    1. Есть ли превью с разными соотношениями сторон.
    2. Есть ли превью с разным разрешением для пунтка 1.
    3. Какова контактность изображения.
    4. Каков фон изображения.
    5. Какой интент запроса - коммерческий или информационный.
    6. В зависимости от пункта 5, каковы факторы изображений которые лежат в топе уже давно.
    И все это делается без влияния на то, чтобы замедлить работу страницы.
    Иначе говоря, бот может проиндексировать ваше HD изображение в 10 Мп, при этом посетитель видит микро превьюшку которой достаточно для его текущих условий отображения.
    Главное чтобы сайт работал быстро в соотношении с тем, чтобы бот проиндексировал максимальное качество изображения. Что сейчас легко делается любым нормальным специалистом в этой области. То есть, посетитель должен видеть ровно то, что ему будет полезно в соотношении - качество экрана к текущему каналу. Бот же должен индексировать максимальное качество изображения. И это только базовые факторы.

    Оптимизация (уменьшение) размера изображений без потери качества ускоряет загрузку страниц.
    Если суммарно ускорение получается заметное, то со временем это дает плюс в позициях.
    Оптимизация изображений не сводится только к работе с объемом файла.
    Но и с - предоставлением всех вариантов превью изображения поисковому роботу.
    Желательно во всех доступных разрешениях - 1x1 4x3 16x9 оригинал.
    В соответствующих разрешениях для разных типов экранов.
    В результате чего в проектах где делают все правильно, одна картинка в карточке товара или статье, фактически представляется не менее 10 разными файлами.
    И Google это очень ценит.
    Яндекс меньше, но тоже любит.

    Первый главный влияющий фактор на то какие требования предъявляют к изображению является качество запроса - коммерческий запрос или информационный.
    Если запрос коммерческий (грубо говоря купить кроссовки) то изображение должно удовлетворять следующим базовым требованиям:
    1. Иметь белый или светло серый фон.
    2. обладать максимальным контрастом к фону.
    3. иметь как можно меньше лишних обьектов в кадре.
    4. должно иметь разрешение выше чем у конкурентов, но не более 10мп
    5. обьем файла должен быть не более 12 мегабайт.
    6. изображение должно быть доступно через атрибут src тега img, должно быть частью разметки (product, или imageobject) внутри которой должны быть дополнительные ссылки на файлы превью для соотношений сторон 16x9 4x3 1x1.
    Если запрос информационный, то пункты 1, 2, 3 не учитываются.

    Это базовые требования, кроме них существует еще некоторое количество дополнительных.
    Например, если в топе выдачи давно висят продукты изображения которых подчинены одному правилу, и ресурс который их транслирует является трастовым для Google, то чтобы получить плюс от своих изображений - нужно будет выдержать те же правила. Например магазин продает кашпо для цветов. Все фотографии кашпо у них представляют из себя серый однотонный фон, само кашпо, внутри которого горшок с зеленью. В случае если Вы будете заходить со своими фото кашпо, то для максимально быстрого результата вы должны сделать фото точно так же - зеленью. То есть если Вы сделает качественные фото, выдержете все правила, но на однотонном фоне будет просто кашпо, то ваши изображения всегда будут ниже изображений трастового сайта, и как следствие оказывать меньше влияния на позиции самого продукта в основной выдаче. Возможно для кого то это прозвучит как "чудо", но на самом деле все достаточно просто и связано с процентом соотношения цветов на изображении, который оказывает влияние на ранжирование, в случае если в топе висит трастовый сайт. То есть Google начинает считать что с высокой долей вероятности по этому продукту, изображение должно быть похоже на то, которое размещено. И если это оказывается так - изображение получает рост. Таких тонкостей в работе с изображениями очень много. И их количество будет только увеличиваться, в силу того, что важность такого контента как "видео" или "изображения" сейчас становится выше текстового. По крайней мере в гугл, по крайней мере в определенных нишах где изображение является ключевым для посетителя. И начинаются они все с одного - изображение должно быть формально уникальным для Google.

    Однако (мнение автора видео):
    Для продвижения в поиске по картинкам - да.
    Для роста позиций в поиске - в Яндексе вообще влияния не замечено ни на одном проекте.
    В Google - есть, но незначительное по сравнению с другими факторами.
    Для меня критерий эффективности методики один: если я вложу бюджет следующего месяца преимущественно в эту работу, насколько я большой плюс по трафику и заработку с проекта смогу получить и через какой срок (не важно свой это проект или клиентский). И в этом смысле во-первых: 1) трафик с яндекс-картинок и гугл-картинок меня интересует в последнюю очередь (так как конвертируется в большинстве ниш очень плохо по сравнению с трафиком с веб-поиска) 2) есть много факторов, вложив бюджет в улучшение которых я получу больше отдачу 3) некоторый рост трафика только с гугла в результате работы с изображениями в большинстве случаев недостаточен. Мой опыт показывает, что стратегически это не такие полезные действия как об этом говорит Google. И это всегда вопрос стиля и опыта оптимизатора и владения теми или иными инструментами. И тогда не удивительно, что в вашем опыте изображения - это одна из основ стратегии, а в моем - дополнительный инструмент.

    Вывод: В настоящий момент ВЛИЯЮТ в Google, гораздо меньше в Яндекс, в будущем БУДУТ ВЛИЯТЬ во всех поисковых системах.
    Ответ написан
    Комментировать