• Как сравнить есть ли уже такой файл в базе или нет?

    @12rbah
    с точностью совпадения, допустим в 99%.

    Вот посмотрите Как сравнить два текста в JS? . https://stackoverflow.com/questions/5042873/javasc...

    Проверку на хеш в вашем случае тоже можно делать, т.к. pdf довольно редко редактируют и все передают одну и ту же книгу.

    Есть несколько сотен тысяч PDF файлов.

    Это реальная проблема или просто от нечего делать придумали? Слишком мало информации по самим документам. в некоторых сферах, где много типовых отчетов это обычное дело когда документ на 95% похож на другой, поменяться может например только одна цифра в дате, и такой документ нельзя будет отбраковывать. И из пдфа вы не всегда можете извлечь текст для сравнения. В общем довольно много подводных камней. Поэтому стоит более конкретно определиться с задачей.

    upd: в общем есть еще такая особенность, что нужно правильно выбрать средство для извлечения текста, т.к. многие средства извлекают не всегда весь текст. Ну и еще интересно как быстро вы сравните 1 pdf со 200-300к других pdf, как по мне затраты на этот процесс будут слишком большими. Можно конечно сравнить только часть текста. Да кстати, извлечение текста из pdf медленный процесс, текст из некоторых страниц может извлекаться больше секунды на обычных процах (тестил на документах в 600-700 страниц), я пользовался только некоммерческими решениями, возможно вы найдете что-то быстрее, но парсить pdf вам придется явно не на ноде, т.к. это слишком медленно будет.
    Ответ написан
    1 комментарий
  • Кто обучался в Университете искусственного интеллекта (https://neural-university.ru/)?

    @12rbah
    В целом есть смысл идти на курсы, либо если у вас почти ноль знаний и вы не понимаете обучающие материалы которые есть в сети, либо идти на такие курсы, которые улучшают ваши знания в узкой/нужной вам сфере/задаче. А такие годовые курсы в 99% случаев берут открытый материал и немного переделывают его.
    Ответ написан
  • Что лучше для новичка, опен-сорс или собственные проекты?

    @12rbah
    Укажите область в которой хотите работать, т.к. c++ большой язык и у него много сфер применения.
    С этого всего у меня возникло мнение, что я пишу слишком тривиальный код

    Вам стоит поискать реальные вакансии в желаемой сфере, на работе тебе подскажут какой код лучше не писать.

    Выбор между пет проектом и работой с гитхабом: пишите пет проект и параллельно читайте исходники/фиксите баги интересующих вас проектов, для начинающего советую поискать программы в 3-15к строк кода. Но нормальный опыт даст только работа.

    В вопросе не указано, но если хотите работать в сфере программирования, то выбирайте область, в которой хотите работать и рассматривайте/пишите проекты в этой сфере. Если вы пойдете работать не в геймдев, то ваши тетрисы и змейки никому не будут нужны, т.к. можно просто найти этот код уже на десятках сайтов, коммиты в блендер наверное заинтересуют, но вас спросят, что именно вы делали и тд.
    Как по мне оптимальный вариант изучить требования вакансий в нужной сфере, изучить это, написать пет проект, который заинтересует работадателя и пробовать найти работу стажером/джуном.
    Ответ написан
    Комментировать
  • Какой ноутбук выбрать до 70к?

    @12rbah
    железе не особо шарю
    В таких случаях нужно посмотреть тесты и отзывы, если конкретная игра нужна то забиваете в гугл вашу видюху и название игры, пакета и тд. В вашем случае выглядит атк "amd radeon rx vega 10 дота 2/фигма/фотошоп". сейчас ноут найти с нормальной видюхой шансов мало за такую цену(да и возможно не стоит). В целом фотошопу/фигме вроде хватает встроенной графики так что можете брать этот ноут ну или похожий. Вам советовали макбук, ничего против них не имею, но по отзывам знакомых, у которые пользовались маками/не маками, говорят, что под мак обычно приходится подстраивать и остальные девайсы, вроде телефонов планшетов (там хорошая интеграция софта между устройствами). Т.к. например мак подружить с андроидом не всегда легко. Но выбирать вам конечно же.
    Ответ написан
    2 комментария
  • Как правильно спарсить xml в golang?

    @12rbah
    1) У вас неправильно составлена структура
    Сервис по генерации структур для html https://www.onlinetool.io/xmltogo/
    2) доступ к элементу будет выглядеть примерно так commandresult.Data[i].Items[i].count, с кодом думаю справитесь
    Ответ написан
  • Как в с++ добавить код в переменную?

    @12rbah
    В цикле запустите вашу программу, если нажата клавиша R, то цикл повторяется, если клавиша E, то выходим из программы.
    Ответ написан
  • Какой линукс лучше поставить для фронтенд разработки на слабый ноутбук?

    @12rbah
    В общем у меня была похожая проблема, линукс для разработки ide+браузер+докер+память для ОС и других(в общем обычно это занимает 5 гб памяти минимум у меня в системе, когда что-то в фоне запускаю или компилирую, само собой памяти остается еще меньше ) по памяти жрет в целом как и винда, тут несколько вариантов может вам помочь, сделать большой swap файл (система будет падать реже, но тормозить особо не перестанет), 2 вариант купить ssd и докупить хотя бы 4 гб оперативы (я выбрал этот вариант и 10 винда более менее без тормозов, а линукс нормально. ноут со старым i5 и 12 гб озу). 3 вариант использовать ПО, которое потребляет меньше памяти, для веба браузер нужен свежий поэтому тут вариант только открывать поменьше вкладок, редактор можете использовать саблайм или vscode если хватит памяти.
    И снова куча попутных обновлений.

    На такой машине не стоит обновлять всё сразу, вообще если обновляться не хотите лучше возьмите более старые версии ОС, т.к. часто они жрут меньше памяти.
    Ответ написан
    Комментировать
  • Генерация копии html страницы?

    @12rbah
    Ну наверное вам это нужно
    Ответ написан
  • Как перевести код в ООП c++?

    @12rbah
    Пожалуйста, помогите перевести эту программу в ООП!

    Это задание какое-то? Если нет, то тут особого смысла нет переводить в ООП. Можно создать класс, конструктор на вход принимает например массив интов и у класса есть функции getAverage, и тд., которые вы вызываете от объекта. Можете засунуть туда функций сколько пожелаете, но программы такого типа в целом не требуют какого-то сложного архитектурного подхода, т.к. очень легко масштабируются.
    Ответ написан
  • Как записать в файл строку и добавить к ней переменную типа интеджер?

    @12rbah
    s - это инт? Нельзя просто так к строке добавлять инт, нужно преобразовать число в строку через функцию itoa.
    Ответ написан
    Комментировать
  • Как разобраться с threading?

    @12rbah
    Помогите пожалуйста разобраться с потоками.
    А с чем помочь то? В комментариях всё написано даже слишком подробно.
    Ответ написан
  • Стоит ли ставить Ubuntu MATE на ноутбук?

    @12rbah
    Не будет проблем с драйверами и батареей и других проблем?

    Да как повезет, я 18 убунту ставил на ноут, слетали дрова на видеокарту, остальное в принципе по мелочи. Если wifi не встроен, то с некоторыми модулями бывают проблемы, аудио/видео проблем не было. Тут много зависит от ноута, т.к. с некоторыми проблем нет, а с некоторыми они будут через день. Попробуйте поставить особо все равно ничего не теряете
    Ответ написан
    Комментировать
  • Как автоматом декодировать json с текстом в разных кодировках?

    @12rbah
    1) проверьте является ли текст utf-8 или нетпример
    2) если нет перекодируйте 1251 в utf-8
    Ответ написан
    Комментировать
  • Как установить frappeframework на Windows 10?

    @12rbah
    Там написано же, что они только никсы поддерживают *nix system, so any Linux Distribution and MacOS, на винду просто так вы не поставите это скорее всего, возможно с какими то костылями можно заставить это работать, но не думаю что стоит.

    System Requirements
    This guide assumes you are using a personal computer, VPS or a bare-metal server. You also need to be on a *nix system, so any Linux Distribution and MacOS is supported.

    However, we officially support only the following distributions.
    MacOS
    Debian / Ubuntu
    Arch Linux
    CentOS
    Ответ написан
    Комментировать
  • Какой ИБП выбрать для слабого офисного ПК, чтобы работал без света?

    @12rbah
    APC Black-UPS 500 как вариант, стоит 7-10к, 10-15 минут держит, шнур только не теряйте от него
    Ответ написан
    Комментировать
  • Как сделать авто пробел в lineEdit?

    @12rbah
    Два варианта есть, для простого случая можно взять InputMask.
    Для сложных случаев используйте textChanged, когда пользователь будет изменяет текст, вы по этому событию вы берете текст из lineEdit, парсите его и подставляете все нужные символы, после этого заменяете новой строкой старый текст.
    Ответ написан
    1 комментарий
  • Виндовс на флешке?

    @12rbah
    могу ли я на нее установить Винду/другую ос/макос

    1) По винде, сам не устанавливал, но в поисковике выдает несколько вариантов дял установки.
    2) по другой ос, устанавливал убунту на флешку, всё работает, но месяца через 2-3 флешка помрёт скорее всего
    3) про макось не знаю
    Ответ написан
    Комментировать
  • Как сделать паттерн python?

    @12rbah
    Вот пример как сделать такой паттерн decorator с вашим кодом советую вам самому разобраться
    Ответ написан
    Комментировать
  • Парсинг и преобразование данных из Serial?

    @12rbah
    Как я понял нужно преборазовать строковое представление байта в число?
    Вот готовые решения решения на с++
    Можно и свой костыль написать для конкретно этого случая :
    1) проверяете строку на корректность
    2) разделяете на два символа
    3) преобразуете каждый символ в число
    4) первое число умножаете на 16, второе на 1
    5) складываете и записываете готовое число куда нужно
    Ответ написан
    Комментировать