Задать вопрос
  • Хочу парсить большое число книг < 17 века в поисках информации об исчезнувшем народе, как решить задачу?

    saboteur_kiev
    @saboteur_kiev
    Валерий Мамонтов,
    1. "Память народа" содержит огромное количество рукописного текста, просто громадное.

    Вот там просто сканы (нераспознанные) и лежат.

    2. Любые сканы содержат строки. С технической стороны нет никакой разницы между текстом, содержащем поименные списки (или строки), и текстом, содержащем летопись народов. И там и там набор символов.

    Если знать что и где лежит, например номер части, имя командира, которое можно заранее ввести, то можно сканировать и сравнивать с готовыми образцами из базы. Таким образом частично можно автоматизировать распознавание части и командира. Но не все остальное.

    3. Документы Второй мировой войны, загруженные в эти проекты, пусть и современные, но, повторюсь, содержат рукописный текст, в том числе и на немецком языке. Смею предположить, что книги 17 века будут отличаться лишь набором символов, а по читабельности будут многократно превосходить любой современный рукописный текст.

    Вы видимо не работали с программами распознавания. Они очень активно используют работу со словарем и грамматикой. Если непонятно какое слово, подходящие варианты ищет по тезаурусу, по грамматическому словарю и это дает весьма немалый процент качества распознавания.

    В случае 17 века, это совершенно не современный язык, с кучей отклонений и в начертании и в грамматике. А еще и в качестве исходного материала, ибо 300 лет это не 50.
    Кроме того, для документов второй мировой существовали конкретные напечатанные материалы с той же статистикой, откуда можно было заполнять готовую базу, например состав бойцов и так далее, что сильно облегчает распознавание.

    4. Как я понимаю, полнотекстовой поиск в современных СУБД построен вокруг тэгирования.

    Эм.. вроде как вообще тегирование не причем. Искать по тексту можно вообще без всяких особых технологий, но это будет очень долго. Поэтому весь полнотекстовый поиск в современных СУБД основан на индексировании, чтобы ускорить процесс.
    Но чтобы искать по тексту, индексировать можно распознанный текст, а не сами сканы.
  • Как организовать хранение личной информации (аккаунты, календари, подписки и т.п.)?

    saboteur_kiev
    @saboteur_kiev
    ну визуализировать разные вещи можно в разных программах. Можно и в фотошопе картинки рисовать и таблицы в экселе.
    Но зачем держать одну схему для истории походов к стоматологу и список банковских карточек? Это же разные и никак не связанные вещи.
  • Как добиться правильного ответа во втором тесте программы?

    saboteur_kiev
    @saboteur_kiev Куратор тега Python
    Сергей Золотарёв,
    Ну напряги голову и еще раз подумай, где именно у тебя выполняется условие:
    "Если на карточке число, не кратное ни трем, ни пяти, или наоборот, кратное им обоим, то очков не получает никто"

    А еще точнее вот эта часть "или наоборот, кратное им обоим"

    Намекну: У тебя проверки на это просто нет.
  • Как добиться правильного ответа во втором тесте программы?

    saboteur_kiev
    @saboteur_kiev Куратор тега Python
    В Интернете не могу найти ответ на вопрос о том, как решить вариант, который вы мне предложили.

    Может быть потому, что задачи нужно решать, а не искать готовые ответы, которые вы даже проверяете на логику?

    Давайте еще раз.
    if card % 5 == 0: fgmr += 1
    elif card % 3 == 0: tgmr += 1


    Если число кратно и 5 и 3, что получается, если у вас только такие два условия?
    А что должно получаться, согласно условиям задачи?
  • Как добиться правильного ответа во втором тесте программы?

    saboteur_kiev
    @saboteur_kiev Куратор тега Python
    Сергей Золотарёв, Вам нужен не какой-то знак, а логика.

    Напишите блок с условиями по-русски, на псевдоязыке чтобы руками по нему пройтись и подумать как он должен выполняться. Типа так:

    Если ( тралаля) то (труляля)
    Иначе (блаблабла)
  • Хочу парсить большое число книг < 17 века в поисках информации об исчезнувшем народе, как решить задачу?

    saboteur_kiev
    @saboteur_kiev
    Валерий Мамонтов, Уважаемый Валерий Мамонтов, если вы посетите страницу проектов, вы увидите что подавляющее большинство документов представляют собой просто сканы. Без распознавания их в полный текст.
    (например https://pamyat-naroda.ru/documents/view/?id=200000...)

    Кроме того, документы второй мировой уже написаны современным языком, и даже могут быть полностью и частично напечатаны, что облегчает распознавание, и при наличии множества живых рук и глаз, их можно протегировать, что позволяет выполнять простейший поиск, но никак не полнотекстовый.

    Древние же
    рукописи
    распознавать крайне непросто - начиная от нестандартных почерков, оформлений, заканчивая тем, что язык у них может быть
    какой угодно
    , включая мертвый.
  • Хочу парсить большое число книг < 17 века в поисках информации об исчезнувшем народе, как решить задачу?

    saboteur_kiev
    @saboteur_kiev
    krakaka, Потому что если бы подобное можно было легко автоматизировать, все подобные книги уже были бы отсканены и переведены в текст, особенно учитывая количество разнообразных исторических проектов.
  • Как перекинуть порты?

    saboteur_kiev
    @saboteur_kiev Куратор тега Linux
    На роутере пробрасываете порт на Windows-10
    На vmware настраиваете проброс нужного порта внутрь вашего Linux Ubuntu
  • В сфере IT для новичков нет перспектив?

    saboteur_kiev
    @saboteur_kiev Куратор тега Карьера в IT
    У-у-у, таких наивных полным полно, согласен.

    Суть в том, что их не просто полно а очень-очень полно. А вдобавок на уровень джуниора можно пройти в принципе с небольшим багажом знаний. И даже пройти испытательный срок и кое-как крутиться в теме.
    Как и во многих областях, в ИТ есть сложные проекты и несложные. Есть своя политика, есть свои сложности с тем, чтобы уволить некомпетентного специалиста.
    Все это приводит к тому, что новичками рынок переполнен, а рабочими местами для новичков - нет.

    С лета я уже подзабил на IT, продолжаю лишь делать для себя 3D-модели в Blender. И получается классно

    Неплохое направление. Многие идут в дизайн и моделирование совершенно без художественных навыков, считая что за них рисовать будет редактор. Если у вас наработано рисование, легко улавливаете нужные пропорции и фигуры в движении - прекрасный выбор.
    Главное не забывайте посматривать где есть вакансии по этому направлению и осваивать инструменты и технологии которые тут используются.
    Можно развиваться и в рисовании и анимации. В ютубе полно поделок типа обучающих видео или маленьких мультфильмов для детей совершенно "домашнего" качества. А для практики - неплохо.
  • Как подготовиться к ВОШ по информатике?

    saboteur_kiev
    @saboteur_kiev Куратор тега Программирование
    Айнур Низамов, Никто не должен и не будет "учить". Но подсказать контакты, материалы - тренер вполне мог.

    Ну или самостоятельно нагуглить контакты? Неужели у олимпиадников нет своих групп в вк, или еще где?
  • В сфере IT для новичков нет перспектив?

    saboteur_kiev
    @saboteur_kiev Куратор тега Карьера в IT
    Vilmof20,
    В идеале, да. Но я такой возможности не имел.

    Никому не интересно. Каждый может рассказать свои трудности в жизни.

    Я вообще сомневаюсь, что у человека у которого были все возможности, что-либо получилось в жизни - обычно такие вырастают ленивыми и неспособными
  • В сфере IT для новичков нет перспектив?

    saboteur_kiev
    @saboteur_kiev Куратор тега Карьера в IT
    Сергей Горностаев, не, я просто не Сергей Видякин =)
    А Епам наверное ничем не хуже и не лучше других крупных аутсорсов - там как везде все зависит от конкретного проекта.
  • В сфере IT для новичков нет перспектив?

    saboteur_kiev
    @saboteur_kiev Куратор тега Карьера в IT
    Сергей Горностаев, Не совсем понял откуда в этом треде появилось мое имя, но я никогда не работал в EAPM, хоть и естественно есть там знакомые.
  • В чём может быть ошибка в скрипте?

    saboteur_kiev
    @saboteur_kiev Куратор тега Linux
    Выполните
    dos2unix <имя скрипта>

    у вас видимо скрипт в винде был сделан, и надо исправить виндовые окончания строки на линуксовые
  • В чём может быть ошибка в скрипте?

    saboteur_kiev
    @saboteur_kiev Куратор тега Linux
    Точно запускаете именно этот скрипт, или у вас он несколько отличается?
    `for 1 in ${routers[@]}; do

    непонятно почему в ошибке указан 1, а не r как в скрипте выше.
    Может быть список routers у вас другой, пробелы где-то пропущены перед/после скобок?
  • Как подготовиться к ВОШ по информатике?

    saboteur_kiev
    @saboteur_kiev Куратор тега Программирование
    Если вы уже участвуете, у вас должен быть тренер или контакты организаторов. У них могут быть связи.
    Они могут подсказать лучше.
    После завершения школы никому особо не интересно что там за олимпиады и что там за задачи, поэтому найти среди взрослых людей ответы на ваши вопросы можно разве что кто-то участвовал в таком в недалеком прошлом.
  • Б/у книги по программированию. Где купить?

    saboteur_kiev
    @saboteur_kiev Куратор тега Книги
    Sanikyer, Распечатаьт можно в ближайшей типографии. Должно быть не слишком дороже покупки БУ книг.
  • Важно ли, какой диплом предъявить работодателю?

    saboteur_kiev
    @saboteur_kiev Куратор тега Карьера в IT
    Alexanderietz,
    Вы умеете читать? Я на всякий случай повторю еще раз:
    Представьте что вы живете в реальном мире. Выгляните на улицу. Видите там много зданий. В каждом может быть какая-то фирма. В каждой фирме сидит человек который может принять на работу.
    Вы думаете они все действуют заодно?
    Что все работодатели регулярно собираются на заседание, где решают с какими дипломами кого принимать а кого нет?


    И выделю еще раз основную мысль.
    В мире МИЛЛИОНЫ компаний.
    В каждой компании могут быть СВОИ условия.
  • Как поступить в ФФиО СПбГУ ИТМО?

    saboteur_kiev
    @saboteur_kiev Куратор тега IT-образование
    Запиши список вопросов на бумажку, возьми видеокамеру или друга со сматрфоном, подойди прямо в ИТМО и перехвати 20-30 студентов/студенток прямо там.
    Сделай опрос.
    Получишь ответ непосредственно у тех, кто там учится.