Aricce, что-то вы непонятно чего хотите.
Формулы даты смерти, даже примерной формулы, не бывает. Существуют корреляции разного уровня, например мужчины в среднем живут меньше. Есть корреляция с большими выбросами в росте (карлики и люди сильно больше 2 метров роста очевидно проживут меньше в среднем) из-за проблем со здоровьем. Могут быть корреляции более сложные. Мне трудно сочинить для вас хороший пример, поэтому давайте пофантазируем на тему танкистов. Вроде как танкистов подбирали по малому росту и если есть какая-то корреляция рода войск с продолжительностью жизни, то эта корреляция будет и с ростом тоже.
И таких сложных корреляций очень много, мы не можем учесть все, потому что они не очевидны. А вот нейронная сеть может сузить разброс в некоторых случаях на основе каких-то многоуровневых неявных корреляций.
Но нужна огромная выборка для обучения. Речь идёт о сотнях тысяч и миллионах единиц размеченных данных.
Нейронная сеть не обязательно выдаёт дискретный сигнал, так что РЕШАТЬ вашу задачу нейросетями можно. Но РЕШИТЬ удовлетворительно -- не факт.
Есть такое понятие, как аппроксимация. У вас есть набор параметров (читай аргументов), и значение какой-то неизвестной функции. И таких кортежей у вас много-премного. Можно попробовать аппроксимировать ваше N-мерное многообразие какой-то функцией. Для простых плоских случаев это может быть, например, сплайн, или степенная функция, когда вы подбираете её коэффициенты и степени так, чтобы она максимально близко ложилась на ваше многообразие по среднеквадратичному отклонению.
Для больших размерностей ситуация сильно осложняется. Мне кажется это не ваш путь, даже если у вас в голове этот пример выглядит как адекватный первоначально поставленной задаче.
Резюмирую.
Если у вас не миллионы данных - забейте. Вам нейронки не помонгут.
Если вы не представляете какие требования и ограничения у вас по параметром ошибки в прогнозе, то, действительно, подбрасывайте монетку. Какая разница, если вы сами не знаете чего хотите?
Экспериментируйте. Если нейронки научили истреблять шакалов с довоенных фотографий и скоро научат снимать мультики и ставить балет на основе наскальной живописи,то ваша задача не выглядит как совсем уж бред. Правда.
Подтянитесь в математике. Нужно понимать что такое случайная величина, дисперсия, мат-ожидание, нормальное распределение.
Прочитайте Криптономикон. В этой задаче он вам не поможет, но чтиво захватывающее и может повернуть мозг в интересное русло.
Иван Шумов, вы слишком категоричны в суждениях, сударь.
Там, где можно применить кластерный анализ, вполне справятся и нейронные сети.
Вы сильно приуменьшаете значимость корреляций, а автор нигде не говорил о параметрах допустимой ошибки в прогнозе.
Вы верно подметили, что дата смерти - это, в общем-то, случайная величина, но у этой случайной величины есть свои сложные корреляции, есть мат-ожидание и дисперсия.
Кластерный анализ не позволит уловить сложные скрытые зависимости. Автор же не предоставил полный перечень данных, которые у него есть.
Может быть там среди них есть что-то, что сильно коррелирует с некоторыми группами риска: курение, профессия, хобби... Если у автора действительно большой обучающий размеченный датасет и невысокие требования к точности, то нейронка вполне может показать много сюрпризов и неожиданных корреляций.
вообще-то нейронку применить можно куда угодно. Вон люди свою биологическую применяют на каждом шагу. Ошибка - это вполне измеримая и контролируемая штука. Вполне можно хорошо учитывать корреляции с полом, индексом массы тела...
Обман водителей и оптическая навигация немного неклеются между собой. Если водила заглушил GPS, то забрызгать "нечаянно" камеру трекера вообще изи.
Нейросетью, к тому же, задачу навигации не решишь. Только, разве что, можно уточнить показания координат за счет анализа оптического потока.
Подключение к CAN-шине, периферийным датчикам, датчику топлива, датчикам открытия дверей, датчику работы двигателя и датчикам вращения колёс... всё это уже доступно в промышленных трекерах. Тут новизны не сыскать.
Тема про городскую инфраструктуру - это скорее про бэкенд и внешние интеграции. Устройство тут ни при чем.
Я переформулировал вопрос, адресовал вопрос сообществу, убрал ограничение на конкретный ресурс.
Вопрос касается спектра вариантов отношения администрации к упомянутой деятельности. Я понимаю, что даже в рамках одной организации могут существовать внутренние противоречия и разное отношение к данному вопросу.
Меня интересует именно опыт сообщества и возможные последствия.
Я удалил тег API из вопроса, но тег Телеграм оставил, поскольку вопрос касается именно этого мессенджера и его сообщества в первую очередь, в уж "Хабр Q&A" косвенно.
Спасибо за оперативную реакцию и своевременное предупреждение о нечаянном нарушении правил данного ресурса.
Спасибо, я подумаю над вашим предложением. Однако я собирался парсить не сами вопросы, а трекер и верхушку ленты для интерактивных уведомлений через бота. Почта в этом плане не так удобна.
Но в Правилах я явного обозначения позиции администрации к этому вопросу не увидел.
Более того, паразитирование, на мой взгляд, имело бы место, если бы я как-то монетизировал информацию или бота, но мне он нужен исключительно из соображений личного удобства пользования ресурсом. Если бы был штатный "уведомлятор" для Телеграма, я бы пользовался им.
Антон Муравьев, вы меня не поняли. Я говорил серьёзно. Это очень сильная точка зрения. Считается, что программа должна быть максимально простой для успешного и эффективного выполнения своей функции. При этом программа не должна стараться "выжить и что-то сделать любой ценой". Если что-то пошло явно не так, то правильнее безопасно и сразу упасть, чем успеть прилично попортить данные через полтора часа непрерывной работы на огромном датасете и залить в целевую БД частично некорректный ответ, который хрен оттуда потом вычистишь.
Антон Муравьев, я б на вашем месте защищался по-другому. Я бы сказал, что хорошая программа старается упасть сразу, как только что-то пошло не так. На мой выпад о том, что нет ассертов по другим критериям, я бы возразил в том смысле, что за параноидальными проверками в решении заведомо учебной задачи потеряется читабельность и понятность. Последнее, кстати, отличный гвоздь и в моё предложение относительно среза потенциально пустой строки. Судя по уровню автора вопроса, ему не очень понятен синтаксис условного оператора. Тонкости наших трюков ему не понять вовсе.
Антон Муравьев, если сначала ввели дату, а потом имя с инициалами и точкой, то у вас дата будет содержать копию фамилии. Понятно, что такой ввод, в общем-то, противоречит заданию, но код нужно в любом случае писать более надёжным, особенно если такого можно добиться простым использованием elif вместо if.
Чуть более спорной будет моя придирка к i[0]. Пользователь вполне может ввести пустую строку. В вашем случае будет исключение при обращении по индексу.
Лучше выработать у себя привычку всегда чуять такие тонкие места. Здесь можно было бы подстелить соломки так: i[:1]. Проверка по сути та же, но безопасная по отношению к пустой строке.
elman434, вам каждый раз удаётся виртуозно отвечать не проясняя до конца ситуацию.
Там вторая лебедка для закрывания? Или вы трос переставляете? У лебёдки храповик в одну сторону работает или переключается?
Ложка в мозге, иногда неопытные программисты неправильно работают с путями и делают неправильные предпосылки. К примеру, часто люди пытаются соединять пути как обычные строки конкатенацией. Иногда это делают не пытаясь анализировать абсолютный там путь или нет. Само собой, что добавив что-то слева от абсолютного пути мы получим какую-то ерунду в большинстве случаев.
Используйте pathlib. В современном питоне это встроенная библиотека. Она навязывает программисту более правильный способ работы с путями и вводит абстракции, позволяющие автоматически избежать некоторых проблем.
Ну и самое главное -- это очень удобно!
Формулы даты смерти, даже примерной формулы, не бывает. Существуют корреляции разного уровня, например мужчины в среднем живут меньше. Есть корреляция с большими выбросами в росте (карлики и люди сильно больше 2 метров роста очевидно проживут меньше в среднем) из-за проблем со здоровьем. Могут быть корреляции более сложные. Мне трудно сочинить для вас хороший пример, поэтому давайте пофантазируем на тему танкистов. Вроде как танкистов подбирали по малому росту и если есть какая-то корреляция рода войск с продолжительностью жизни, то эта корреляция будет и с ростом тоже.
И таких сложных корреляций очень много, мы не можем учесть все, потому что они не очевидны. А вот нейронная сеть может сузить разброс в некоторых случаях на основе каких-то многоуровневых неявных корреляций.
Но нужна огромная выборка для обучения. Речь идёт о сотнях тысяч и миллионах единиц размеченных данных.
Нейронная сеть не обязательно выдаёт дискретный сигнал, так что РЕШАТЬ вашу задачу нейросетями можно. Но РЕШИТЬ удовлетворительно -- не факт.
Есть такое понятие, как аппроксимация. У вас есть набор параметров (читай аргументов), и значение какой-то неизвестной функции. И таких кортежей у вас много-премного. Можно попробовать аппроксимировать ваше N-мерное многообразие какой-то функцией. Для простых плоских случаев это может быть, например, сплайн, или степенная функция, когда вы подбираете её коэффициенты и степени так, чтобы она максимально близко ложилась на ваше многообразие по среднеквадратичному отклонению.
Для больших размерностей ситуация сильно осложняется. Мне кажется это не ваш путь, даже если у вас в голове этот пример выглядит как адекватный первоначально поставленной задаче.
Резюмирую.