MrMalibu, Т.е. вы претендуете на позицию очередного консультанта? :-)
Донести-то не сложно. И книг на эту тему написаны тысячи. И можете быть уверены, что 99% стартапперов эти книги читали, на курсы ходили и пр.
Ну так сопоставьте эти факту с фактами успеха стартапов - и ответ станет оччевиден.
А про "отмазки" - ну так понимание того, что в жизни "все не так" - это как раз реальный показатель опыта руководителя, того, который действительно "находил ответы". А не размахивал сертификатами-дипламами.
Ринат Бакиев, А что значит "извращаться"? Да, в игровом движке КаМаз может летать и прыгать через овраг. А при настоящем моделировании вы должны учитывать и то, что расход топлива КаМаза в гору и с горы могут быть разными, и что у него не нулевой радиус поворота, и что груз из кузова всыпается не молниеносно. Ну, хотите играть в игры - играйте. Хотите что-то моделировать и потом по этой модели делать прогнозы или управлять процессом - моделируйте. Дело-то ваше.
Задача "кластеризация текстов по тематике" - решаемая. Но весьма не просто. Уже как-то писал - новостные агенции на этом зарабатывают (экономят) очень серьезные деньги. Так что пробуйте найти по указанным поисковым словам. Ну, или сами пишите :-), поскольку в открытом доступе не встречал.
iordania, Каким образом тогда находят оптимальный путь, что-то среднее ?
В очередной раз повторяю. В многокритериальных задачах нет однозначно оптимального пути. Да и чего-то среднего нет. Там свои методы. Какие - я перечислил выше. Хотите - ИЗУЧАЙТЕ и пользуйтесь. Хотите - не изучайте и считайте своих полтора землекопа.
iordania, Получается если path в моём случае это время в пути то его достаточно сложить с временем ожидания, и далее посчитать коэффициент по отношению к цене? - делайте, только потом не говорите, что это я вам такого насоветовал. Мне будет стыдно, тем более, что я вам такого не советовал.
Я не знаю, что такое "время ожидания", я не знаю, можно-ли его складывать со временем в пути. Если это время ожидания, которое тратится на обязательную стоянку автобуса - это одно. Если это время ожидания такси - это совсем-совсем другое (вероятностная величина) . Если это время стыковки рейсов - это третье. Так что со складыванием я бы вот просто так не горячился.
Тем более я не знаю, что будет если какое-то время поделить на цену? (Не ну задачу про полтора землекопа все, конечно, помнят, и что людей делить на время нельзя. А тут время на деньги - как бы очень хочется, но можно-ли?)
Ну поделил я 100 минут на 20 копеек, получил 10 попугаев. Поделил 20 минут на 20 копеек - получил 1 попугая. Что "лучше"? И почему? Что мне интереснее, трястить 100 минут или пролететь путь за 20? На сколько для меня критично, заплачу я при этом 10 или 20 копеек? А если при этом еще "ждать" под палаящим солнцем? То может 10 минут на сковородке или при 40-градусном морозе забьют всю экономию денег и даже перевесят 100 минут в экспрессе под кондиционером?
iordania,
Ну, надеюсь, вы понимаете, что ваша задача сформулирована так, что дать осмысленный однозначный ответ невозможно. Вот простейший пример - два пути из города А в город Б.
Первый- цена проезда - пусть 20 тугриков, расстояние 200 км, время доезда 3 часа.
Второй -цена проезда 30 тугриков , расстояние 250 км, время доезда 2 часа.
Какой из этих путей "лучше" ( оптимальнее, предпочтительнее и пр) ?
И надеюсь, вы уже изучали - впрочем, на разных как-бы курсах этому вряд-ли учат - что такие многокритериальные задачи имеют совершенно другие подходы к решению - множества Парето, методы свертки критериев, методы последовательных уступок, методы целевого программирования и пр.
Поэтому вы меня неправильно поняли. Мой посыл был такой - сначала разбираться с семантикой задачи, а уж потом под него искать метод. А никак не наоборот.
Нет, об упрощении там речь не идет. Отличие в сотых-тысячных при диапазоне от 0 до 1 ничем не лучше и не хуже отличие на сотню-тысячу при диапазоне от 0 до 100000.
Основные причины я обозначил в ответе. Что-бы их понять, надо в тему углубиться. Все-таки попытайтесь ИЗУЧАТЬ предмет своего интереса на регулярной основе, и не по статейкам в веб, даже на Хабре, а не выхватывать отдельные факты.
Ну вы же в чудеса не верите . Например - на одном графике внятно отобразить десяток разных параметров - это только чудом (включая всякие перекрытия или прозрачности)..
Один график - один, два, максимум три параметра. Больше они даже восприниматься не будут. Просто попробуйте на карту погоды посмотреть, где отображена температура, осадки, в лучшем случае - направление ветра. Все. Ибо дальше - только вредить.
А вот если вам на основе этих данных надо делать некий софт, который - например - должен нечто предугадывать в промежуточных точках, или распознавать источник, влияющий на изменения параметров (ну, на что фантазии хватит) - тогда вам картинка как таковая и не нужна. Все делается через математику. А картинки - только для примерного отображения (например - те же один два параметра, что-бы показать их корреляцию).
Вот как-то так.
инженер знающий предметную область и практический дата саенс будет гораздо более востребованней чем чистый математик с хорошим знанием тервера и так себе навыками в питоне. А я где-то говорил что DS-аналитик не должне знать предметную область? Вот не далее, как вчера я написал про это в ответе на другой теме: Что можно добавить в портфолио/резюме DS/ML инженеру?
Но я также считаю, что умение надевать скальпель и белый халат и знать четыре лекарства - не делает из человека врача. Если кто-то прочитал перед сном уголовный кодекс - это не делает из него юриста. Умение вставить в разьем или даже обжать коннектор - не делает из человека сисамдина. Знание синтаксиса языка программирования - не делает из сисамдина программиста. А знание вызовов двух десятков методов из трех библиотек - не делает из программиста специалиста по DataScience.
Впрочем - у каждого свои взгляды. Основанные на его личном опыте в той или иной сфере деятельности. А прислушиваться или нет к этому мнению и какому мнению больше доверять - тоже каждый решает сам. Исходя из своего опыта. На этот раз - просто жизненного.
dimon223, Какой апломб. Именно так. И как не знание того, что такое IP-адрес для айтишника, так и не знание математики для Data Science. Ну, что-бы было понятно, теорию вероятностей тоже не спрашивают на собеседовании, но без нее в DS - как на том рисунке выше - только коэффициенты наугад перебирать. Поэтому я и поинтересовался квалификацией коллеги-советчика. Советую вопрос типа "что ты несешь" задать ему.
Донести-то не сложно. И книг на эту тему написаны тысячи. И можете быть уверены, что 99% стартапперов эти книги читали, на курсы ходили и пр.
Ну так сопоставьте эти факту с фактами успеха стартапов - и ответ станет оччевиден.
А про "отмазки" - ну так понимание того, что в жизни "все не так" - это как раз реальный показатель опыта руководителя, того, который действительно "находил ответы". А не размахивал сертификатами-дипламами.