xmoonlight, Да мне скрывать нечего. Вот, копия того ответа:
Не путайте валидационный набор с тестовым.
То, что вы называете "тестовым" обычно - это набор, используемый в соревнованиях, когда участники строят модель, а потом организаторы откртывают некоторые данные, неизвестные ранее и смотрят, какую точность модель на этих данных дала. Лучшие получают плюшки. Все.
В реальных ситуациях нет у вас ничего, кроме датасета, который вы собрали и разметили. О каждой точке известны его Х и Y. И вам надо построить некоторую модель и верить, что она сработает и на других данных, которых у вас пока нет. А как это сделать?
Идут на хитрость. Берут весь датасет, делят его на две части - учебную и тестовую. Учат модель на учебной, а проверяют - не тестовой. Получили хорошие результаты на тестовой - верят, что и на неизвестных данных модель будет работать хорошо. Ведь когда она училась на учебных данных алгоритм ничего не знал о том, какие будут тестовые.
Иногда эту схему усложняют. В разных вариантах - например, делают кросс-валидацию, когда описанную выше процедуры повторяют множество раз, каждый раз меняя разбиение датасета на учебную и тестовую подвыборки. Иногда - сначала делят на две части, а потом одну из них - как правило большую - используют как датасет и делают там валидацию или кросс-валидацию. А когда убеждаются, что модель получилась достойная "контрольным выстрелом" на ранее отложенной части окончательно убеждаются в ее (модели) работоспособности.
Выберайте, что вам действительно надо. И главное - зачем.
Конечно, за что же тут спасибо? За то что ответил на ваш вопрос - в точности на тот, который вы в начале написали. А если вы что-то недоговорили, неправильно написали, не ту свою мысль высказали - то разумеется, вы не обязаны никого благодарить за потраченное на вас время.
Какое отношение ваш голосовой помощник имеет к вопросу, который вы первоначально задали?
hikionori, А чем ваш голосовой ассистент будет отличаться от обычной озвучки ответов Википедии, которая уже давненько функционирует и доступна каждому? И как правильно сказали - это не ИИ, а весь "интеллект" тут сведен к поисковому запросу Гуугла.
а от этих параметров ведь и зависит что будет в числителе... - вы прикалываетесь?
Вам тут уже целым форумом объясняли, что такое среднеквадратичное отклонение. Так и не дошло?
askhabaliev, Классно вы учитесь - с перерывом в 4 месяца. Так много чему научишься.
Ну, а ваши вопросы - это вообще зашквар. Т.е. книги вы не читаете принципиально.
Но специально для вас. Если у вас в одной выборке 1К элементов, а в другой 100К, то отличаться они как раз практически НЕ будут. Ну а дальше - очередной перл: дисперсии и стандарнтые отклонения 2х выборок будут отличаться потому что в знаменателе будет N а числители у обеих выборок будут одинаковыми" - фантастическое заявление после полугода знакомства с темой. Как раз в числителе у них будут стоять абсолютно, примерно в 100 раз отличающиеся значения.
"Думаю, повысить квалификацию, и поучить проектному менеджменту и консалтингу."
Кого вы собрались учить проектному менеджменту и особенно - консалтингу?
shadrap, Не за что.
По вашему рисунку при такой тривиальной постановке - зачем замолачиваться? Достаточно рассматривать значения в двух последних точек, аппроксимировать их прямыми и смотреть, было -ли пересечение. Нахождение точки пересечения для прямых, каждая из которых задана в двух точках - задача из геометрии за 6 класс и из аналитической геометрии - из первых пары-тройки лекций.
FlashBoy,
А что мне тут проверять, я это видел даже не запуская код. Вопрос в том, чего именно желает ТС? "СОЕДИНИТЬ" два числа - это не "СЛОЖИТЬ" два числа.
А что вы вообще имеете ввиду под странным словом "соединить"?
Варианты ответа:
-просто сложить.
-написать оба числа одной строкой.
-написать два числа через символ "+"
-написать два числа одно за другим.
Дайте пример ожидаемого ответа.
Про то, какую роль тут играет рандомность второго числа - я даже вопроса не задаю.
Но программирования не терпит небрежности. А небрежность в программировании начинается с небрежно заданных вопросов. Уточните, что-бы получить корректный ответ.
Jemoro, А то, что дядя Saboteur дело говорит. И знания имеет в теме о которой говорит. И опыт реальный - и профессиональный и жизненный - тоже.
И по 7 языков знать - это не фокус. Фокус уметь на них программировать - а это на каждом языке несколько лет опыта. И это вовсе не одно и то-же, как об этом думают новички.
То что вы школьник - это не недостаток. Просто "готов сидеть и учить по 7-10 часов в день и каждый день" - это как? Школу бросим? Аттестат - да кому он нужен? Про ВУЗ вообще не думаем? Ну, про то, как себя кормить в 15 лет вообще мало кто думает. Вот и получается, что жизнь - она сложнее, чем кажется в 15 лет.
К тому-же 7-10 часов каждый день - так не бывает. Ну вот просто не бывает и все тут. Реально - 4-5 часов в день. Т.е. это время, когда любой мозг в состоянии усваивать новый материал. Остальное - только видимость учебы, с коэффициентом полезного действия близким к нулю. Ну повторение, ну закрепление, да и то - чисто формальное. Нет, конечно пару недель можно так посидеть, поучиться. Даже может пару месяцев. Но потом - либо возненавидишь программирование и все, что с ним связано, либо сразу надо готовиться в психушку. И это - тоже правда жизни. О которой в 15 лет просто не думают. А вот многие люди по старше - такие ситуации имели возможность наблюдать.
Вообще-то есть такое известное правило 10000 часов. Погуглите. Интересно. Как вам тут сказали, вы своим списком покрываете сразу три профессии - сисадмин, программист, криптограф. Конечно, связанных между собой - поэтому умножаем не на три, но тем не менее. Вот и считайте, сколько времени надо на все это.
Ну и последнее, в чем Saboteur тоже прав. О том, что у вас "отличная память, хороший склад ума и всё схватываю на лету." судить можно только ПОСЛЕ того, как вы покажете результат. Школьные знания - это вообще ни о чем. Сколько "чудо школьников" моментально "сдуваются" как только из школьной "теплицы" попадают на первый курс университетского "открытого грунта". Так что я бы посоветовал бы быть скромнее и реальнее оценивать свои способности и таланты.
Настя, Я конечно прикалывался, уж простите. Но кандидат в бакалавры, пришедший на форум за темой своей дипломной работы - это несколько странно. У вас есть руководитель - в первую очередь надо обсуждать этот вопрос с ним.
Что вам помешало?
Для начала - корректно расставить знаки препинания, что-бы ваш вопрос понять было возможно.
Потом уточнить - в каком "блокноте" выводится? В Jupiter, в Notebook ++, в блокноте Windows.
В-третьих - уточнить где "там еще".
В-четвертых- откуда нам знать, в каком приложении вы запускали свой скрипт.
В-пятых - Что такое "нажать на блокнот"?
После этого может быть кто-то вам и поможет.
Evtihij, Думаю тот, кто использует служебные ресурсы (устройства доступа к интернет, сетевой трафик и пр.) в личных целях. Особенно если запрет на это прописан в договоре.
Hopps, Так я и начал с того, что попросил вас уточнить ваш вопрос. Потому как формулировки в нем весьма сомнительны. Вместо этого, вы обвинили в некомпетентности своего преподавателя. Это - конечно - не агрессивность, а некоторое другое качество.
А на вопрос - вы так и не ответили.
С переводом и уверенностью в его непогрешимости - вот тут вы категорически ошиблись. Я тоже не из РФ, и мой рабочий язык - не русский. И по своей деятельности я постоянно вижу, как вопросы - особенно новичками- переводятся с языка на язык. (ну, примерно, так как ваш). Поэтому и попросил вас учесть этот факт. Если вы видите в нем агрессию или сомнение в вашей высокой компетенции в области перевода - это вообще-то говоря ваши проблемы. Оставайтесь "стойкой" в своей уверенности. Может - кому-то и захочется "неагрессивно" распутывать то, что намешано в вашем вопросе.
Удачи.
Hopps, Повторяю вопрос - именно к вам и вашей фразе "как задать правильные параметры?":
Какую функцию вы собрались использовать? В какую функцию вы собрались передавать ("задавать") параметры?
P.S. Возможно, если вы приведете вопрос на языке оригинала, тут найдется кто-то кто сделает более адекватный перевод. (даже по вашей фразе "нужно ввести значение коэффициента корреляции и значения параметров модели." видно, что переводчик вы мягко говоря - не очень)
И еще, по одномерной матрице построить многомерную регрессию - как то очень непрофессионально. Думаю, что ваш преподаватель имел ввиду что-то совсем другое, что безвозвратно утеряно в результате перевода. Ну, например, что у вас есть не набор данных, а временной ряд. Но это совсем другая история.
Я вам могу что-то посоветовать, или подсказать. Прочитать лекцию по теории проверки гипотез прямо на форуме - мне как-то не с руки.
ДВА раза я уже рекомендацию вам давал.(тут: Как соотносится дисперсия с sd? потом вот тут https://qna.habr.com/answer?answer_id=1719521#answ...) Читать учебники. Вы же ограничиваетесь тем, что откуда-то выдираете какой-то обрывок знаний, и хотите, что-бы вам тут из этого обрывка сделали хорошую базу. Так не бывает.
Впрочем - вспомнил, вы мне потом посоветовали попить валерьянки (Может ли sd=2, если размер выборки 25?)Хороший совет. Воспользуюсь. Но уж и вы воспользуйтесь моим - при вашем уровне знаний, повторить математику хотя бы класса с пятого.
Не путайте валидационный набор с тестовым.
То, что вы называете "тестовым" обычно - это набор, используемый в соревнованиях, когда участники строят модель, а потом организаторы откртывают некоторые данные, неизвестные ранее и смотрят, какую точность модель на этих данных дала. Лучшие получают плюшки. Все.
В реальных ситуациях нет у вас ничего, кроме датасета, который вы собрали и разметили. О каждой точке известны его Х и Y. И вам надо построить некоторую модель и верить, что она сработает и на других данных, которых у вас пока нет. А как это сделать?
Идут на хитрость. Берут весь датасет, делят его на две части - учебную и тестовую. Учат модель на учебной, а проверяют - не тестовой. Получили хорошие результаты на тестовой - верят, что и на неизвестных данных модель будет работать хорошо. Ведь когда она училась на учебных данных алгоритм ничего не знал о том, какие будут тестовые.
Иногда эту схему усложняют. В разных вариантах - например, делают кросс-валидацию, когда описанную выше процедуры повторяют множество раз, каждый раз меняя разбиение датасета на учебную и тестовую подвыборки. Иногда - сначала делят на две части, а потом одну из них - как правило большую - используют как датасет и делают там валидацию или кросс-валидацию. А когда убеждаются, что модель получилась достойная "контрольным выстрелом" на ранее отложенной части окончательно убеждаются в ее (модели) работоспособности.
Выберайте, что вам действительно надо. И главное - зачем.