Вы, или мешаете всё в кучу, или не внимательно читаете то, что я вам пишу... Возможно еще вопрос морали для вас неактуален. Да, я получу этот опыт. Получу для того, чтобы заработать деньги. Ок. Вот дальше я не понимаю. Чем заказчик заслужил то, что я буду учиться за его деньги? Вам не кажется, что попахивает?
Причем здесь потребности клиента? Я хочу получить практический опыт, не имея оного за спиной на текущий момент. Если я приду к реальному заказчику и скажу ему, что я спец в анализе данных, и договорюсь, что он мне денег забашляет, - не кажется ли вам, что это несколько не честно?
Я не случайно написал "как начать в практике" - база у меня есть. Но на Kaggle надо довольно долго разбираться с самой задачей. Я поэтому и спросил - есть ли что попроще?
Ну либо у вас в таблицу пишутся данные в другой кодировке, либо что-нибудь еще. Попробуйте либо в начале вашего скрипта устанавливать кодировку, либо конвертируйте данные через iconv().
Ну так а что вы хотите? Попробуйте циферки пораспознавать, думаете просто так?) Не нравится распознавание текста или картинок - займитесь видео или аудио.
Просто, понимаете, люди, когда заходят на toster, обычно не берут с собой читалку мыслей топикстартера. И определить чего же вам хочется, можете по сути только вы.
Никакой ведь агрессии. Просто фраза "Не хочется заниматься изъезженным" как бэ намекает, что задачки по NLP вы за завтраком решаете... Там полным-полно неразрешенных задач, в которые и въехать-то сразу не получится.
По поводу проверки при заходе - мысль здравая вполне. Но! Представьте, что у вас сотня услуг - все их проверять? Есть удобный инструмент для таких задач, который справится и быстрее и ловчее, без лишней нагрузки.