Всем доброго времени суток!
Получил тестовое задание в одной крупной компании на позицию аналитика (уже 4ый этап):
Есть набор научных статей (русские и английские), их около 100 штук, нужно провести наиглубочайший анализ всего этого дела и (самое важное) выдвинуть и проверить гипотезы. Анализ нужен именно текста, без каких-либо вдаваний в подробности написанного.
Очистил от всего лишнего. Разбил все на предложения/абзацы/страницы, посчитал распределение кол-ва предложений по числу слов/символов в нем, распределение кол-ва символов по кол-ву слов в предложении, отдельно для русского/английского текса, частотность предлогов, посчитал гласные/согласные, начинающиеся с гласных/согласных слова и многое многое другое.
Теперь про выдвижение гипотез. Я могу сказать, к примеру, что русские слова в среднем длиннее, чем английские. Но я никак не смогу принять эту гипотезу, я смогу просто привести вероятность данного события, и тут замкнутый круг: смотрю на график вижу максимум, выдвинул и принял за истину, понятно, что это не правильно.
Второй вариант, могу смотреть на распределение и говорить что-то о характере его, параметрах. Тут уже всё научно принимается. НО это кажется мне бесполезным и не информативным(
Вопрос: Может быть кто-то работал с подобными задачами и знает, что от меня хотят получить? Пример какой-нибудь дельной гипотезы подскажет?
hr таких подсказок не даст(
Спасибо
От вас хотят получить аналитику с вашим же подтверждением о верности гипотезы. Все гипотезы,которые вы выдвигаете должны быть неопровержимы,т. е.В ы должны уметь отстоять свою точку зрения и убедить почему приняли именно этот вывод
Задача довольно открыто поставлена, тут уже полет мысли( Мне бы понять в каком направлении гипотезы выдвигать и если это, например, "что русские слова в среднем длиннее, чем английские", то как принять/опровергнуть её, пример такого доказательства
"открытость" задачи это тоже часть задания, в таком случае. Проверка, в каком направлении Вы думать будете. Я бы на Вашем месте подумал, как результаты анализа могли бы пригодиться в бизнесе работодателя в целом и в работе отдела в частности, и в соответствии с этим строил гипотезы и проверял их