Только если данные перед этим подготовить — сделать нормализацию. MySQL может и MD5 посчитать, это ж не значит что его стоит для этого использовать. Нужно не задачу подстраивать под инструменты, а инструменты под задачу.
Чтоб посчитать количество одинаковых слов MySQL вообще не нужен. Все слова кидаем в файл/память, создаём хеш слов, проходим по каждому слову, делаем $words[$word]+=1. Или MapReduce если памяти не хватает.
Вкратце: невозможность построения эффективных индексов, чтение объектов не блоками, а полями, монструозные запросы с большим количеством посредственно оптимизированных джойнов.
Простите, но каким образом задача хорошо ложится на РБД? Подобная задача — это как раз каноничный пример, который неплохо решается schemaless nosql.
В РБД придётся либо делать сотни таблиц, для хранения каждого типа объекта, либо использовать не очень-то производительную EAV.
Отказаться может, но если откроете диспут, пейпал скорее всего будет на вашей стороне, и продавец это должен понимать. Если посылка действительно потерялась — продавец получит страховку, и ему не составит труда вернуть вам деньги. Подождите еще немного, и за 1-2 дня до лимита смело открывайте диспут — после этого вы в течение 20 дней общаетесь с продавцом через пейпал, пытаясь найти решение проблемы. Если вы не приходите к компромиссу, ближе к концу этого срока любой из вас может попросить пейпал рассмотреть ваше дело и решить исход. Поскольку вы оплатили товар, а трекинг показывает что он даже не доехал до России — пейпал скорее всего решит дело в вашу пользу (вот только 40$ скорее всего вернуть не получится).
Я не говорил, что наличие В/О является достаточным условием, для того чтобы называться программистом. Я говорю, что оно является необходимым. Не бывает программистов без математического образования, а его дают только в ВУЗах (вероятно, есть некоторое количество самоучек, но их количество пренебрежимо мало).