т.е. мне просто создать таблицу в бд с n полей одно поле будет содержать url и по этому полю построить индекс? Дальше запросом определить есть ли в базе запись или нет?
я не совсем понял как это мне поможет. У меня есть файл с 100 000 строк. каждая строка это уникальный url. При парсинге я получают N колличество (от 0 до 20) новых url . И каждый из них я должен сравнить с 100 000 предыдущих (+ этот же файл будет увеличиваться с каждым появлением новых уникальных url). Или сравнение будет достаточно в python? Нужно что бы все это отрабатывало в течении несколькоих секунд максимум. Вот поэтому я и задумался о сравнение хешей средствами базы данных. Ну либо я чего то не понимаю.
1.Зачем нужен thin?Какая его роль?(примерно представляю, но кажется не то представляю)
это "прокладка" менду nginx и ruby, задача которой отдать понятную для nginx. nginx работает с http запросами просто.
2.Nginx без модуля thin не сможет запустить remine?
не будет
3.Thin устанавливается как модуль через gem install thin, нужно ли устанавливать apt-get install thin его таким образом?
нет не нужно, достаточно поставить через gem
хорошо, я понял, что это менеджер, который создается к каждому классу автоматически или вручную, но а где конкретно в коде это происходит? где мы создаем под именем object?
Alejandro Alajuela: смотря в каком плане понимать "легкое". 1с для этой задачи подойдет без доработок. Оно конечно не бесплатно, если не прибегнуть к хитростям.
arsjester: тут проблема не в поверхности а контроллере самого диска. вообще контроллер сам определяет "плохие" ячейки и выводит их из эксплуатации засчет резервных. Если и резервные кончились - блочит запись. Кстати посмотри, может есть новая прошивка на контроллер диска.