• Здравствуйте, как получить объекты AWS S3, зная только теги?

    @populov
    Поздний ответ, но всё же: S3 не индексирует тэги (их можно получить как метаинформацию объекте) индексирует только ключи. Другими словами, по тэгам S3 искать не умеет, наоборот, когда ты уже нашёл объект, можно получить тэги.
    Это значит, что по тэгам можно искать двумя способами:
    1. Перебором всех объектов => медленно, дорого
    2. Хранить тэги в какой-то своей базе (своя табличка в БД, XML, JSON-файл или что-нибудь типа Redis): запоминать тэги при сохранении объекта на S3; при поиске сначала искать ключ по своей базе, а затем получать объект из S3 по ключу.

    P.S.:
    Александр это всё ссылки на доки, не дающие прямого ответа на поставленный вопрос.
    Ответ написан
    Комментировать
  • Аналог для Яндекс.Сервер (продукт для корпоративного поиска)?

    @populov
    Вопрос старый, но проблема для многих ещё актуальная, поэтому порекомендую парочку продуктов:

    У Гугла есть Google Enterprise Search - в комментариях не нуждается, у вас будет персональный Google.
    Ну и есть конкурент (в общем-то лидер в области Enterprise-поисковых движков) Licidworks Fusion Server. Из коробки идёт куча легко кастомизируемых коннекторов (читай узкоспециализированных краулеров, каждый из которых понимает семантику того, что индексирует) - напр. "индексируй вот эти сайты в локалке, корпоративную Jira, вот эти таблицы в БД сервера документов, и вот этот сервер гит-репозиториев".
    Естественно, оба продукта платые, но Fusion будет обходиться раза в 2 дешевле.

    Если нужно для босяков, нахаляву - ломайте копья и костыли об Apache Solr. Искать по слитым в него данным он умеет, а вот как засунуть в него данные (тем более актуальные данные - обновить, как только они изменились) - ваша проблема.

    Можете ещё рассмотреть продукты из списка Enterprise Search Venrdor'ов, но про них ничего сказать не могу.
    Ответ написан
    Комментировать