Очень хочу воплотить одну из своих идей — создать мобильное приложение. Но на данном этапе создание приложений для меня — темный лес. Рассчитывал, что на данном портале профессионалы направят по алгоритму и, может даже, удастся найти новых друзей, так как данное направления мне очень интересно (больше, как воплощение идей, а не кодирование). У всех свои таланты и я хочу верить, что они у меня есть. А на портале я именно из-за того, что мне посоветовали его, как сообщество талантливых людей, которые смогут мне подсказать правильное направления. Или я смогу найти себе интересное окружения в данной сфере. Пару слов о приложении: преобразование печатного текста в речь, которая звучит, как голос известного героя или актера с использованием характерных интонаций (интонация очень важна). Хотелось понять правильный алгоритм работы с программистом при создании такого рода проектов, понимание оценки стоимости проекта и защиты авторских прав. Всем спасибо и хорошего времени!
У Вас идея сделать Adobe VoCo приложением на телефон?
Если коротко, то в realtime на данный момент это реализовать невозможно и даже не в realtime очень дорого и нерентабельно
Дмитрий Тыванюк, Да, это очень похоже на то что бы я хотел. Но для начало я подумал можно использовать библиотеки с разными голосами. Текст просто воспроизводить как на примере мака. Тоже самое с голосом, заменять его из библиотеки.
AleksandruGro, продуктов предлагающих функцию text to speach на рынке сейчас достаточно много, качество многих не далеко ушло от Google translate, но вряд-ли Вы без команды, знаний и инновационного алгоритма сможете создать что-то лучше.
Если просто хотите поиграться с голосом в стиле вышеупомянутого сервиса-переводчика, то гайдов в интернете хватает :) https://lmgtfy.com/?q=text+to+speech+tutorial
P. S. Наверное, у каждого третьего программиста где-нибудь на компьютере лежит не до конца доделанный голосовой помощник, способный с 3-го раза распознавать вопрос и синтезировать ответ. Но, увы, дальше pet-проекта это не уходит :)
Дмитрий Тыванюк, Тут не в голосе и тексте задача. Голос и текст это больше препятствие или одна из составляющих для решение моей задачи. Вопрос как я хочу использовать данную функцию а не сама функция.
AleksandruGro, хорошо. Тогда, в чем заключается ваш вопрос? Вы хотите понять, что нужно изучать, что-бы реализовать это или ищите людей, которые сделают это за Вас? :)
P.S. Не в коем случае не хочу Вас чем-то задеть, просто не совсем понял ваш посыл. Если вы ищите единомышленников или работников/конслультантов то вам наверное нужно на другой ресурс: teamfinding, ideaswatch и т.д.
Спасибо за ваши подсказки, очень хорошо проясняют задачу. Ранее я не знал про VoCo ). Я хотел бы понять какая архитектура построения данного приложения. Например, как в лендинге - я знаю, что мне для начала нужен дизайнер ( проработать визуал), потом верстальщик это все прописал и наполнил, ну и далее поддержка и корректировки по мере необходимости. Чтобы понять возможна ли реализация данной идеи и сколько это будет стоить. И да, хотелось бы найти человека, знающего данную специфику. Мы бы могли вместе реализовать данную идею. Есть много идей в IT направлении и эта сфера мне очень интересна, но, к сожалению, в кодировании у меня нет талантов.
По аналогии с лендингом:
Вам нужен специалист/команда хорошо разбирающаяся в нейронных сетях и big data, большое(действительно большое) количество входных данных (записей голоса) и вычислительных ресурсов (сервера).
Придется найти человека/компанию, который подберет вам команду/специалиста. (это не верстальщик и не дизайнер, вам не хватит компетенций, чтобы оценить кандидата).
минимальная зп (если в России) в этой сфере 130, соответсвенно, нужно учитывать, что хороший спец за минималку работать не пойдет(умножайте на 3).
Прототип на всем готовом 1 месяц +.
До приемлемых результатов, которые вы хотите в итоге, если делать оптимизацию (для минимального времени на синтез), кормить команду придется года 1,5+.
Когда серверная часть готова, всё как обычно, делается интерфейс и т.д.
Дмитрий Тыванюк, Как всегда спасибо. Я прочитал статью. Понимаю сложность процесса (насколько я могу конечно понять). Понял на счет денег. Из всего этого следует, что надо для начало просто сделать, скажем 20 шаблонов текстов и по 5 интонаций и разных голосов на эти шаблоны. Запустить прототип от начала и до конца.
Получиться что-то из сери как БАМБЛБИ из Трансформеров говорил разными голосами )).
Далее если все норм работает можно думать о привлечении под эту идею средств.
Подскажите где искать специалиста, возможно ли выполнить прототип одним человеком? Максимально простой но со всеми цепочками функционала.
Еще мне говорили на встречи Яндекс разработчиков что можно взять одного понимающего специалиста, он разделить и раздаст фрилансером не за дорого и потом соединит это все воедино. Что вы думаете об таком подходе ? https://octopus.do этот конструктор я использую для визуализации архитектуры моих идей. Может подскажете что-то подобное для приложений чтобы было с прорисовкой, если знаете?
Ребята вполне возможно что я слишком примитивен для этого ресурса и множеством профессионалов своего дела, которым не интересно общаться с людьми не знающими данную специфику. Но если вам скучно (это нормально) не стоит тогда стирать клавиатуру.
Я написал свой запрос и админы посоветовали мне написать, сюда. Наверное и я и они подразумевали что найдутся знающие ребята с умение объяснить не профессионалу как решить данную задачу. Или направить где что можно посмотреть или почитать.
Мне не хочется наступать на горло вашей песне, но такие оригинальные идеи уже реализованы, в том числе абсолютно бесплатными средствами.
Не стоит погружаться в мир разработки без минимальных знаний в этой области. Это как лезть в тяжелое бездорожье на казуальной пузотерке. Начните с малого, а там и найдёте ответы на возникащие вопросы. Всё придёт с опытом.
А можно примеры реализации моей идеи, плиз? Соглашусь что это темный лес для меня. Но по своему опыту, когда человек спрашивает что-то из того что знаю я. Моя реакция это максимально доходчиво обьяснить ему и дать ответ на вопрос. Для меня это развивает навык обучения и навык определения индивидуума и подачи ему информации исходя из его мировоззрения. Это очень прокачивает. А еще человеческий фактор социального общения в целом. В любом случае спасибо за ваш ответ. Вы во многом правы.
Den Sabrov, Сайт у вас оч крутой!
Но такие оригинальные идеи уже реализованы, в том числе абсолютно бесплатными средствами.
Можно пример ?
Я вроде не озвучивал как я хочу применить этот голосовой преобразователь. Или вы все поняли? Тогда просто скиньте примеры, буду благодарен если развеете мою идею. Может она и вправду есть уже.