Стартап студента Физтеха по уменьшению иностранного акцента в речи привлек $105 тыс. от Berkeley SkyDeck

0 2

Стартап студента Физтеха по уменьшению иностранного акцента в речи привлек $105 тыс. от Berkeley SkyDeck

Стартап InTone, основанный студентом Московского физико-технического института (МФТИ) Андреем Гольманом, вошел в состав осеннего набора акселератора Berkeley SkyDeck. Акселератор также инвестирует в InTone $105 тыс. через свой венчурный фонд, сообщил RB.ru основатель проекта.

Стартап студента Физтеха по уменьшению иностранного акцента в речи привлек $105 тыс. от Berkeley SkyDeck

InTone разрабатывает технологию, уменьшающую иностранный акцент в английской речи. Обработка голоса происходит в режиме реального времени. Предполагается, что такие аудио-фильтры могут применяться в онлайн-звонках и в международных колл-центрах.

Андрей Гольман — студент 6 курса магистратуры школы прикладной математики и информатики МФТИ. Он основал InTone весной 2021 года, а до этого более года занимался исследованиями в области голосовых технологий.

«Фаундеров у нас в стартапе двое, — рассказывает Гольман, — У меня технический бэкграунд (помимо МФТИ работал в “Яндексе”), а у моего кофаундера Егора Паваляева — бизнесовый, в частности, опыт запуска стратегических продуктов в Lamoda».

В «Яндексе» Гольман занимался рекомендациями в поисковых продуктах. Опыт Паваляева — разработка стратегии Lamoda в СНГ, запуск пунктов выдачи заказов и оптимизация доставки.

«После полутора лет исследований и разработок в области voice to voice мы готовы к запуску продукта. При помощи менторов SkyDeck мы рассчитываем выйти в начале 2022 года на рынок США, и реализовать проекты в колл-центрах в Индии и на Филиппинах», — сообщил Гольман.

Основатели уже зарегистрировали юрлицо в США — InTone Inc. Как пояснил Гольман, Индия и Филиппины были выбраны для запуска проекта, поскольку это самые большие рынки колл-центров, работающие с американскими компаниями.

InTone представляет из себя десктопное приложение. «Оно активирует виртуальный микрофон. С помощью такой механики можно брать аудио из системного микрофона и передавать обработанное аудио в любой софт для звонков», — пояснил Гольман.

На старте Гольман планирует проводить монетизацию InTone с помощью подписки: «В первых интеграциях мы планируем брать деньги за подписку за каждое устройство». Предварительная стоимость подписки составляет $10 в месяц. Затем InTone будет смотреть на результаты и реакцию рынка.

Оценка проекта и дальнейшие планы

По словам Гольмана, сейчас над проектом работают пять человек фулл-тайм, еще двое парт-тайм. Инвестиции акселератора будут направлены в том числе на расширение команды ML-инженеров и разработчиков ПО в Москве.

По оценке основателя и председателя совета директоров компании «Биорг» Георгия Зуева, стоимость такой команды в России, в зависимости от уровня ML-инженеров, «может колебаться от 3 до 6 и более миллионов рублей в месяц». При этом многие компании, по его словам, стараются создавать центры разработки на периферии, чтобы сократить затраты.

Большинство экспертов считают, что максимальная оценка IT-стартапа на данной стадии не превышает $2 млн. При этом некоторые из них уверены, что InTone финансировался в форме SAFE (Simple Agreement for Future Equity) — популярное в США соглашение о будущем капитале.

На российском венчурном рынке стартапы на посевной стадии могут оцениваться в  $1-2 млн, в США — $5-10 млн, говорит управляющий директор Just AI Кирилл Петров.

«Небольшой объем инвестиций в технологию, вероятно на уровне 10% от цены компании, что часто для первого раунда, указывает не только на скромную оценку компании в $1 млн, но и на экспериментальный характер разработки», — отметил руководитель Liquid Studio Accenture в России Арсений Кондратьев.

По словам основателя Baza VC Алексея Мосолова, фонд Berkeley SkyDeck Fund инвестирует до $105 тыс. в компании, принятые в шестимесячную программу SkyDeck Cohort Program. По его данным, инвестиции в размере $105 тыс. делятся на два транша: $50 тыс. сразу после принятия и $55 тыс. после прохождения «промежуточного экзамена» через 3 месяца после начала программы. Инвестиции предлагаются в виде стандартной SAFE-ноты без дисконта с лимитом оценки $2 млн, отметил Мосолов.

Георгий Зуев также считает, что InTone привлек инвестиции по модели SAFE: «Стартапы на такой стадии обычно не имеют оценки. Скорее всего там просто SAFE (simple agreemеnt of future equity). Для этой стадии граница, по которой может конвертироваться в будущем эта инвестиция, как мне кажется, составляет $5-6 млн».

В любом случае, давать оценку компании рано, потому что нужно дождаться трекшена и смотреть на развитие InTone в динамике, резюмировал ассоциат LETA Capital Александр Земляк.

Рынок и Конкуренты

По данным аналитика Softline Venture Partners Александра Хоперского, рынок речевых технологий последние несколько лет активно растёт (cagr -25%), нишевые решения массово вышли на разные коммерческие рынки. Можно ожидать, что бурный рост интереса к речевым технологиям продолжится, прогнозирует эксперт.

Управляющий директор Just AI Кирилл Петров также отметил, что сегмент речевых технологий сейчас находится на подъеме. По его словам, на этом рынке сегодня нет большой конкуренции, однако появляются отдельные стартапы с той же концепцией.

В пример он привел калифорнийский проект Sanas, также с русскими корнями, который в августе 2021 года привлек $5,5 млн на посевной стадии от Human Capital, General Catalyst, Quiet Capital и DN Capital. 

Основатель Involta Алекс Концов также называет основным конкурентом InTone стартап Sanas: «В Стэнфорде трое друзей решают подобную задачу и насколько мне известно, их проект пользуется спросом как у клиентов, как и у инвесторов».

Каковы перспективы InTone

Эксперты разошлись во мнениях о перспективах такой технологии. Основная сложность заключается в том, что известных кейсов применения такой технологии нет, полагает руководитель Liquid Studio Accenture в России Арсений Кондратьев.

«Если InTone намерен развивать исключительно технологию, которая уменьшает иностранный акцент в английской речи, то не думаю, что этот рынок можно считать перспективным, потому что область применения технологии и её первостепенная необходимость кажутся сомнительными», — считает ассоциат венчурной фирмы Leta Capital Александр Земляк.

С другой стороны, отмечает эксперт, если обработку голоса в режиме реального времени совместить с автоматическим синхронным переводом, то этот продукт «имеет уже в разы больше шансов стать полезным, удобным и сокращающим издержки инструментом для бизнеса».

С ним согласен управляющий директор Just AI Кирилл Петров. «Пока не кажется, что фича изменения акцента начнет пользоваться высоким устойчивым спросом, но ее можно дополнить другими технологиями изменения речи и за счет этого расширить аудиторию», — подчеркнул Петров.

«Это, безусловно, интересная и востребованная идея, но она не нова», — отметил основатель «Биорг» Георгий Зуев.

По его словам, различные программы для совершенствования произношения уже давно используются в западных университетах и школах. В пример он привел проект ELSA Speak.

По мнению Зуева, сложностью на пути реализации проекта может стать бизнес-модель: «Им надо встать во внутрь софта, который сейчас эксплуатируется колл-центрами. Это сложно: B2B-продажа со всеми нюансами, плюс вопросы интеграции, плюс поддержка версионности для всех систем».

«Теоретически для проекта вполне может найтись место на рынке. Технология явно в тренде. В эпоху дистанцирования людей, вызванного пандемией, и массового развития удаленных рабочих мест такие продукты могут быть востребованными», — заключил Зуев.

Директор ML-департамента МТС AI Никита Семёнов предполагает, что внутри InTone лежит технология, которая позволяет осуществлять Neural Style Transfer: «К примеру, существуют нейросети, которые умеют стилизовать изображения под картины Моне или Ван Гога. Тот же принцип работает и здесь».

По его мнению, технология может быть актуальна в условиях, когда компании используют внешние колл-центры, которые могут быть на аутсорсе в другой стране. 

«Часто происходят ситуации, когда клиент обращается в поддержку и слышит речь с французским или китайским акцентом, что вызывает диссонанс и сильно усложняет коммуникацию. Тем более, американский и британский английский различаются произношением, орфографией и смыслом», — подчеркнул Семёнов.

Основатель Involta Алекс Концов, согласен с тем, что стартап скорее всего будет полезен различного рода колл-центрам, в которых на позициях специалистов, осуществляющих коммуникации с клиентами, работают люди с плохим английским произношением: «В сфере продаж вся воронка построена на первом контакте и доверии к собеседнику и это применимо не только в колл-центрах». 

Потенциально под данное решение существует довольно большой рынок, считает инвестиционный аналитик фонда Softline Venture Partners Александр Хоперский. «Вместе с тем, непонятно, насколько качественно предложенная технология сможет справляться с корректировкой речи для тех же операторов техподдержки, скажем, из Индии и Таиланда или Малайзии в силу характерных для каждого из них особенностей произношения», — отметил эксперт.

Он подчеркнул важность того, чтобы конечная речь не звучала слишком компьютерной и искусственной — это может отпугнуть собеседника, поскольку люди в большинстве своём ещё не привыкли общаться с голосовыми ассистентами.

Подобные стартапы могут дополнить и существующие продукты, полагает управляющий директор Just AI Кирилл Петров. Например, проект для исправления акцентов Accent Advisor или приложение ELSA Speak, где ИИ оценивает произношение пользователя и дает советы по минимизации акцента. 

Стартап может быть востребован, поскольку со временем у людей из разных стран стали появляться свои характерные особенности произношения, связанные со страновым аспектом, поэтому наличие методики приведения речи к какому-то общему знаменателю поможет устранить языковые барьеры и упростит наем в те же колл-центры, то есть приведет к удешевлению рабочего процесса, уверен управляющий партнер коммуникационного агентства Svoboda Марк Шерман.

О Berkeley SkyDeck

Акселератор Berkeley SkyDeck работает при университете Беркли (Окленд, Калифорния) с 2012 года. Он создан и управляется бизнес-школой Haas, Инженерным колледжем и проректором по науке и инновациям. За это время Berkeley SkyDeck стал известен своим опытом в прорывных наукоемких технологиях (deep tech). 

Инвестиционные партнеры Berkeley Skydeck — крупнейшие венчурные фирмы Силиконовой долины Sequoia Capital, Mayfield и Sierra Ventures. Текущий набор стартапов для акселератора стал тринадцатым по счету. 

Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!

Фото на обложке: fizkes / Shutterstock

Источник: rb.ru
Оставить комментарий

Мы используем файлы cookie. Продолжив использование сайта, вы соглашаетесь с Политикой использования файлов cookie и Политикой конфиденциальности Принимаю

Privacy & Cookies Policy