A Speechify tem sido principalmente uma ferramenta que ajuda você a ouvir artigos, PDFs e documentos. A empresa agora está incorporando funcionalidades de detecção de voz à sua extensão do Chrome, incluindo digitação por voz e um assistente vocal que responde às suas perguntas.
Nos últimos 12 meses, houve uma proliferação de ferramentas de detecção de voz, graças à melhoria geral da qualidade nos modelos de reconhecimento de fala. A Speechify está entrando nessa onda e lançando sua própria ferramenta de ditado com suporte para inglês. Assim como outras ferramentas de ditado, a digitação por voz da Speechify corrige erros e remove palavras desnecessárias.
Em meu breve teste de pouco mais de um dia, senti que havia muito espaço para melhorias na ferramenta da Speechify. Por exemplo, as funcionalidades funcionam bem com Gmail e Google Docs, mas em sites como o WordPress, tive dificuldade em ativar o ditado por voz e fazê-lo funcionar adequadamente. A empresa afirmou que está adicionando otimização para sites populares gradualmente.
Em termos de precisão, a taxa de erro de palavras foi maior do que a de algumas outras ferramentas, como Wispr Flow, Willow e Monologue. A Speechify destacou que seu modelo aprende mais rápido à medida que você o utiliza mais, e a taxa de erro diminuirá gradualmente.
A startup também está lançando um assistente de voz conversacional que fica na barra lateral do seu navegador. Você pode fazer perguntas sobre o site, como ‘quais são as três ideias principais?’ ou ‘explique isso em termos mais simples’.
Embora o ChatGPT e o Gemini tenham modos conversacionais, o argumento da Speechify é que eles são tratados como uma funcionalidade secundária em seus aplicativos, e a própria ferramenta da startup tem a voz como prioridade e central.
‘Acreditamos que o chat sempre será a experiência de usuário padrão no ChatGPT e no Gemini quando você abrir os aplicativos. É o que seus usuários esperam. A voz sempre será secundária – e, em muitos casos, uma reflexão tardia para o ChatGPT e o Gemini. Sabemos, de vários anos construindo o Speechify, que há uma grande parte do mercado, que inclui nossos usuários, que querem a voz como a configuração principal e padrão toda vez que abrem um aplicativo e falam com a IA’, disse Rohan Pavuluri, diretor de negócios da empresa, ao TechCrunch por e-mail.
Um problema notável com isso é que o assistente da Speechify atualmente não funciona com navegadores que possuem assistentes de barra lateral integrados, como o Atlas da OpenAI, o Comet da Perplexity e o Dia. A startup não está muito preocupada com isso, pois a extensão é destinada principalmente ao Chrome e sua enorme base de usuários.
A Speechify informou que planeja incluir tanto a digitação por voz quanto um assistente de voz em todos os seus aplicativos para desktop e dispositivos móveis gradualmente.
A startup também quer desenvolver agentes que completem tarefas em seu nome. A empresa não revelou seu roteiro completo, mas deu um exemplo: fazer ligações para você para marcar uma consulta ou esperar na linha com o suporte ao cliente de uma empresa. Outras empresas, como Truecaller e Cloacked, têm perseguido objetivos semelhantes.
Caçadores de Tecnologia Mantenha-se atualizado com as últimas novidades tecnológicas! Análises, tutoriais e lançamentos de celulares, TVs e mais. Junte-se aos Caçadores de Tecnologia!