ChatGPT para celular ganha comandos por voz e imagem; IA também aprende a falar

TAG Notícias

Nesta segunda-feira (25), a OpenAI revelou uma significativa atualização para o ChatGPT, acrescentando a capacidade de interagir com comandos por imagens e voz, além de responder em áudio ao usuário, desde que o acesso ocorra via dispositivos móveis, como smartphones. Inicialmente, essas novas funcionalidades estarão disponíveis para os usuários dos serviços pagos ChatGPT Plus e ChatGPT Enterprise.

A empresa anunciou que a atualização será progressivamente implementada para todos os usuários ao longo das próximas duas semanas, com os primeiros clientes começando a experimentar as novidades desde esta segunda (25). Após esse período inicial, a OpenAI planeja liberar o uso desses recursos para desenvolvedores, mas ainda não especificou quando essa expansão estará acessível para os usuários que não pagam pelo serviço.

Leia também: WhatsApp terá botões para pedir delivery, fazer check-in em voo e mais

Essa atualização representa um avanço notável na evolução da inteligência artificial, permitindo ao ChatGPT ouvir, visualizar e falar em resposta aos comandos dos usuários, quando utilizado em dispositivos móveis.

Os novos modos de envio de comandos ao ChatGPT prometem oferecer maior conveniência aos usuários, com destaque para a funcionalidade de prompts por imagem. Recentemente, a OpenAI anunciou a integração da Dall-E 3 ao ChatGPT.

Através de exemplos no site da OpenAI e em publicações em sua conta no Twitter, fica claro como o ChatGPT pode agora analisar imagens e auxiliar o usuário com base no conteúdo visual. Em um vídeo compartilhado pela empresa, a IA é demonstrada explicando como ajustar o banco de uma bicicleta após identificar uma foto.

No vídeo, o ChatGPT solicita uma imagem mais detalhada do ponto de fixação do banco, informa sobre as ferramentas disponíveis para o usuário e até menciona o manual da bicicleta. A inteligência artificial é capaz de identificar que o banco requer uma chave Allen, conhecida como sextavada, e que essa ferramenta está na caixa, tudo com base na análise da imagem fornecida pelo usuário.

Além disso, a OpenAI também exibiu o recurso de prompts por voz e resposta falada. No exemplo apresentado, o ChatGPT possui uma voz feminina e, em resposta a um comando de voz de uma usuária, conta uma história infantil. Vale notar que a história não é concluída em um único prompt, exigindo comandos adicionais para dar continuidade à narrativa.

Para os assinantes do ChatGPT Plus ou Enterprise, a ativação do recurso de voz estará disponível por meio das configurações do aplicativo, assim que for liberada para o respectivo usuário.

Sarah Oliveira
Sarah Oliveira

Uma amante das palavras em uma jornada incessante de descoberta. Originária de São Paulo, encontro nas nuances da linguagem minha paixão. Com formação em Comunicação, tenho o prazer de guiar você pelos intrincados caminhos das notícias, oferecendo uma perspectiva única sobre o que acontece no Brasil e no mundo.

Artigos: 2058