Nesta segunda-feira (25), a OpenAI revelou uma significativa atualização para o ChatGPT, acrescentando a capacidade de interagir com comandos por imagens e voz, além de responder em áudio ao usuário, desde que o acesso ocorra via dispositivos móveis, como smartphones. Inicialmente, essas novas funcionalidades estarão disponíveis para os usuários dos serviços pagos ChatGPT Plus e ChatGPT Enterprise.
A empresa anunciou que a atualização será progressivamente implementada para todos os usuários ao longo das próximas duas semanas, com os primeiros clientes começando a experimentar as novidades desde esta segunda (25). Após esse período inicial, a OpenAI planeja liberar o uso desses recursos para desenvolvedores, mas ainda não especificou quando essa expansão estará acessível para os usuários que não pagam pelo serviço.
Leia também: WhatsApp terá botões para pedir delivery, fazer check-in em voo e mais
Essa atualização representa um avanço notável na evolução da inteligência artificial, permitindo ao ChatGPT ouvir, visualizar e falar em resposta aos comandos dos usuários, quando utilizado em dispositivos móveis.
Os novos modos de envio de comandos ao ChatGPT prometem oferecer maior conveniência aos usuários, com destaque para a funcionalidade de prompts por imagem. Recentemente, a OpenAI anunciou a integração da Dall-E 3 ao ChatGPT.
Através de exemplos no site da OpenAI e em publicações em sua conta no Twitter, fica claro como o ChatGPT pode agora analisar imagens e auxiliar o usuário com base no conteúdo visual. Em um vídeo compartilhado pela empresa, a IA é demonstrada explicando como ajustar o banco de uma bicicleta após identificar uma foto.
No vídeo, o ChatGPT solicita uma imagem mais detalhada do ponto de fixação do banco, informa sobre as ferramentas disponíveis para o usuário e até menciona o manual da bicicleta. A inteligência artificial é capaz de identificar que o banco requer uma chave Allen, conhecida como sextavada, e que essa ferramenta está na caixa, tudo com base na análise da imagem fornecida pelo usuário.
Além disso, a OpenAI também exibiu o recurso de prompts por voz e resposta falada. No exemplo apresentado, o ChatGPT possui uma voz feminina e, em resposta a um comando de voz de uma usuária, conta uma história infantil. Vale notar que a história não é concluída em um único prompt, exigindo comandos adicionais para dar continuidade à narrativa.
Para os assinantes do ChatGPT Plus ou Enterprise, a ativação do recurso de voz estará disponível por meio das configurações do aplicativo, assim que for liberada para o respectivo usuário.