
O futuro chegou, novamente. Os agentes de AI em breve farão parte do novo normal como muitos de nós já havíamos previsto. “Agora” o chat gpt já pode realizar várias ações na web, tal como reservar uma viagem, por si. E isto veio mudar tudo, pois ele pode navegar e fazer ações num computador como qualquer pessoa faria. No entanto, calma, para já mais parece uma criança de 12 anos ou uma pessoa embriagada mas consciente, super inteligente a navegar e a interagir com a internet 😂, eu explico mais à frente porquê. Mas é a versão 1, as melhorias virão rapidamente, pois como está montado tem tudo para ser treinado rapidamente através de aprendizado por reforço à conta da nossa utilização diária.
O novo “Agent Mode” da openAI é uma evolução que permite ao chat gpt agir por si em qualquer site. Isso mesmo, é como se tivesse uma pessoa a navegar por si pela internet e a fazer as coisas por si, mesmo em websites onde precisa das suas credênciais: navega em sites, email, preenche formulários, executa compras ou agendas, e gera relatórios ou slides através de um “computador virtual” integrado e multimodal (visual, terminal, API).
Este modo e modelo transformer combina o poder do Operator (ação web) e do Deep Research (análise profunda e incrível), trabalhando de forma autónoma mas sob controlo humano. Para já, pede aprovação antes de decisões irreversíveis e permite interromper, redirecionar ou retomar tarefas a qualquer momento. Esta parte é ainda um pouco chata, é preciso dar autorização a quase tudo, mas é a primeira versão, há que dar um desconto… Certamente esta questão mudará com o tempo e certamente o modelo está a ser treinado a cada vez que você diz para prosseguir (informação ainda não confirmada).
Nos vários testes que fiz, o “agent mode” enganou-se várias vezes durante o processo, mas corrigiu sempre durante o processo e devolveu o resultado esperado no final. Por isso funcionou 100% bem no final. Por exemplo, o “agent mode” estava a marcar uma hora para uma reunião e durante o processo marcou para as 8h, depois para as 8h30 e por fim marcou para as 9h como eu lhe havia pedido, parecia um bêbado a enganar-se ao clicar nos botões errados do website em questão, mas consciente que se estava a enganar-se e por isso ele corrigia-se imediatamente.
Já experimentou? Para que é que o vai utilizar? O que acha que vai fazer com este “agent mode”?

Deixe um comentário