Adeus modelos tradicionais! Grandes modelos de negócios (LAMs) estão transformando o mundo da inteligência artificial

O surgimento de chatbots baseados em IA generativa popularizou o termo “modelo de grande linguagem”, a tecnologia de IA subjacente que funciona nos bastidores. Grandes Modelos de Linguagem (LLMs) geram saída com base em um conjunto previsto de linguagem em resposta à entrada do usuário, fazendo parecer que a IA é capaz de pensar por si mesma.

Mas os LLMs não são os únicos grandes modelos disponíveis; Os Grandes Modelos de Ação (LAMs) podem ser a próxima tecnologia inovadora em IA. Verificar Alguns grandes problemas com o ChatGPT da OpenAI.

Imagem de Adeus modelos tradicionais! Grandes modelos de negócios (LAMs) estão criando uma mudança de paradigma no mundo da inteligência artificial | 1aRQHp5oPnnI4R-yjwNOf_Q-DzTechs

O que é um Grande Modelo de Negócios (LAM)?

Um Large Action Model (LAM) é um modelo de inteligência artificial capaz de compreender a entrada humana e executar a ação correspondente, tornando-o capaz de interagir com o mundo de maneira semelhante à humana. Esta é uma abordagem ligeiramente diferente dos modelos de IA que se concentram apenas na geração de respostas. O termo “grande modelo de negócios” foi introduzido pela primeira vez pela Rabbit Inc, desenvolvedora do Rabbit R1. No vídeo de lançamento do Rabbit R1 da empresa, diz-se que o LAM é um novo modelo fundamental que ajuda a passar a IA das palavras à ação.

Os LAMs são treinados em grandes conjuntos de dados de ação do usuário; Conseqüentemente, eles aprendem imitando ações humanas ou por meio de demonstração. Através da demonstração, o modelo LAM pode compreender e navegar nas interfaces de usuário de diferentes sites ou aplicativos móveis e realizar ações específicas com base em suas instruções. De acordo com CoelhoO LAM pode conseguir isso mesmo se a interface for ligeiramente alterada.

Você pode pensar nos LAMs como uma extensão dos recursos existentes dos LLMs. Embora o texto generativo ou a saída de mídia em um LLM dependa da entrada do usuário, prevendo a próxima palavra ou token (você faz uma pergunta e o modelo LLM fornece texto ou saída de mídia), os LAMs vão além, adicionando a capacidade de implementar. Procedimentos complexos em seu nome. Verificar Você deve usar um modelo LLM local? Vantagens, desvantagens e melhores práticas.

O que os LAMs podem fazer?

Os LAMs tratam da execução de ações complexas em seu nome. No entanto, o ponto crucial a ser observado é a capacidade de realizar procedimentos complexos. Isso torna os LAMs mais úteis para tarefas avançadas, mas não significa que não possam realizar procedimentos mais simples.

Em teoria, isto significa que poderia, por exemplo, pedir ao modelo LAM para fazer algo em seu nome, como pedir um café no café local, ou uma viagem de Uber, e até fazer uma reserva de hotel. Portanto, é diferente de realizar tarefas simples, como pedir ao Google Assistant, Siri ou Alexa para ligar a TV ou as luzes da sala.

Nos bastidores, de acordo com a visão compartilhada pela Rabbit Inc., o modelo LAM é capaz de acessar um site ou aplicativo relevante como o Uber e navegar por sua interface para realizar uma ação, como solicitar uma viagem ou cancelar uma se você alterar seu mente. Verificar Por que o lançamento de produtos tecnológicos incompletos é mais comum do que nunca.

Os LAMs superarão os LLMs, mas (ainda) não estão prontos

O conceito de LAMs é estimulante, talvez mais do que o de LLMs. Os Grandes Modelos de Ação (LAMs) serão o futuro após a IA generativa, permitindo-nos compensar tarefas mundanas e concentrar-nos noutras atividades gratificantes. No entanto, por mais emocionante que pareça, os LAM ainda não estão prontos.

O primeiro produto comercial que prometia alavancar o LAM (Rabbit r1) não cumpriu totalmente a sua promessa de marketing de realizar ações em nome dos seus utilizadores. O dispositivo falhou tanto em seu principal ponto de venda que muitas análises em primeira mão o descreveram como bastante inútil.

Pior ainda, uma investigação do YouTuber Coffeezilla, em colaboração com um seleto grupo de engenheiros de software com acesso a parte da base Rabbit r1, descobriu que o Rabbit usava scripts Playwright para executar ações em vez de LAM. Portanto, em vez de uma máquina executando um modelo de IA exclusivo, ela estava apenas executando um conjunto de instruções If > then; Muito longe do prometido modelo LAM.

Se há algo que você pode tirar do Rabbit r1 é que sim, a visão está lá. No entanto, o trabalho precisa ser feito antes da implementação, por isso não fique animado ainda. Agora você pode visualizar Um guia completo para começar e usar o modelo Llama 2 de maneira eficaz.

Ir para o botão superior