Cinco arquitetos da economia da IA ​​explicam onde as coisas estão saindo

Cinco arquitetos da economia da IA ​​explicam onde as coisas estão saindo

No início desta semana, cinco pessoas que atuam em todas as camadas da cadeia de suprimentos de IA se reuniram na Milken Global Conference em Beverly Hills, onde conversaram com este editor sobre tudo, desde escassez de chips até data centers orbitais e a possibilidade de que toda a arquitetura que sustenta a tecnologia esteja errada.

Aqui está o que os cinco tiveram a dizer:

Os gargalos são reais

O boom da IA ​​está encontrando limites físicos severos, e as restrições inicialmente mais abaixo na pilha do que muitos imaginam. Fouquet foi o primeiro a dizer isso, descrevendo uma “enorme atualização na fabricação de chips”, ao mesmo tempo em que expressava sua “forte convicção” de que, apesar de todo esse esforço, “nos próximos dois, três, talvez cinco anos, o mercado será limitado pela oferta”, o que significa que os hiperscalers — Google, Microsoft, Amazon, Meta — não encomendam todos os chips pelos quais estão pagando, ponto final.

DeSouza destacou o quão grande — e quão rápido está crescendo — é esse problema, lembrando ao público que a receita do Google Cloud ultrapassou US$ 20 bilhões no último trimestre, crescendo 63%, enquanto seu backlog — a receita comprometida, mas ainda não entregue — quase dobrou em um único trimestre, de US$ 250 bilhões para US$ 460 bilhões. “A demanda é real”, disse ele com uma calma impressionante.

Para Younis, a restrição vem principalmente de outro lugar. A Intuição Aplicada construiu sistemas de autonomia para carros, caminhões, drones, equipamentos de mineração e veículos de defesa, e seu gargalo não é o silêncio — são os dados que só podem ser encontrados enviando máquinas para o mundo real e observando o que acontece. “Você tem que encontrá-lo no mundo real”, disse ele, e nenhuma quantidade de simulação sintética fecha completamente essa lacuna. “Levará muito tempo antes que você possa treinar totalmente modelos que rodam no mundo físico sinteticamente.”

O problema da energia também é real

Se os chips são o primeiro gargalo, a energia é o que está logo atrás. DeSouza confirmou que o Google está explorando data centers no espaço como uma resposta séria às restrições de energia. “Você obtém acesso a energia mais abundante”, observou ele. Claro, mesmo em órbita, não é simples. DeSouza demonstrou que o espaço é um vácuo, o que elimina a convecção, deixando a radiação como a única maneira de dissipar o calor para o ambiente circundante (um processo muito mais lento e difícil de projetar do que os sistemas de resfriamento a ar e líquido nos quais os data centers existentes hoje). Mas a empresa ainda está tratando isso como um caminho legítimo.

O argumento mais profundo que Souza fez, um tanto previsivelmente, foi sobre eficiência através da integração. A estratégia do Google de coengenharia de sua pilha completa de IA — de chips TPU personalizados a modelos e agentes — rende dividendos em flops por watt (mais computação por unidade de energia) que uma empresa que compra componentes prontos simplesmente não consegue replicar, ele sugeriu. “Executar o Gemini em TPUs é muito mais eficiente em termos de energia do que qualquer outra configuração”, porque os projetistas de chips sabem o que está por vir no modelo antes de ele ser lançado, disse ele.

Fouquet fez um ponto semelhante mais tarde na discussão. “Nada pode ser inestimável”, disse ele. A indústria está em um momento estranho agora, investindo quantidades extraordinárias de capital, impulsionadas por necessidade estratégica. Mas mais computação significa mais energia, e mais energia tem um preço.

Um tipo diferente de inteligência

Enquanto o debate sobre o resto da indústria aumenta, arquitetura e eficiência de inferência dentro do paradigma de modelos de linguagem grandes, Bodnia está construindo algo muito diferente.

Sua empresa, Inteligência Lógica, é construída sobre os chamados modelos baseados em energia (EBMs), uma classe de IA que não prevê o próximo token em uma sequência, mas sim tenta entender as regras subjacentes aos dados, de uma maneira que seu argumento é mais próximo de como o cérebro humano realmente funciona. “A linguagem é uma interface de usuário entre meu cérebro e seu”, disse ela. “O raciocínio em si não está ligado a nenhuma linguagem.”

Seu maior modelo tem 200 milhões de interrupções — em comparação com as centenas de bilhões dos principais LLMs — e ela afirma que roda milhares de vezes mais rápido. Mais importante, ele é projetado para atualizar seu conhecimento à medida que os dados mudam, em vez de exigir retreinamento do zero.

Para design de chips, robótica e outros domínios onde um sistema precisa compreender regras físicas em vez de padrões linguísticos, ela argumenta que os EBMs são o ajuste mais natural. “Quando você dirige um carro, você não está buscando padrões em nenhuma linguagem. Você olha ao seu redor, entende as regras sobre o mundo ao seu redor e toma uma decisão.” É um argumento interessante e que provavelmente atrairá mais atenção nos próximos meses, visto que o campo da IA ​​está começando a questionar se a escala sozinha é suficiente.

Agentes, salvaguardas e confiança

Shevelenko passou grande parte da conversa explicando como a Perplexity evoluiu de um produto de busca para algo que agora chama de “trabalhador digital”. O Perplexity Computer, sua oferta mais recente, é projetado não como uma ferramenta que um trabalhador do conhecimento usa, mas como uma equipe que um trabalhador do conhecimento dirige. “Todos os dias você acorda e tem uma centena de funcionários em sua equipe”, disse ele sobre a oportunidade. “O que você vai fazer para tirar o máximo proveito disso?”

É uma proposta convincente; também levanta questões óbvias sobre controle, então eu as fiz. Sua resposta foi: granularidade. Os administradores corporativos podem especificar não apenas quais conectores e ferramentas um agente pode acessar, mas essas permissões são somente leitura ou leitura/escrita — uma distinção que importa enormemente quando os agentes estão engajados dentro de sistemas corporativos. Quando o Comet, agente de uso de computador da Perplexity, realiza ações em nome de um usuário, ele apresenta um plano e pede aprovação primeiro. Alguns usuários acham o atrito irritante, disse Shevelenko, mas ele o considera essencial, especialmente depois de entrar no conselho da Lazard, onde se viu inesperadamente simpático aos instintos conservadores de um CISO protegendo uma marca de 180 anos construída diretamente sobre a confiança do cliente. “A granularidade é a base de uma boa higiene de segurança”, disse ele.

Soberânia, não apenas segurança

Younis ofereceu o que pode ter sido a observação mais fornecida geopoliticamente do painel, que é que IA física e soberania nacional estão entrelaçadas de maneiras que a IA puramente digital nunca esteve.

A internet inicialmente se apresentou como tecnologia americana e causou resistência apenas na camada de aplicação — os Ubers e DoorDashes — quando as consequências offline se tornaram visíveis. A IA física é diferente. Veículos autônomos, drones de defesa, equipamentos de mineração, máquinas agrícolas — estes se manifestam no mundo real de maneiras que os governos não podem ignorar, levantando questões sobre segurança, coleta de dados e quem, em última análise, controla sistemas que operam dentro das fronteiras de uma nação. “Quase consistentemente, todos os países estão dizendo: não queremos essa inteligência em forma física em nossas fronteiras, controladas por outro país.” Menos nações, disse ele à multidão, atualmente podem operar um robotáxi do que possuem armas nucleares.

Fouquet apresentou uma questão de forma um pouco diferente. O progresso da China em IA é real — o lançamento do DeepSeek no início deste ano relacionado a algo próximo ao pânico em partes da indústria — mas esse progresso é limitado abaixo da camada do modelo. Sem acesso à litografia EUV, os fabricantes de chips chineses não conseguem fabricar os semicondutores mais avançados, e modelos construídos em hardware mais antigos operam com uma desvantagem cumulativa, não importa quão bom o software se torne. “Hoje, nos Estados Unidos, você tem os dados, você tem o acesso à computação, você tem os chips, você tem o talento. A China faz um trabalho muito bom no topo da pilha, mas está faltando alguns elementos abaixo”, disse Fouquet.

A questão da geração

Perto do final do nosso painel, alguém na plateia fez uma pergunta óbvia e desconfortável: tudo isso vai impactar a capacidade da próxima geração para o pensamento crítico?

Shevelenko fez um ponto mais pragmático: o emprego de nível inicial pode estar desaparecendo, mas a capacidade de lançar algo independentemente nunca foi tão acessível. “[Para] qualquer pessoa que tenha o Perplexity Computer . . . a restrição é a sua própria curiosidade e agência.”

Younis traçou uma distinção mais acentuada entre trabalho de conhecimento e trabalho físico. Ele apontou para o fato de que o agricultor americano tem médio 58 anos e que as deficiências de mão de obra na mineração, transporte de longa distância e agricultura são crônicas e crescentes — não porque os trabalhadores são muito baixos, mas porque as pessoas não querem esses empregos. Nesses domínios, a IA física não está deslocando trabalhadores interessados. Ela está preenchendo um vazio que já existe e que só tende a se aprofundar a partir daqui.

Fonte: Techcrunch