#99 LLMs e IA em retrospecto: o legado de 2024 e o que moldará 2025
Sam Altman usou seu blog para compartilhar reflexões sobre a trajetória da OpenAI, que começou quase nove anos atrás com uma ideia meio maluca: criar a AGI (inteligência artificial geral) e garantir que ela trouxesse benefícios para a humanidade. Na época, pouca gente acreditava que isso daria em algo. Hoje, dois anos depois do lançamento do ChatGPT, o impacto é impossível de ignorar.
Ele conta que o ChatGPT nasceu quase como um experimento. A equipe notou que as pessoas estavam interagindo intensamente com os modelos de linguagem da OpenAI por meio da ferramenta de testes e decidiu criar uma interface mais acessível para explorar melhor o potencial dessas interações. O nome “ChatGPT” veio mais por sorte do que planejamento (aparentemente, nomes não são o forte deles), mas o lançamento, em novembro de 2022, foi o ponto de virada. O crescimento foi insano. Em pouco tempo, o ChatGPT não só colocou a OpenAI no mapa, como também deu o pontapé inicial para a onda de IA generativa que estamos vivendo agora.
Claro, nem tudo foi um mar de rosas. E ele fala sobre como construir uma empresa em torno de algo tão novo foi um baita desafio. Não existe manual para isso, então foi na base da tentativa e erro, uma mistura de avanços incríveis e tropeços pelo caminho. Altman também não esconde que os últimos anos foram intensos, até mesmo desconfortáveis, mas cheios de aprendizado.
Um episódio que marcou foi sua demissão em 2023. Para aqueles que não se lembram, tá tudo condensado nesse post de novembro daquele ano. Mas, em resumo, ele foi demitido de surpresa, via chamada de vídeo, e ficou sem entender nada enquanto o conselho publicava um post oficial. Sam descreve o caos dos dias seguintes como “a névoa da guerra” — ninguém sabia exatamente o que estava acontecendo. Apesar disso, ele não usa o espaço para jogar farpas; em vez disso, reflete sobre o que aprendeu sobre governança e liderança com o ocorrido. E faz questão de agradecer quem ajudou a OpenAI a se reerguer, citando especialmente Ron Conway e Brian Chesky, que ele diz terem sido incansáveis durante a crise.
Apesar dos altos e baixos, Sam está otimista. Ele acredita que em 2025 veremos os primeiros AI agents assumindo tarefas de forma mais significativa no mercado de trabalho. E mais adiante? Superinteligência. Ele admite que parece sci-fi, mas está confiante de que isso vai acontecer e promete avanços científicos e econômicos gigantescos. Para ele, a chave é continuar lançando tecnologias de forma gradual, dando tempo para a sociedade se adaptar.
"We are now confident we know how to build AGI as we have traditionally understood it. We believe that, in 2025, we may see the first AI agents “join the workforce” and materially change the output of companies. We continue to believe that iteratively putting great tools in the hands of people leads to great, broadly-distributed outcomes."
Sam Altman também dividiu com a Bloomberg detalhes bem legais sobre os bastidores da empresa, o impacto global do ChatGPT e como ele enxerga o futuro da inteligência artificial.
O papo começa com o lançamento do ChatGPT em 2022, uma decisão que não foi exatamente unanimidade dentro da OpenAI. Muitos acreditavam que o modelo ainda não estava pronto, mas Sam bancou a ideia. O resultado? Em questão de dias, o ChatGPT estava em todos os lugares, com um crescimento tão rápido que deixou a equipe sem tempo para pensar muito no que vinha a seguir. A solução improvisada para lidar com os custos e a infraestrutura foi o modelo de assinatura, algo que acabou dando muito certo.
Na entrevista, Sam relembra os primeiros anos da empresa, quando a ideia de criar uma AGI (inteligência artificial geral) era considerada quase absurda. Ele e Ilya Sutskever, um dos cofundadores, apostaram em uma visão ousada e recrutaram mentes brilhantes dispostas a arriscar. Essa fase, segundo ele, foi uma das mais marcantes: um grupo pequeno, cheio de energia, trabalhando em algo que parecia inatingível.
Ele também comentou sobre as surpreendentes formas como o ChatGPT vem sendo usado. Entre as aplicações mais impactantes estão a substituição do Google para buscas e o uso em diagnósticos médicos. Sam cita histórias de usuários que descobriram doenças raras ou resolveram problemas de saúde com a ajuda da ferramenta. De acordo com ele, entender essas aplicações reais é fundamental para planejar os próximos passos.
A fama repentina também foi abordada. Ele brinca que a velocidade com que se tornou conhecido mundialmente é mais comum no mundo das celebridades do que no da tecnologia. Apesar disso, ele garante que, dentro da OpenAI, o foco é manter os pés no chão e seguir com a pesquisa e o desenvolvimento.
Olhando para o futuro, ele está confiante de que 2025 será um ano revolucionário e mencionou o desenvolvimento de novos modelos, como o o3, que superaram benchmarks históricos e prometem resolver problemas científicos em larga escala. Mas a meta principal segue intacta: criar uma superinteligência capaz de transformar o mundo de forma positiva - e segura.
O melhor resumo dos LLMs em 2024
Se 2024 foi um ano de algo, foi de avanços insanos no campo dos modelos de linguagem (LLMs). Simon Willison fez um apanhado das maiores novidades e aprendizados desse universo e, olha, tem muita coisa. Vou trazer 8 highlights para vocês.
Primeiro, o que parecia ser inatingível: modelos que superassem o GPT-4. Em dezembro de 2023, ele ainda era a referência absoluta, mas isso mudou. Agora existem 70 modelos que superam o GPT-4 original (de março de 2023), com 18 organizações diferentes na briga, incluindo Google, Anthropic, Meta e Amazon. O destaque? O Gemini 1.5 Pro do Google, que chegou em fevereiro e não só igualou o GPT-4, mas trouxe novos truques, como contexto de 2 milhões de tokens e a habilidade de lidar com vídeos. Isso mesmo: agora dá para mandar um filme inteiro para o modelo entender.
Outra coisa que explodiu foram os contextos longos. Antes, os modelos aceitavam algo em torno de 8 mil tokens. Hoje? A conversa é em outra escala: praticamente todos os modelos relevantes passam de 100 mil, e o Gemini chega a lidar com livros inteiros ou toneladas de códigos para ajudar com problemas mais complexos. Isso ampliou absurdamente o que é possível fazer com um LLM.
Mas nem tudo foi sobre avanços. Por alguns meses em 2024, tivemos acesso universal aos melhores modelos de graça. O GPT-4o, Claude 3.5 Sonnet e Gemini 1.5 Pro estavam livres para o mundo explorar, dando uma amostra do que esses sistemas realmente podiam fazer. Infelizmente, isso durou pouco. Com o lançamento do ChatGPT Pro pela OpenAI – a US$ 200 por mês – a era do acesso gratuito acabou, e não parece que vai voltar tão cedo. Isso reflete o custo crescente de modelos como o o1 Pro, que gastam mais computação para oferecer resultados melhores.
E não é só isso. Em 2024, a eficiência dos modelos deu um salto tão grande que você pode rodar alguns deles no seu próprio laptop. Simon cita exemplos como o Qwen2.5-Coder-32B e o Llama 3.3 70B da Meta, que ele rodou em um MacBook Pro de 2023. É incrível pensar que algo tão poderoso não precisa mais de um datacenter cheio de GPUs caríssimas.
Agora, vamos falar de preços. Se você achava que rodar LLMs era caro, boas notícias: os custos despencaram. O modelo mais caro da OpenAI hoje é 12 vezes mais barato que o GPT-4 era em 2023, e outros players, como Google e Anthropic, estão cobrando centavos por milhão de tokens. Essa competição feroz está tornando a IA acessível como nunca.
Outro grande destaque de 2024 foi o crescimento dos modelos multimodais – aqueles que conseguem trabalhar com texto, imagem, áudio e até vídeo. O Gemini 1.5 Pro, o Claude 3.5 da Anthropic e outros modelos estão liderando essa evolução, e ferramentas como ChatGPT agora podem interpretar imagens em tempo real ou responder com áudio super natural. A interação entre humanos e IAs nunca pareceu tão fluida.
Ah, e se você curte tecnologia aplicada, aqui vai um gostinho do futuro: os LLMs estão se tornando mestres em criar aplicativos a partir de prompts. A ideia que começou com o Claude Artifacts da Anthropic agora está por todo lado. Com alguns comandos, você consegue gerar apps interativos direto na interface do modelo. Essa funcionalidade já é quase um padrão, e em 2025 promete aparecer em ainda mais lugares.
Por outro lado, o termo "slop" ganhou destaque em 2024 para descrever conteúdo gerado por IA que é irrelevante ou mal feito. Isso se tornou uma expressão comum para abordar o excesso de informações sem utilidade que tem surgido com o aumento de produção automatizada. O impacto disso ainda está sendo discutido, mas ajuda a diferenciar o que é útil no universo da IA.
No geral, 2024 foi um ano de consolidação e avanços para os LLMs. O que antes parecia limitado a grandes laboratórios agora está acessível a mais organizações, mais pessoas e mais dispositivos. Com eficiência, preços menores e aplicações cada vez mais criativas, o que vimos neste ano é só o começo de um novo capítulo para a inteligência artificial.