Apple revela novo modelo de linguagem capaz de gerar textos longos com velocidade impressionante

A Apple acaba de revelar um avanço importante em inteligência artificial: um novo modelo de linguagem chamado FS-DFM (Few-Step Discrete Flow-Matching), desenvolvido em parceria com a Universidade Estadual de Ohio.

A descoberta foi detalhada em um artigo científico publicado no repositório arXiv, e trazida pelo Marcus Mendes, do 9to5Mac, que destacou o potencial dessa tecnologia para transformar a geração de texto em larga escala.

A pesquisa pode não apenas melhorar a Siri e a Apple Intelligence, mas trazer grandes benefícios à Inteligência Artificial como um todo.

O que é o FS-DFM

O novo modelo da Apple tem como objetivo gerar textos longos com qualidade e velocidade muito superiores aos métodos tradicionais.

Hoje, a maioria dos modelos de linguagem (como o GPT, por exemplo) cria frases token por token, ou seja, palavra por palavra. Esse processo é preciso, mas lento.

Já o FS-DFM se baseia em uma técnica de “flow matching” discreto, que permite ao modelo refinar o texto em poucas etapas.

Em vez de milhares de iterações, o sistema consegue atingir resultados de alta qualidade em apenas oito rodadas de processamento.

Isso representa uma economia enorme de tempo e poder computacional.

Como ele funciona

O segredo está em três estratégias principais descritas no paper:

Treinamento adaptável a diferentes orçamentos de iterações: o modelo é treinado para gerar bons resultados mesmo com poucos passos de refinamento.
Uso de um “modelo professor”: durante o aprendizado, um modelo mais robusto orienta o FS-DFM, garantindo atualizações mais estáveis e sem desviar do resultado desejado.
Aprimoramento progressivo das iterações: cada etapa é projetada para tornar o texto mais coerente e natural, sem redundâncias.

Nos testes, versões do FS-DFM com diferentes tamanhos, de 170 milhões a 1,7 bilhão de parâmetros, conseguiram resultados comparáveis (ou até melhores) que modelos de difusão muito maiores, com perplexidade menor e entropia mais estável. Isso significa textos mais fluidos, previsíveis e com menos repetições.

Esse tipo de inovação pode reduzir drasticamente o custo e o tempo de geração de texto, tornando modelos de IA mais rápidos e eficientes, algo crucial para o avanço de assistentes inteligentes como a Siri e para as futuras aplicações de Apple Intelligence.

A Apple raramente divulga publicamente suas pesquisas em IA, mas quando o faz, costuma ser sinal de que a tecnologia está madura o suficiente para ser integrada a produtos reais.

Se a empresa aplicar o FS-DFM em seus sistemas, veremos respostas mais rápidas, longos resumos e textos complexos sendo criados quase instantaneamente, mantendo o controle de qualidade que a Apple sempre busca.

Código aberto e colaboração científica

Outro ponto interessante é que os autores pretendem liberar o código e os checkpoints do modelo, o que é raro para a Apple.

Essa abertura permitirá que outros pesquisadores testem, ajustem e ampliem o trabalho, fortalecendo a comunidade científica em torno da geração de texto por IA.

Se essa tecnologia realmente for incorporada à Apple Intelligence nas próximas versões do iOS, ela poderá representar um salto de qualidade semelhante ao que o Neural Engine trouxe anos atrás, consolidando a Siri como uma das assistentes mais rápidas e avançadas do mercado.