21/03/2026 - 9:37
Nos racks do supercomputador “Marvin”, na Universidade de Bonn, uma revolução silenciosa processa bilhões de palavras. Ali, pesquisadores do projeto Polyglot deram vida ao Tucano 2, uma inteligência artificial generativa que rompe com a hegemonia do inglês no Vale do Silício. Diferente das ferramentas comerciais que traduzem pensamentos do inglês para o português, o Tucano 2 é um modelo nativo: ele “pensa”, raciocina e resolve problemas complexos diretamente no idioma de Camões, Machado de Assis e Conceição Evaristo.
Resumo
O problema: IAs globais (como ChatGPT) são nativas em inglês, o que exige mais “esforço” computacional e tradução interna para responder em português, gerando custos altos e perda de nuances culturais.
A solução: o Tucano 2, um modelo de linguagem de código aberto treinado no GigaVerbo (maior base de dados lusófona), que executa sua “cadeia de pensamento” diretamente em português.
Ganho de eficiência: a ferramenta demanda até 30% menos tokens (pedaços de palavras) para resolver tarefas, o que acelera a resposta e reduz drasticamente o consumo de energia.
Impacto social: por ser open source, o projeto democratiza o acesso à tecnologia para pesquisadores e empresas de todos os países que falam português, sem depender de modelos opacos de grandes corporações.
A iniciativa, financiada pelo governo alemão, surge para combater a desigualdade digital. Atualmente, idiomas sub-representados na IA acabam reféns de modelos “reciclados” de grandes corporações. “O paradigma atual ampliou a lacuna, tornando difícil para falantes de línguas com menos recursos moldar tecnologias que reflitam suas identidades culturais”, afirma a equipe do projeto.
Links relacionados
Como a inteligência artificial está moldando o desenvolvimento das crianças
Levantamento revela as 44 profissões mais ameaçadas pela inteligência artificial
O atalho do raciocínio nativo
A grande vantagem do Tucano 2 reside na eficiência. Para a IA, palavras são quebradas em unidades chamadas tokens. Em modelos nativos em inglês, uma palavra complexa em português pode exigir dezenas de pedaços para ser processada. No Tucano 2, esse caminho é encurtado.
“Em vez de precisar gerar 50 pedacinhos para a palavra ‘onomatopeia’, ele só precisa de dois”, explica o pesquisador Nicholas Kluge. Essa otimização resulta em uma economia de até 30% no uso de tokens. Em um mundo onde a IA é criticada pelo altíssimo consumo de energia e emissões de CO2, o “atalho linguístico” brasileiro-alemão representa uma alternativa sustentável e economicamente viável.
“Monólogo interno” e nuance cultural
Durante os testes, a reportagem solicitou uma lista de autoras brasileiras contemporâneas. Antes de entregar a resposta, o Tucano 2 exibiu seu “raciocínio”: “Preciso garantir nomes importantes… Devo incluir diversidade regional… É importante incluir vozes femininas”.
Essa transparência na “cadeia de pensamento” ajuda a evitar alucinações e garante que expressões idiomáticas e contextos históricos não se percam na tradução. Para Kluge, a ideia de que um modelo treinado em inglês atende todas as nuances do português é uma ilusão. O Tucano 2 prova que a especificidade linguística é a chave para uma IA mais precisa e humana.
Código aberto: uma IA para todos
Ao contrário das IAs “caixa-preta” das Big Techs, o Tucano 2 é totalmente transparente. Todo o seu “manual”, pacotes de dados e configurações foram publicados em código aberto. Isso significa que qualquer universidade ou empresa em Angola, Portugal, Moçambique ou Brasil pode replicar a tecnologia em sua própria infraestrutura.
Embora ainda seja um projeto acadêmico com limites de uso no supercomputador universitário, o Tucano 2 já é um marco na soberania tecnológica lusófona. Ele não é apenas um chatbot; é um manifesto de que o futuro da inteligência artificial também fala português.
