Um instrumento para ler o que a literatura esqueceu de dizer
A maioria das ferramentas que leem textos científicos tenta responder "o que este artigo diz?". Eu fiquei interessado na pergunta oposta, e bem mais difícil: o que este artigo deveria ter dito e não disse?
Não me refiro a erros. Refiro-me a omissões estruturais — o ponto em que um argumento atravessa uma ponte historicamente obrigatória sem justificar a travessia. O lugar onde o autor passa reto por uma dificuldade conhecida como se ela não existisse. Construí um sistema para procurar exatamente esses pontos.
A ideia: pontuar a omissão, não a presença
O núcleo é o que chamo de Omission Score. Em vez de medir o que um argumento contém, ele mede o que um argumento evita. Para um micro-domínio escolhido, o sistema define um pequeno conjunto de "pontes obrigatórias" — passos que qualquer tratamento sério do problema precisa enfrentar — e então lê cada trabalho perguntando, ponte por ponte:
- o autor enfrenta este passo como objeto matemático, ou só o menciona de passagem?
- ele estabelece limites com base na literatura, ou assume o resultado?
- ele controla a dificuldade central, ou contorna sem dizer que contornou?
Cada ausência injustificada vira pontuação. O resultado não é "este artigo está errado" — é "este argumento tem um buraco aqui, e o buraco tem um formato reconhecível".
A diferença entre uma lacuna e um erro é sutil: o erro afirma algo falso; a lacuna deixa de afirmar algo necessário. A segunda é muito mais fácil de não ver — inclusive para quem escreveu.
Por que isso é interessante
Quando você pontua omissões assim em várias famílias de trabalhos sobre o mesmo problema, algo curioso aparece: as lacunas se alinham. Argumentos que usam ferramentas completamente diferentes — probabilísticas, combinatórias, analíticas — às vezes evitam exatamente o mesmo obstáculo, cada um pela sua própria razão. E quando três famílias independentes desviam do mesmo ponto, esse ponto provavelmente não é coincidência. É estrutura.
Foi exatamente isso que o sistema encontrou no primeiro domínio em que rodou a sério.
O achado: uma barreira que é um gradiente
Trabalhando sobre dinâmicas do tipo Collatz, o sistema apontou que três famílias de resultados encontram a mesma fronteira — ligada à razão entre as escalas de adição e multiplicação no problema — por motivos arquiteturalmente distintos:
- uma abordagem probabilística é simplesmente cega à fronteira: a aleatoriedade não enxerga a rigidez aritmética que a produz;
- uma abordagem combinatória a evita: o tipo de plasticidade de que ela precisa seria destruído por essa rigidez;
- uma abordagem analítica consegue atravessá-la — mas só nos casos de menor complexidade.
O ponto não trivial é a conclusão: a barreira não é um muro, é um gradiente de tratabilidade. Permeável de um lado, progressivamente impermeável conforme a complexidade cresce. Um matemático externo revisou o resultado e o descreveu como um insight arquitetural de alto nível, não previamente formalizado daquela forma na literatura.
Não é uma prova de nada — e o sistema é deliberadamente honesto sobre isso. É um mapa de onde a dificuldade real mora, produzido lendo o que dezenas de autores não disseram.
O que eu aprendi construindo isso
Três coisas ficaram comigo:
- Ausência é um sinal mensurável. A intuição de que "falta algo aqui" pode ser operacionalizada — basta decidir, antes de ler, quais pontes são obrigatórias e depois ser implacável ao cobrá-las.
- Convergência de lacunas é mais informativa que convergência de resultados. Quando métodos diferentes concordam, é esperado. Quando eles evitam a mesma coisa, você encontrou o osso do problema.
- Rigor é, antes de tudo, disciplina de falsificação. O sistema só promove um achado depois de tentar destruí-lo. A maior parte do valor está em tudo que ele descarta no caminho.
É um projeto de pesquisa em andamento, e continua evoluindo. Mas a tese central já se provou útil: às vezes a informação mais valiosa de um texto está exatamente naquilo que ele escolheu não dizer.