A Matemática das pesquisas científicas
O que um matemático autodidata do século XIX tem a ver com a procura de artigos no Pubmed? Tudo.
Tive idéia pra este texto quando estava pesquisando sobre enxertos ósseos tridimensionais personalizados. Estava eu no PubMed pesquisando esse tema complexo — que envolve desde tipos e propriedades dos biomateriais, passa por histologia e fisiologia óssea chegando nas tecnologias digitais — e me deparei com um oceano de informações.
Como o assunto é vasto e exigiu muitas e muitas filtragens para encontrar o que realmente interessa, foi ali que me dei conta da genialidade por trás do que chamamos de “equações booleanas”. É uma ferramenta incrível para, de fato, separar o joio do trigo na busca científica, e acho que vale compartilhar pra quem ainda sofre na hora de buscar artigos.
Mas antes de entender como o Pubmed funciona e como você pode melhorar suas buscas, vamos voltar pra 1854 e conhecer um cara chamado George Boole:
Ele foi um foi um matemático britânico de origem humilde: filho de um sapateiro e sem dinheiro para frequentar a universidade, ainda mais na época em que nasceu. Mas sendo um autodidata brilhante, aprendeu latim e grego por conta própria e que acabou fundando, segundo Bertrand Russell, a matemática da lógica.
Com 34 anos, Boole publicou sua obra-prima: “The Laws of Thought” (As Leis do Pensamento). Até aquele momento, a lógica era considerada apenas um ramo da filosofia.
O grande “pulo do gato” de Boole foi perceber que a lógica poderia ser traduzida em equações matemáticas simples, usando um sistema binário: Verdadeiro (1) ou Falso (0). E isso, se você não mora numa caverna isolada no meio do mato, já deve ter ouvido falar, correto? É a base da computação que usamos em 200% da nossa vida, e tem tudo a ver com que vem a seguir.
Mas você deve estar se perguntando: “O que diabos zeros e uns têm a ver com encontrar artigos cinetíficos?”
A resposta é: Tudo.
Para um computador, como os do PubMed e outras bases de busca, não existe “talvez” ou “quase” ou mesmo um “pode ser”... O artigo contém o termo que você quer? Se sim, é 1 (Verdadeiro). Se não, é 0 (Falso).
É aqui que a lógica toda acontece: quando usamos os operadores que vamos ver a seguir, estamos basicamente dando instruções matemáticas de como combinar esses “uns” e “zeros”.
Você transforma sua busca em uma “conta matemática” que permite a máquina resolver e decidir o que jogar na sua tela e o que esconder. Vamos entender:
O Motor da Pesquisa Bibliográfica
Quem me dera fosse simples eu colocar lá no PubMed, Scopus ou BVS um termo como “toxina botulínica”, por exemplo, e já aparecer vários artigos relevantes para minha pesquisa.
Na verdade, numa pergunta assim, o mais comum é aparecer centenas ou milhares, ou até dezenas de milhares artigos. No caso de toxina, são mais de 13.000 artigos.
Daí, caberia você filtrar estes milhares de artigos com os assuntos mais específicos que você deseja saber sobre toxina botulínica. Mas estes, talvez chegue em poucas dezenas. Separar estas dezenas dos milhares é que complica a busca.
Temos de partir então pra entender que as bases de dados não “pensam” como humanos; elas operam baseadas em lógica matemática.
E justamente esta lógica é orientada pelos Operadores Booleanos (lembra do George Boole?)
Estes operadores (AND, OR, NOT) funcionam como comandos que orientam os sistemas de busca sobre como combinar, incluir ou excluir os termos que você escolheu. E entender o funcionamento de cada um é justamente diferença entre encontrar 10 artigos de alta relevância no assunto que você quer ou se perder em 10.000 resultados inúteis.
Então vamos explicar cada um deles
AND (Interseção): Foco e direcionamento
O operador AND é utilizado quando queremos que o artigo recupere todos os termos citados simultaneamente. Ele é uma ferramenta de restrição. Quanto mais termos você conecta com AND, menor e mais específico será o seu resultado.
Por exemplo, imagine que você deseja investigar a taxa de sucesso de implantes em pacientes com osteoporose.
Se você digitar apenas Implantes Dentários, virão milhões de resultados, em pacientes com e sem osteoporose e alguns milhares de variáveis.
Se digitar apenas Osteoporose, virão artigos de ortopedia, endocrinologia, gerontologia etc.
Ao usar o operador de interseção, você ordena à base de dados que cruze as informações:
String de busca: Implantes Dentários AND Osteoporose
O resultado trará apenas os artigos que contêm ambos os conceitos. Se um artigo falar sobre implantes mas não citar osteoporose, ele será descartado.
Ufa, começou a melhorar, mas tem mais:
OR (União): Os Sinônimos
Na ciência, diferentes autores usam diferentes nomes para descrever o mesmo fenômeno, material ou técnica. O operador OR é a ferramenta de expansão. Ele instrui a base de dados a trazer artigos que contenham pelo menos um dos termos listados. É fundamental para agrupar sinônimos.
Agora, considere uma pesquisa sobre preenchimento labial. Um autor pode usar o termo “Preenchedores Dérmicos”, outro pode usar especificamente “Ácido Hialurônico”. Se você buscar apenas por um deles, perderá toda a literatura que usou o outro termo.
Para evitar esse problema, usamos o OR:
String de busca: “Ácido Hialurônico” OR “Preenchedores Dérmicos”
Neste caso, a base trará, um, outro ou os dois termos.
Artigos que falam só de Ácido Hialurônico.
Artigos que falam só de Preenchedores Dérmicos.
Artigos que falam dos dois.
Mas ele não se restringe a 2 termos sinonimos, se tiver 4, 5 ou mais termos, você pode agrupar da mesma forma. Mas veja com atenção o string acima: utilizamos aspas, e isso também vai ser importante e vamos explicar daqui a pouco.
3. NOT (Exclusão): O filtro
O operador NOT (ou pode ser também o sinal de menos “-” conforme a base) serve para excluir termos indesejados dos resultados.
Ele precisa ser usado com cuidado, pois pode remover artigos relevantes acidentalmente , caso o termo excluído for apenas citado no texto de forma comparativa.
Nesse caso, suponha que você esteja pesquisando sobre complicações vasculares com necrose em Harmonização Facial. Algo bem específico, mas seus resultados estão poluídos por muitos artigos sobre complicações em procedimentos corporais (glúteos, pernas) que não te interessa. Você pode limpar sua busca:
String de busca: Necrose AND “Ácido Hialurônico” NOT Glúteos
Dessa forma, a busca ignora qualquer literatura que mencione a glúteos, focando na face (assumindo que os artigos de face não mencionem glúteos nem para comparação).
(Entre Parênteses): Organizando a bagunça
Na escola, numa lembrança ainda que remota, você aprendeu que numa equação matemática você inicia a conta resolvendo os parênteses de dentro pra fora, correto?
Porque o que está entre parênteses funciona como uma equação “avulsa” dentro da equação maior. Os parênteses neste caso ajudava a ordenar, portanto, a sequência em que a equação deveria ser resolvida.
Isso vai ajudar porque quando misturamos AND e OR na mesma busca, o uso de parênteses ( ) é obrigatório para que o sistema entenda o que agrupar primeiro. A regra de ouro é: coloque os sinônimos (“XXXX” OR “YYYY” ) sempre dentro de parênteses.
Para exemplificar, vamos construir uma busca complexa em Implantodontia: você quer saber sobre a perda óssea (Conceito A) ao redor de implantes de zircônia (Conceito B).
Conceito A (Problema) tem os sinônimos: Perda óssea, Reabsorção óssea, Perimplantite.
Conceito B (Material) tem outros sinônimos: Implantes de Zircônia, Implantes Cerâmicos.
Neste exemplo astring ideal, portanto, seria:
(”Perda Óssea” OR “Reabsorção Óssea” OR Perimplantite) AND (”Implantes de Zircônia” OR “Implantes Cerâmicos”)
Sem os parênteses, a base de dados poderia interpretar que você quer qualquer artigo sobre Perimplantite (mesmo em titânio) OU qualquer artigo sobre Implantes de Zircônia.
Os parênteses garantem que o sistema primeiro reúna todas as variações de “perda óssea”, depois reúna todas as variações de “zircônia”, e só no final faça a interseção (AND) entre os dois grupos.
Ficou confuso, então mais um exemplo pra você gravar:
String errada: Membrana AND Regeneração Óssea Guiada OR Enxerto Ósseo
O buscador pode entender: “Quero tudo sobre Membrana e ROG... OU então me traga qualquer coisa sobre Enxerto (mesmo sem membrana).”
String Certa: Membrana AND (“Regeneração Óssea Guiada” OR “ROG” OR “Enxerto Ósseo”)
O buscador entende: “O artigo deve ter a palavra Membrana E, obrigatoriamente, deve falar também de ROG ou de Enxerto.”
Sintaxe da Busca: Pontuação e Modificadores
Se os Operadores Booleanos (AND, OR, NOT) são o motor do carro, a Sintaxe é o volante. É ela que dá a direção exata e evita que você bata em um muro de resultados irrelevantes.
Alí em cima você aprendeu como “pedir” (Booleanos), e agora precisamos aprender a “escrever” o pedido corretamente.
Imagine que você está falando com um computador, as bases de dados são literais. Um espaço fora do lugar, um erro no termo do pedido ou a falta de um sinal gráfico pode alterar completamente o sentido da pesquisa.
Pra isso que servem os sinais de pontuação: funcionam como comandos de formatação. São três principais: Aspas, Parênteses e Truncagem. Parênteses eu expliquei lá em cima, vamos pros outros dois:
Aspas Duplas (” “): A Busca Exata
Na linguagem natural, muitas vezes usamos termos compostos, formados por duas ou mais palavras. Na Odontologia, isso é extremamente comum: Carga Imediata, Levantamento de Seio, Toxina Botulínica, Ácido Hialurônico…
Mas se você digitar Carga Imediata sem aspas, o motor de busca entenderá que você quer artigos que tenham a palavra “Carga” (que pode ser carga viral, carga elétrica) E a palavra “Imediata” (resposta imediata, dor imediata, etc), em qualquer lugar do texto. O risco de trazer “lixo informacional” é alto.
Pra resolver isso, ao usar aspas — “Carga Imediata” — você “cola” as palavras. O buscador só trará resultados onde essas duas palavras aparecem juntas e exatamente nessa ordem.
Truncagem (*): A Raiz da Palavra
A truncagem (representada geralmente pelo asterisco *) é o recurso mais inteligente para economizar tempo. Ela serve para buscar todas as variações de sufixo de uma palavra.
Ao colocar o asterisco no final da raiz de uma palavra, você diz ao sistema: “Busque qualquer termo que comece com essas letras”.
Um exemplo, eu quero tudo que traga o termo ImplantXXXXX. Em vez de digitar todas as variações que você lembra, tipo (Implante OR Implantes OR Implantodontia OR Implantar) etc, Você digita apenas: Implant*, com asterisco no final
O sistema recuperará automaticamente:
Implant (singular)
Implants (plural)
Implantation (processo)
Implantable (adjetivo), e por aí vai.
Mas cuidado: Se a raiz for muito curta, você atrairá muita porcaria. Por exemplo, se você utilizar Cat* (Para buscar tudo relacionado a gatos). O sistema trará: Cat, Categoria, Catalise, Cateter...
A “String” Perfeita: Unindo Tudo
Agora, vamos montar uma equação de busca completa (String) para um cenário clínico real: Você quer investigar a estética vermelha (gengiva) em implantes na região anterior.
Conceito 1 (Onde): Implantes (Implant*)
Conceito 2 (O quê): Estética (”Estética Rosa” ou “Tecido Mole” ou Gengiva)
Conceito 3 (Região): Anterior (Anterior ou Incisivos)
A String Final:
Implant* AND (”Estética Rosa” OR “Tecido Mole” OR Gengiva) AND (Anterior OR Incisivos)
Nesta linha única, utilizamos:
Truncagem (Implant*) para pegar singular e plural.
Aspas (”Estética Rosa”) para termos compostos.
Parênteses para agrupar os sinônimos com OR.
Intersecção (AND) para cruzar os três conceitos.
Isso é o que separa um pesquisador “amador” que fica perdido pra selecionar um artigo de um “profissional”, que acha o que é relevante para o que está estudando. Enquanto o amador levaria horas lendo resumos inúteis, você terá uma lista limpa e relevante em segundos. Daí sim, cabe sua leitura de cada artigo para selecionar o que se encaixa em sua pesquisa.
Muito mais simples seu trabalho, concorda? E agora é hora de treinar tudo isso:
Onde Aplicar sua Busca (Bases de Dados)
Saber montar uma estratégia de busca sofisticada (”String”) não serve de muito se você procurar no lugar errado. Cada base de dados tem um acervo, um propósito e uma “personalidade” diferente. Algumas são focadas em literatura americana, outras na europeia, outras da américa latina; algumas priorizam a quantidade, outras a qualidade da evidência (Revisões Sistemáticas).
Abaixo, listamos as principais bases de acesso aberto e gratuitos que você deve conhecer:
PubMed (MEDLINE)
Link de acesso: https://pubmed.ncbi.nlm.nih.gov/
O que é: A “bíblia” da área da saúde. É a interface pública gratuita mantida pela National Library of Medicine (EUA). Acessa a base MEDLINE.
Por que usar: É o padrão-ouro. Se um artigo médico é relevante internacionalmente, ele provavelmente está aqui. Possui um vocabulário controlado excelente (MeSH).
Web of Science
Link de acesso: https://www.webofscience.com/
O que é: A mais tradicional base de citações científicas. Historicamente, foi quem definiu o conceito de “Fator de Impacto”.
Por que usar: Extremamente rigorosa na seleção das revistas. Se você busca a “elite” da produção científica e quer analisar quem citou quem (rastreamento de citações), este é o lugar. (Nota: Geralmente requer acesso via instituição/CAFe ou Portal CAPES).
Google Acadêmico (Google Scholar)
Link de acesso: https://scholar.google.com.br/
O que é: O buscador acadêmico do Google. Indexa tudo: artigos, teses, livros, anais de congresso e patentes.
Por que usar: Excelente para encontrar “literatura cinzenta” (materiais não publicados em revistas famosas) e artigos completos em PDF. Um detalhe sobre esta base é que ela indexa tudo e mais um pouco, traz muito “ruído”. Exige filtros mais elaborados do pesquisador pra conseguir usar com propriedade.
Cochrane Library
Link de acesso: https://www.cochranelibrary.com/
O que é: O templo da “Medicina Baseada em Evidência”.
Por que usar: Se você quer saber se um tratamento realmente funciona, vá direto para as Revisões Sistemáticas da Cochrane. Elas são o topo da pirâmide de evidência, com metodologia rigorosíssima.
SciELO (Scientific Electronic Library Online)
Link de acesso: https://scielo.org/
O que é: Um projeto pioneiro de acesso aberto (Open Access) focado na América Latina, Caribe e Península Ibérica.
Por que usar: Fundamental para encontrar literatura em Português e Espanhol, além de estudos sobre a realidade local (epidemiologia brasileira, saúde pública no SUS, etc).
LILACS (via BVS - Biblioteca Virtual em Saúde)
Link de acesso: https://lilacs.bvsalud.org/
O que é: O índice mais importante da literatura científica e técnica da América Latina e Caribe.
Por que usar: Cobre teses, livros e relatórios técnicos regionais que não entram nas grandes bases internacionais (PubMed/Scopus). Vital para contextualizar a pesquisa no cenário sul-americano.
BDTD (Biblioteca Digital Brasileira de Teses e Dissertações)
Link de acesso: https://bdtd.ibict.br/
O que é: Integra os sistemas de informação de teses e dissertações das instituições de ensino e pesquisa brasileiras.
Por que usar: Quer saber o que está sendo pesquisado nas pós-graduações da USP, Unicamp ou UFRJ antes mesmo de virar artigo? Procure aqui. Ótimo para ver monografias completas em português.
Comece a Treinar
Ler sobre natação não ensina ninguém a nadar. Com a busca bibliográfica é a mesma coisa. A lógica de Boole, as aspas e os parênteses só farão sentido quando você vir o número de resultados cair de 10.000 para 50 artigos perfeitos na sua tela.
Que tal acessar uma das bases acima e iniciar seu treino?
Ao contrário do que parece, uma vez entendido esta forma de pensamento, a pesquisa fica natural, fluida. A genialidade de George Boole não estava em complicar a busca, mas em nos dar o poder de conversar com a máquina com que interagimos hoje: Agora que você fala a língua dela, a literatura mundial está, literalmente, ao alcance dos seus dedos.
Boa pesquisa!
Ah, quase esqueci, um infográfico de presente com o resumão deste artigo:
E tem mais uma coisa, agora só para os assinantes mensais ou anuais: Um curso completo de iniciação científica para te ajudar a fazer seu TCC ou monografia:
Curso de Metodologia Científica
Você passa noites em claro só de pensar no TCC? Sente-se perdido sem saber por onde começar, como pesquisar artigos ou de que forma organizar suas ideias?












