Por Vanessa Prata
À primeira
vista, trabalhar com corpora (singular = corpus) pode parecer confuso, mas basta
um pouquinho de prática para perceber que essas ferramentas podem ser aliadas
não apenas dos pesquisadores nas áreas de Linguística e Tradução, mas também dos
professores de idiomas e até mesmo para alunos a partir de um nível
pré-intermediário.
O que é corpus?
Corpus nada
mais é do que um grande banco de dados eletrônico, uma coletânea de textos
(reais) selecionados com finalidade de pesquisa. Em Português temos, por
exemplo, o corpusdoportugues.org, com 45 milhões de palavras, e o
corpusbrasileiro.pucsp.br, com 1 bilhão de palavras. Em inglês, alguns dos
corpora mais comuns são o www.americancorpus.org, com 425
milhões de palavras, e o British National Corpus (http://www.natcorp.ox.ac.uk), com 100
milhões de palavras.
Mas, afinal, para que serve um
corpus?
Serve para
pesquisar a língua, identificar padrões de uso, saber o que é mais “aceitável”
em termos de colocações, identificar a carga semântica de uma palavra (se certo
vocábulo é usado mais em contextos positivos, negativos ou neutros), entre
outras possibilidades. Diferentemente de um dicionário, o corpus não traz a
definição das palavras, mas exemplos de frases que usam determinado item
lexical, assim, pelo contexto, muitas vezes é possível perceber o sentido das
palavras.
Como funciona um corpus?
Ninguém
precisa ser pesquisador para começar a usar um corpus (todos os exemplos acima
são de uso gratuito, alguns exigem apenas um cadastro, mas qualquer pessoa pode
fazer). Bastam algumas instruções iniciais para entender a “lógica” desses
bancos de dados e a pesquisa restante pode se tornar até mesmo uma grande
diversão.
Na página
inicial haverá um campo em branco para se digitar o termo a ser pesquisado.
Vamos usar o www.americacorpus.org
como exemplo. Veja a tela inicial.
Em “words”, digite a palavra que você quer buscar; e em “collocates” digite outro termo se quiser que as duas palavras apareçam na mesma frase (os números ao lado indicam até quantas palavras antes ou depois do termo principal serão consideradas para a pesquisa do termo secundário). Nos quadros abaixo há ainda a opção de escolher linguagem oral, acadêmica, apenas de jornais, apenas de publicações de ficção etc., ou apenas clique em “ignore” para abranger tudo. Feito isso, clique em “search”, e o sistema apresenta uma janela ao lado com a palavra, o número total de “ocorrências” e, embaixo, os primeiros exemplos de frases contendo a palavra selecionada (no caso busquei a palavra “language”).
Por meio
das frases apresentadas, identificamos como a palavra costuma ser usada em
contextos reais (com ou sem preposição? com ou sem objeto?) e com que outros
termos ela é geralmente associada, ou seja, quais as colocações mais comuns (e
as menos comuns). Um corpus, por ser uma coletânea de textos, não apresenta
todas as possibilidades linguísticas, claro, mas as mais prováveis. Se não
encontrarmos algo no corpus, isso não significa que o termo ou combinação não
exista, mas pode indicar que não é uma colocação comum.
E como
um aluno pode se beneficiar do corpus?
Um aluno
que se habitue a pesquisar no corpus certamente desenvolverá uma autonomia de
estudos e conseguirá resolver muitas dúvidas sem precisar recorrer ao professor
todas as vezes. Um corpus não dará a resposta para tudo, mas pode indicar o
caminho mais provável. Vamos supor que o aluno esteja escrevendo uma redação
sobre aborto, e esteja em dúvida se o correto é “make”, “do” ou “have” an
abortion. Talvez num dicionário ele não encontre essa resposta, mas o corpus
pode ajudar. Ao digitarmos “abortion” em words, e “make” em collocates, temos 93
ocorrências (por questão de espaço aqui não entrarei em detalhes sobre o sentido
das frases, mas ao lermos percebemos que não é a ideia de “fazer um aborto”). Ao
digitarmos abortion com “do”, temos 165 ocorrências, mas novamente elas não
transmitem a ideia que queremos. Já ao digitar “have” em collocates, temos 666
ocorrências, entre elas exemplos como: “Is anyone forcing you to have an
abortion?” e “It is a woman’s right to decide whether or not to have an
abortion”, que mostram o sentido que procurávamos.
Outro
exemplo: suponhamos que o aluno está em dúvida se é “do” ou “make” the dishes.
Ao usar o corpus, digitando “dishes” como words e “make” como collocates,
encontramos 81 ocorrências, como “make healthy dishes” ou “make certain dishes”,
que não é o sentido que queremos, de “lavar louça”. Já ao digitarmos “do” em
collocates, temos 211 ocorrências, entre elas: “My roommates never to their own
dishes” e “The kids decide which of them will set the table, do the dishes or
prep the food”, que trazem o sentido que queríamos.
Assim, um
corpus não dará a resposta para “como se diz lavar a louça em inglês”, mas ajuda
a tirar dúvidas quanto ao uso da língua e desenvolve a autonomia de estudo nos
alunos que já possuam algum conhecimento do idioma.