O Corpus do Português, é um ótimo site que oferece um meio inédito de esquadrinhar a língua portuguesa.

Ele funciona como um “quem é quem” do idioma. Mostra a popularidade de palavras ou de frases buscadas entre milhares de textos. Esse grande arquivo forma o corpus da língua, que representa as diversas variedades lingüísticas do português.

O corpus reúne mais de 50 mil textos, de diversas fontes, somando 45 milhões de palavras em português dos anos Trezentos (1300) aos Novecentos (1900). Há quatro registros principais: jornalístico, acadêmico, falado e de ficção.

A interface permite pesquisar palavras exatas ou frases, curingas, lemas, classes gramaticais, ou qualquer outra combinação. Proporciona também a pesquisa de palavras vizinhas com um máximo de dez palavras de cada lado (ex: todos os substantivos perto de cadeia, todos os adjetivos perto de mulher, ou todos os substantivos perto de girar).
O corpus também facilita, de pelo menos três maneiras diferentes, a comparação da freqüência e distribuição de palavras, frases e construções gramaticais através de textos:

Registro: comparações entre o falado, a ficção, o jornalístico, e o acadêmico
Dialeto: Portugal versus Brasil no século XX
Período histórico: comparação de séculos diferentes dos anos Trezentos [1300] aos Novecentos [1900]

Realizam-se com facilidade consultas de semântica no corpus. Por exemplo, a diferença de significado entre duas palavras relacionadas, pode ser determinada através da comparação e contraste das palavras vizinhas. Pode-se encontrar a freqüência e a distribuição de sinônimos de mais de 20.000 palavras e comparar esta freqüência em registros ou países diferentes, ou inclusive ao longo dos séculos. Estas listas de palavras podem ser armazenadas e usadas em futuras consultas. Pode-se, além disso, criar suas próprias listas de palavras com um parentesco semântico, e usá-las como parte da consulta.

Faça uma pequena excursão de três minutos que apresentará os aspectos principais do corpus. Um simples clique para cada consulta preencherá automaticamente o formulário de pesquisa, pesquisará 45 milhões de palavras em textos diversos, e exibirá os resultados. O Corpus é rápido, grátis, fácil de usar, e oferece características importantes não encontradas em nenhuma outra interface existente.

Via Infoescravo | Sites relacionados: Projeto Linguateca | Banco de Português.


Artigos relacionadosLeia também:
Enviar | Recomendar Enviar | Recomendar |


Nenhum Comentário para “A minha pátria é a língua portuguesa – O Corpus do Português”

  1. Jorge disse:

    Sempre descobrindo coisas úteis e de valor cultural, não é doutor? abração
    Passa lá depois.

  2. Fernando Pessoa disse:

    A minha também!

  3. Teca disse:

    muito bom este serviço… muito valiosa a sugestão… amei.. obrigada e bom final de semana abraços. teca

  4. Cris Caetano disse:

    Para mim vai ser preciso mais de 3 minutos para me entender na pesquisa.

    É muita informação… puxei o link de palavras personalizadas… bastante interessante. Gostei! Valeu a dica!
    Beijos

  5. Eduardo Tetera disse:

    Então vou também seguir dica tua. Vai aí o vídeo do Maurício Ricardo.

  6. Cris Caetano disse:

    Recebi esse vídeo de uma amiga portuguesa. É impressionante a habilidade dele e a idéia de onde partiu. Achei muito bacana a intenção dele de “nos” fazer pensar através da “sacanagem”. A visão antecipada que temos dos desenhos é o grande lance.

    Ah! Vou fazer um “copy&paste” deste teu post, principalmente depois da notícia da “cassação” do gerúndio lá pras bandas do DF.
    Beijo

Dê sua opinião


Escolha o tema: 1 2 3 4 5 6 7 8

Assine grátis

Receba os artigos diariamente:

Menu

Grupo Tetera

Twitter

twitter.com/EduardoTeteraSiga Eduardo Tetera no Twitter.
O Grupo Tetera também está no Twitter. Clique aqui