Corpus lingüístico

Un corpus lingüístico é un conxunto, normalmente moi amplo, de exemplos reais de uso dunha lingua. Estes exemplos poden ser textos (tipicamente), ou mostras orais (normalmente transcritas).

Chámaselle lingüística de corpus á subdisciplina da lingüística que estuda a lingua a través destas mostras. Este tipo de aproximación choca co enfoque chomskiano que tende a estudar a lingua a través da intuición lingüística do falante.

Esta subdisciplina, dado o volume de datos que se manexa, normalmente asóciase coa lingüística computacional.

Esta disciplina iniciouse en 1967 cando Henry Kucera e Nelson Francis publicaron o clásico Computational Analysis of Present-Day American English, baseándose no corpus Brown, unha compilación de inglés americano de aproximadamente un millón de palabras seleccionadas dunha ampla variedade de fontes.

Véxase tamén

Outros artigos

Ligazóns externas

Corpus paralelo bidireccional portugués-inglés COMPARA

v c e Corpora lingüísticos das linguas iberorromances
Galego lexicográfico	DdD DDGM
Galego textual	CODOLGA TMILG TILG CORGA CLUVI CTG TERGAL TUVI
Galego oral	ASG
Portugués	CPM DPM AC/DC
Castelán textual	CREA CORDE Cumbre Lexesp
Castelán oral	COREC MNLCCMH SoCREA Val.Es.Co C-ORAL-ROM PRESEEA Corpus del Español Histórico y Moderno