8/7/10

The British National Corpus



The British National Corpus es una ingente recopilación de textos en inglés que incluye alrededor de cien millones palabras anotadas tanto escritas como habladas y tomadas de todos los dialectos del idioma y de cualquier forma de representación, desde obras literarias a periódicos, pasando por cartas o ensayos. El corpus oral se ha transcrito para poder se manejado. Es un proyecto desarrollado por el BNC Consortium que aglutina a varias editoriales y universidades. El proceso de categorización (tagging) permite la computerización del corpus.








No hay comentarios:

Publicar un comentario