Corpus — это специально составленнная и обработанная по определённым правилам совокупность текстов, используемая как база для лингвистических исследований языка. Тексты в такой базе могут быть примерами как письменной, так и устной речи. Сейчас корпуса существуют преимущественно в электронном виде. Они хорошо отражают особенности языка и его разновидности, а ещё происходящие в языке изменения.
Корпус можно использовать для:
- анализа языковых единиц;
- изучения реального употребления слов, грамматических конструкций, устойчивых выражений и коллокаций;
- разработки материалов, основанных на "живом" языке;
- проверки лингвистических гипотез;
- убеждения учеников в том, что "так точно говорят, вот, смотрите!".
Два самых популярных на сегодня корпуса английского языка это BNC, British National Corpus, и COCA, Corpus of Contemporary American English.