11 Часть I. Компоненты 14 Глава Компьютерная



бет107/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   103   104   105   106   107   108   109   110   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Электронные ресурсы


Основные корпусы русского языка
http://ruscorpora.ru http://www.ling.helsinki.fi/projects/hanco http://corpus.leeds.ac.uk/ruscorpora.html http://aot.ru/search1.html http://sketchengine.co.uk
Список некоторых национальных корпусов



Корпус

Название и адрес в сети

Объем (с/у)

Корпус английского языка

Британский национальный корпус http://corpus.byu.edu/ или http://sara.natcorp.ox.ac.uk/

100 млн

Корпус араб- ского языка

arabiCorpus arabicorpus.byu.edu/

174 млн

Корпус арабского языка

The Quranic Arabic Corpus (Коран) http://corpus.quran.com/
An annotated linguistic resource which shows the Arabic grammar, syntax and morphology for each word in the Holy Quran. The corpus provides three levels of analysis: morphological annotation, a syntactic treebank and a se- mantic ontology

77 тыс.

Корпус болгар- ского языка

Болгарский национальный корпус http://www.ibl.bas.bg/BGNC_bg.htm

1,2 млрд

Корпус венгер- ского языка

Венгерский национальный корпус http://mnsz.nytud.hu/index_hun.html

188 млн

Корпус датско- го языка

Корпус датского языка KorpusDK http://ordnet.dk/korpusdk

56 млн

Корпус испан- ского языка

Корпус испанского языка (проект М. Дэвиса) http://www.corpusdelespanol.org/

100 млн

Корпус испан- ского языка

Corpus de Referencia del Español Actual (CREA) http://corpus.rae.es/creanet.html

150 млн


Корпус италь- янского языка

Корпус итальянских текстов Болонского университета CORIS
http://corpora.dslo.unibo.it/

130 млн

Корпус китай- ского языка

The LIVAC Synchronous Corpus (газетный) (Linguistic Variations in Chinese Speech Communities)

450 млн

Корпус китай- ского языка

Scripta Sinica database (база данных текстов) http://hanchi.ihp.sinica.edu.tw/ihp/hanji.htm

445 млн

Корпус немец- кого языка

Немецкий справочный корпус (Das Deutsche Referenzkorpus — DeReKo)
http://www.ids-mannheim.de/kl/projekte/korpora/

5,4 млрд

Корпус немецкого языка

Корпус электронного словаря немецкого языка http://www.dwds.de

2,5 млрд (в поиске 1,8 млрд)

Корпус немецкого языка

Синтаксически аннотированный корпус немецкого языка NEGRA
http://www.coli.uni-saarland.de/projects/sfb378/negra- corpus

355 тыс.,
(20600
предл.)

Корпус поль- ского языка

PELCRA Reference Corpus of Polish http://pelcra.pl/3–2?lang=pl

100 млн

Корпус поль- ского языка

Корпус польского языка IPI PAN http://korpus.pl/index.php?lang=pl&page=welcome

250 млн

Корпус словац- кого языка

Словацкий национальный корпус http://korpus.juls.savba.sk/

1,2 млрд

Корпус словен- ского языка

Корпус словенского языка http://www.fidaplus.net/

621 млн

Корпус словен- ского языка

Nova beseda/
http://bos.zrc-sazu.si/a_beseda.html

318 млн

Корпус французского языка

American and French Research on the Treasury of the French Language (ARTFL-FRANTEXT)
http://artfl-project.uchicago.edu/content/artfl-frantext

215 млн

Корпус фран- цузского языка

Lexiqum
http://retour.iro.umontreal.ca/cgi-bin/lexiqum

229 млн

Корпус чешско- го языка

Чешский национальный корпус http://www.korpus.cz/

1,3 млн

Корпус швед- ского языка

Банк шведского языка (разные корпусы и словари) http://spraakbanken.gu.se/

1,3 млрд

Корпус япон- ского языка

The Balanced Corpus of Contemporary Written Japanese (BCCWJ)
http://www.ninjal.ac.jp/english/products/bccwj/

100 млн

Часть II




Достарыңызбен бөлісу:
1   ...   103   104   105   106   107   108   109   110   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет