До Вашої уваги - тестова версія корпусу текстів української мови, розроблена співробітниками лабораторії комп'ютерної лінгвістики Інституту філології Київського національного університету імені Тараса Шевченка Н.П.Дарчук (керівник проекту), В.М.Сорокіним (програміст), О.Б.Сірук, Я.В.Ходаківською, Н.Г.Чейлитко, М.О.Лангенбах. 

 Ми робимо цей корпус передусім для Вас, щоб Ви мали змогу зробити статистично обґрунтованим Ваше дослідження з української мови, літератури, культури, розширити і поглибити його відповідно до сучасних наукових норм. Тому Вашими повідомленнями про корпусові помилки або незручності Ви допоможете не тільки нам, а й собі та всім колегам, зацікавленим у швидкому отриманні якісних лінгвістичних результатів.

 

На цій сторінці наведені посилання на словники, що були згенеровані для окремих лінгвістичних досліджень чи як підсумок певного етапу роботи з наповнення Корпусу української мови. Словники доступні у вигляді статичних баз даних.

Для попарного порівняння текстів або авторів можна скористатися функцією підрахунку відстані між текстами

Якщо вам для досліджень потрібен словник, відсутній у наведеному нижче списку, зверніться до керівника проекту Н.П. Дарчук особисто або скористайтеся формою зворотного зв'язку на сайті (повідомте інформацію про себе і мету дослідження).

Просимо при використанні даних з Лінгвістичного порталу Mova.info зазначати про це. 

 

Частотні словники по розділах корпусу (за станом на 01.07.2018)

Поетичні тексти*

Наукові тексти*

Законодавчі тексти*

Художня проза*

Публіцистика*

 

Інші словники

Збірки Лесі Українки ("На крилах пісень") 

Прижиттєві видання Лесі Українки ("НА КРИЛАХ ПІСЕНЬ", "ДУМИ І МРІЇ", "ВІДГУКИ", ПОЕМИ "ДАВНЯ КАЗКА", "РОБЕРТ БРЮС").

Книжки "Вибране" Ліни Костенко

Оновлений словник Книжки "Вибране" Ліни Костенко

ЧАСТОТНИЙ СЛОВНИК МИКОЛА ВІНГРАНОВСЬКИЙ ВИБРАНІ ТВОРИ

Збірки Василя Стуса "Палімпсести" (частина 1, відома як «Київський список» збірки)

Збірки Василя Стуса "Круговерть" *

Збірки Василя Стуса "Веселий цвинтар"* 

Поезії Тараса Шевченка (за виданням Твори : у 5 т. – Київ, 1970.)

Роману Василя Шкляра "Чорний ворон"*

Романів Марії Матіос  "Солодка Даруся", "Апокаліпсис"*

Прозових творів Сергія Жадана. *

Поетичних творів Сергія Жадана.*

Медичних текстів (ендокринологія)*

Підкорпусу публіцистики (станом на 2012 рік)*

Підкорпусу художньої прози (станом на 2012 рік)*

Підкорпусу фольклорних текстів (станом на 2014 рік)*

МАРКЕТИНГОВА ГАЛУЗЬ (станом на 2018 рік)*

 

* Цим знаком позначені словники, до яких входять тексти із незнятою омонімією (омонімія частково знята автоматично). Статистичні показники по них можуть бути неточними

 

Система також надає можливість переглядати частотні словники лексем та слововформ до текстів корпусу в динамічному режимі. Для цього достатньо знайти слово в корпусі, перейти на посилання "джерело" і на сторінці джерела побудувати частотний словник.  Або за посиланням "Статистика текстів" можна вибрати будь-який вузол у підкорпусі чи окремий текст та побудувати частотний словник для нього.