Частотний словник сучасної української поетичної мови продовжує серію частотних словників української мови. Словник репрезентує лексику поетичної мови, одержану на вибірці з поезій кращих українських митців кінця ХХ ст. обсягом 300 тис. слововживань.

Текстові масиви: Юрій Андрухович, “Середмістя” К.,1989; “Екзотичні птахи”, К.,1991; Микола Вінграновський, “Вибрані твори” К.,1986; Микола Воробйов, “Прогулянка одинцем”, К.,1990; Іван Драч, “Вірші та поеми”, К.,1991, “Сонячний фенікс”, К.,1978; Ірина Жиленко, “Вибране”, К.,1990; Оксана Забужко, “Автостоп”, К.,1994; “Диригент останньої свічки”, К,1994; Світлана Йовенко, “Безсмертя ластівки”, К.,1989; Тамара Коломієць, “Вибране”, К.,1984; Ліна Костенко ; Іван Малкович, “Білий камінь” К., 1984; “Ключ”, К.,1988; “Вірші”, К.,1992; Борис Олійник, “Поезії”, К.,1986; Дмитро Павличко, “Вибрані твори”, том другий, К., 1979; Василь Стус, “Золотокоса красуня ”, К., 1992; Людмила Скирда, “Елегії вечірнього саду”, К., 1983; “Дні і ночі” К., 1987.

Будовою словника передбачено наведення статистичних даних як для парадигматичних форм, які зустрілися в текстах, так і для узагальнення словникових одиниць, що забезпечує можливість здійснення великого спектру граматичних досліджень.

У першому стовпчику – слова з граматичними характеристиками і словоформи. Наступні чотири стовпчики – статистичні характеристики. Кожна з цих характеристик дає певну інформацію про функціонування слова (словоформи) і може бути використана для подальших досліджень. Першою, вихідною інформацією, на якій базуються всі інші характеристики, є абсолютна частота (f). Середня частота (х) - це інформація для статистичних зіставлень слів і словоформ між собою в одній чи кількох вибірках. Загальна частотність вживання тієї чи іншої лексеми, навіть обрахована на великій вибірці, не є показником “ядерності” позиції, яку займає лексема в мові, оскільки лексема може мати високу частоту, але в межах одного тексту. Точнішим є значення, яке враховує розподіл лексеми за текстами.

Міра коливання середньої частоти (сігма середньої частоти) дає уявлення про рівномірність розподілу в обстеженому корпусі текстів (для слів і словоформ з частотою 1 ця характеристика не подається).

Стабільність вживання слова (або словоформи) у корпусі текстів або сталість її статистичної поведінки відображена в коефіцієнті стабільності абсолютної частоти (D), для зручності округленому і представленому у вигляді цілого числа. Найвище значення – 10, означає гранично рівномірний розподіл.

 

У масиві поетичних текстів довжиною 300 000 слововживань зафіксовано 31194 різних слова або 69012 різних словоформи.