250.49K

Автоматическая оценка удобочитаемости русскоязычных текстов

1.

Пучкова Екатерина, 425 группа
1

2.

Актуальность работы
Мы сталкиваемся с оценкой сложности текстов во многих областях:
Повышение качества публикуемых текстов
Экспертиза школьных учебников, экзаменационных текстов и других
дидактических материалов
Подготовка деловой документации
Подготовка текстов нормативно-правовых актов
2

3.

Удобочитаемость
Сложность текста – многоаспектное понятие, ряд аспектов трудно
формализуем
Удобочитаемость – один из аспектов.
Удобочитаемость интуитивно коррелирует со сложностью
Можно дать количественную оценку удобочитаемости
В работе рассматривается автоматическая оценка удобочитаемости
3

4.

План решения задачи
1.
2.
3.
4.
5.
6.
Проанализировать существующие программы, оценивающие
сложность текстов;
Придумать собственный способ оценки удобочитаемости;
Разработать датасет;
Разработать программу для автоматического подсчета
удобочитаемости, основанную на применении собственного способа
оценки;
Провести эксперименты;
Оценить качество моделей и сравнить с результатами существующих
программ для оценки сложности текстов;
4

5.

Подход к оценке удобочитаемости
Предлагается разбить все тексты на 4 класса удобочитемости (1 – простой, 4 – самый
сложный)
Для количественной оценки удобочитаемости используется формула линейной
регрессии:
English     Русский Правила