Похожие презентации:
Автороведческая экспертиза текста
1. Автороведческая экспертиза текста
Лекция №12. Понятие автороведческой экспертизы
• Автороведческая экспертиза – это– исследование текста для получения
информации о его авторе.
– особый способ исследования навыков
письменной речи, который предполагает
детальный анализ разных языковых уровней и
нацелен на решение широкого круга задач.
3. Специфика автороведческой экспертизы
• Анализ направлен на характеристику языковойличности автора текста
– Языковая личность - носитель языка,
охарактеризованный на основе анализа произведённых
им текстов с точки зрения использования в этих текстах
системных средств данного языка для отражения
ви́дения им окружающей действительности и для
достижения определённых целей.
• Решение разного типа задач
• Анализ большого количества языковых уровней
• Большой объем исследуемого материала
4.
Автороведческаяэкспертиза
Идентификационная:
Идентификационная
- есть предполагаемый автор(ы)
экспертиза
- сравнение нескольких текстов
Диагностическая:
Диагностическаяавтора
-нет предполагаемого
экспертиза
- текст исследуется
независимо
от других
5. Задачи автороведческой экспертизы
Идентификационные задачи:Идентификация – определение того, кому из предполагаемых авторов
принадлежит текст;
Верификация автора - подтверждение или отрицание того факта, что
написавший текст является его настоящим автором;
Определение принадлежности нескольких текстов одному лицу проверка того, что автором текста был один и тот же человек;
Множественная неопределенность – распределение нескольких текстов
по нескольким авторам
Диагностические задачи
Определение личностных характеристик автора:
Уровень образования;
Родной язык, знание иностранных языков;
Происхождение, место постоянного проживания;
Социальные характеристики автора (пол, возраст, национальность);
Наличие навыков определенного стиля письменной речи;
Определение намеренного искажения письменной речи
6. Развитие автороведческой экспертизы в СССР
1)До 1940-х - почерковедческое исследование текста для
установления автора.
2) 1940-е — дополнение почерковедческого исследования
анализом орфорграфии и стиля письма (А.И. Винберг), а затем
пунктуационных, лексических, синтаксических и
стилистических характеристик текста (Г.Д. Маркова).
3) 1960-е — отдельное изучение признаков письменной речи;
разработка первых количественных методов (Э.У. Бабаева).
4) 1970-е — становление автороведческой экспертизы как
самостоятельного вида исследования. Работы С.М. Вула:
Разделение признаков письменной речи на общие (степень
владения нормами) и частные (конкретные свойства и
особенности структуры навыка)
Разработка и оформление методики идентификационной
автороведческой экспертизы.
5) 1980-е — Разработка методики диагностической
автороведческой экспертизы:
Определение пола автора
Определение уровня образования автора;
Определение родного языка автора.
7. Развитие автороведческой экспертизы в России
Пути развития автороведческой экспертизы впостсоветское время:
В гос. структурах — создание универсальных методик
(методики МВД, ФСБ и т.д.).
В сфере негосударственной экспертизы — решение
вопроса применения методик к частным случаям
экспертной практики
автороведческий анализ официально-деловых
текстов: договора, жалобы, протокола допроса и
т.д.
Разработка собственных методов анализа (теория
языковой личности, лингвоперсонология и т.д.)
Новые подзадачи автороведческой экспертизы
Определение спонтанного или подготовленного
характера текста (Е.И. Галяшина)
Определение автора текста интернет-коммуникации,
смешанной коммуникации:
письменная+устная+изображение (мессенджеры)
8. Идентификационная автороведческая экспертиза
9. Идентификационная автороведческая экспертиза
Идентификационный признак – черта, характеризующая автора текста на том
или ином языковом уровне.
– Тексты анализируются и сравниваются на основе набора
идентификационных признаков.
Критерии идентификационного признака:
– оригинальность - способность наиболее полно и точно отражать
свойства исследуемого объекта;
– воспроизводимость - способность многократно проявляться в
письменной речи автора;
– относительная устойчивость признака к изменениям - относительная
неизменность признака в сходных условиях;
– частота встречаемости признака у других объектов – чем реже
встречается признак у однородных объектов, тем большее значение он
имеет для идентификации;
– степень зависимости признака от других – чем меньше изменения
конкретного признака зависят от изменений других признаков, тем
большую идентификационную значимость он имеет.
10. Типы текстов в идентификационной экспертизе
Типы текстовСпорный текст – его авторство
нужно установить
Образцы письменной речи
предполагаемого автора
11. Образцы письменной речи
–
–
–
–
–
–
–
–
–
–
Тексты, принадлежащие предполагаемому автору
Образцы письменной речи:
Свободные образцы - тексты, составленные определенным лицом
вне связи с делом.
Соответствие спорному тексту по:
Языку;
Стилю;
Времени исполнения;
Форме речи;
Адресату и характеру сообщения;
Состоянию автора.
Условно-свободные образцы - тексты, составленные в связи с
расследуемым делом, но не специально для производства
экспертизы.
Экспериментальные образцы - тексты, составленные
определенным лицом по предложению и в присутствии
следователя или судьи, специально для использования в качестве
образца при производстве автороведческой экспертизы.
12.
Вопросы для идентификационнойавтороведческой экспертизы
Является ли N автором представленного текста?
Является ли N автором нескольких представленных
текстов?
Принадлежат ли представленные тексты одному
автору?
Кому именно, M или N, принадлежит спорный текст?
Принадлежат ли спорные тексты кому-то из
предполагаемых авторов? Если да, то какой текст
какому автору принадлежит?
13. Методы анализа в идентификационной экспертизе
• Экспертные методы - исследование текстапрофессиональным лингвистом-экспертом, который выделит
характерные особенности проверяемого текста и текстов,
написанных предполагаемым автором (если они доступны), и
на основании их изучения вынесет свое заключение.
• Статистические методы - основаны на сравнении
вычислимых характеристик текстов, таких как:
Среднее число слов в предложении.
Среднее количество слогов в слове.
Общая частота употребления служебных слов - предлогов, союзов,
частиц.
Частота употребления существительных.
Частота употребления глаголов.
Частота употребления прилагательных.
Частота употребления предлогов.
Частота употребления частиц.
Среднее число союзов, предлогов и частиц в предложении.
14.
Статистические методыатрибуции текста
Н.А. Морозов. Частота служебных слов,
«лингвистические спектры».
Цепи Маркова.
А. Мортон. Метод накопительных сумм.
В.П. и Т.Г. Фоменко. Метод опорных слов, «авторский
инвариант».
15. Программное обеспечение анализа текста
1.2.
3.
4.
Программы определения авторства
Программы выявления плагиата
Программы интеллектуального анализа
данных (сбор и анализа лингвистической
информации, классификация, кластеризации,
реферирования, выделения ключевых
понятий…)
Программы для определения психологического
портрета автора текста, психологического
содержания текста
16. Программы определения авторства текстов
• − «Штампомер» (Л.Л. Делицын) - Программастатистического анализа текста и определения
авторства;
• − «Лингвоанализатор» (Д.В. Хмелев) программа математического анализа структуры
текста.
• − «СМАЛТ» (ПетрГУ) - Программа
морфологического и синтаксического анализа
текста
• − «Стилеанализатор» (О.Г. Шевелев) Программа анализа авторского стиля.
17. Программы выявления плагиата
• Антиплагиат» (ЗАО «Анти-Плагиат», «Форексис») Определяет степень схожести входного текста стекстами, размешенными в Интернете;
• «Плагиат Информ» («СофтИнформ») - Программа
сравнивает входной документ с документами печатных
источников и Интернет-статей;
• «АУРА-Текст» (СПбГУ) и др - инструмент проверки
текстов курсовых, дипломных работ и диссертаций на
наличие совпадений с внешними источниками.
Специализируется на работах экономической тематики..
18. Программы интеллектуального анализа данных
«Intelligent Miner for Text» (IBM) - Система состоит из нескольких программ с
функциями определения языка текста, классификации текстов, разделения
документов на группы по близости стиля, выявления в документе ключевых
слов, выявления смысла текста и составления аннотации;
«TextAnalyst», «PolyAnalyst» (Мегапьютер Интеллидженс) - В состав
PolyAnalyst входит система TextAnalyst, занимающаяся задачами Text Mining:
создание семантической сети текста, аннотация текста, кластеризация и
классификация документов.;
«Text Miner» (SAS) - Программа логической обработки текста.
«SemioMap» (Semio Corp.) - Система состоит из 2 основных компонент сервера SemioMap и клиента SemioMap. Работа системы включает 3 фазы:
сервер индексирует неструктурированный текст и извлекает ключевые фразы,
выявляет связи между фразами и строит на основе совместной встречаемости
этих фраз лексическую сеть и представляет ее в виде графиков;
«Oracle Text», «Oracle Data Mining» (Oracle) - программа статистического и
лингвистического анализа текста. Для каждого текста программой
определяются ключевые темы, строится тематическое резюме и общее
резюме-реферат;
«Knowledge Server» (Autonomy) - Программа статистического анализа текста.
19. Программы для определения психологического портрета автора текста, психологического содержания текста
• «ЛИНГВА-ЭКСПРЕСС» (В.И. Батов) - Программавыявления особенностей речевого поведения и характера
автора;
• «Prostyle» (США) - Программа стастического анализа
текста, определяющая факторы расхождения между
документами.;
• «ВААЛ» (В.П. Белянин) Программа фоносемантического анализа текста.
20.
Проблемы статистических методовХорошо работают на очень больших объемах, которые редко
встречаются в экспертизе;
Основная сложность – выбор идентификационных признаков:
Отсутствие устойчивости. Разброс значений параметра для
текстов одного и того же автора настолько велик, что диапазоны
возможных значений для разных авторов перекрываются.
Отсутствие оригинальности. Параметр может принимать близкие
значения для всех или большинства авторов, поскольку его
значение определяются свойствами языка, на котором написаны
тексты, а не индивидуальными особенностями создателя текста.
21. Уровни анализа текста в идентификационной экспертизе
• Структурно-текстовый - логика построения текста, егоархитектоника, особенности композиции текста
• Орфографический – характерные для автора ошибки
орфографии
• Пунктуационный – характерные для автора ошибки
пунктуации, авторская постановка знаков препинания
• Лексико-семантический – типы лексики, части речи, части
речи, лексические ошибки
• Синтаксический – синтаксические характеристики уровня
словосочетания, простого и сложного предложения,
сверхфразового единства
• Стилистический – черты стиля и жанра, к которому
принадлежит текст, отступления от жанра.
• Эмотивный – способы выражения субъективности в тексте