Похожие презентации:
Объектно-признаковые ИПЯ
1.
Гендина Н.И., доктор пед. наук, профессорКемеровского государственного университета
культуры и искусств
Объектно-признаковые ИПЯ
2.
План1. Специфика поиска фактов и фактографической информации как
причина появления фактографических (объектно-признаковых)
ИПЯ
2. Структура ОПЯ
2.1. Особенности лексики ОПЯ
2.2. Организационная структура ОПЯ
3. Области применения ОПЯ
3.
Список литературы1. Антопольский А. Б. Лингвистическое обеспечение электронных
библиотек : учеб. пособие / А. Б. Антопольский. – Москва : Моск. гос.
ун-т культуры и искусств, 2002. – 229 с.
2. ГОСТ 7.74-96. Информационно-поисковые языки. Термины и
определения. – Введ. 1997-07-01. – Минск : Межгос. совет по
стандартизации, метрологии и сертификации, 1997. – 34 с.
3. Кристальный, Б. В. Некоторые проблемы фактографического поиска
(специфика, состояние, тенденции) / Б. В. Кристальный // Вопр. информ.
теории и практики. – 1983. – № 49. – С. 5–33.
4. Кристальный Б. В. Язык объектно-признаковых фраз / Б. В.
Кристальный, А. А. Раскина, И. С. Сидоров // Вопр. информ. теории и
практики. – 1979. – № 42. – С. 19–48.
5. Раскина А. А. Языки объектно-признакового типа / А. А. Раскина, И. С.
Сидоров // Вопр. информ. теории и практики. – 1979. – № 42. – С. 6–18.
6. Рычкова Л. В. ОПЯ, разработанный для АФИПС (на материале рац.
предложений) / Л. В. Рычкова // НТИ. Сер. 2. – 1986. – № 3. – С. 16–19.
4. Определение исходных понятий
Фактографический ИПЯ – ИПЯ, предназначенный дляиндексирования описаний фактов и информационного поиска в
фактографических информационных массивах.
Факт (от лат. Factum - «сделанное, совершившееся») – синоним
понятий «истина», «событие», «результат». Это знание,
достоверность которого доказана, это нечто реальное, в
противоположность вымышленному; конкретное, единичное, в
отличие от абстрактного и общего.
Фактографическая информация – это информация о фактах,
которые понимаются как конкретные сведения или данные
независимо от того, являются ли они фактическими или
прогнозируемыми. Главное, что эти сведения сообщают о какойто предметной области, а не о документах, посвященных этой
области.
5. Фактическая и прогнозная (гипотетическая) информация
Пример фактической информации«В целом за XX век средняя глобальная температура приземного
воздуха на Земле выросла на один градус» (По данным журнала
«Вокруг света», 2006, №7, http://www.vokrugsveta.ru/vs/ article/2726/)
Пример прогнозной (гипотетической) информации
«Ожидаемое глобальное потепление за период с 1990 по 2100 год
составит от 1,4 до 5,8 °C. Это многим больше, чем в XX веке, а
температура в итоге станет рекордной за последние 10 тысяч лет»
(Прогноз Межправительственной группы экспертов по изменению
климата)
6. Количественная и качественная фактографическая информация
Пример количественной фактографической информацииНа территории РФ на государственной охране находится более 144
тыс. памятников истории и культуры: памятники архитектуры
(59 тыс.), памятники археологии (57 тыс.), памятники истории
(24 тыс.) и памятники монументального искусства (около 4 тыс.). В
список объектов культурного наследия входят также более 3 тыс.
ансамблей и более 2 тыс. достопримечательных мест.
Пример качественной фактографической информации
В Список всемирного наследия ЮНЕСКО включены следующие
объекты природного наследия России: «Девственные леса Коми»,
«Озеро Байкал», «Вулканы Камчатки», «Золотые горы Алтая»,
«Западный Кавказ», «Центральный Сихотэ-Алинь», «Убсунурская
котловина», «Остров Врангеля».
(По данным официального сайта министерства культуры РФ
http://mkrf.ru/upload/mkrf/gosprogramma_max/111.html#tab-numbers)
7. Пример плохо структурированной фактографической информации
Министерство природных ресурсов и экологии РФ обнародовало ежегодный государственныйдоклад «О состоянии и об охране окружающей среды Российской Федерации в 2009 г.», по данным
которого в 15 городах Сибирского федерального округа обнаружен наибольший уровень загрязнения
атмосферного воздуха.
Приоритетный список городов РФ с наибольшим уровнем загрязнения атмосферного воздуха
включает 34 населенных пункта, в которых проживают 9,7 млн человек. В 2009 году в этот список
включены 15 городов Сибирского федерального округа: Ачинск, Братск, Зима, Иркутск, Красноярск,
Кызыл, Лесосибирск, Минусинск, Новокузнецк, Норильск, Петровск-Забайкальский, Селенгинск, УланУдэ, Черногорск, Чита.
В список также вошли шесть городов Дальневосточного федерального округа, восемь городов
Уральского федерального округа, а также несколько городов других округов. «Почти во всех городах,
включенных в приоритетный список, очень высокий уровень загрязнения связан со значительными
концентрациями бензпирена и формальдегида, в некоторых повышена концентрация диоксида азота,
взвешенных веществ и фенола», — говорится в сообщении сотрудника пресс-службы Минприроды
России.
Исключены из «черного» списка Барнаул (Алтайский край), Черемхово (Иркутская область), а также
Балаково (Саратов область), Махачкала (Дагестан), Сызрань (Самарская область), Челябинск и
Карабаш (Челябинская область).
В 2009 году Сибирь заняла первое место среди федеральных округов по количеству выбросов
загрязняющих веществ в атмосферный воздух от стационарных источников — 5,8 млн тонн.
Крупнейшим источником выбросов является Заполярный филиал ОАО «ГМК «Норильский никель» (1,95
млн тонн, что на 6900 тонн меньше по сравнению с 2008 годом), значительный вклад в вносят другие
предприятия Красноярского края (2,4 млн тонн), Кемеровской (1,4 млн тонн) и Иркутской (0,56 млн тонн)
областей. Увеличились выбросы в Томской области (на 12%), Забайкальском крае (на 5%) и
незначительно в Новосибирской области.
Одним из основных источников негативного воздействия на окружающую среду и здоровье
населения является автомобильный транспорт, количество которого за последние годы увеличилось в
несколько раз. На его долю в среднем приходится более 40% суммарного выброса от стационарных и
передвижных источников. По данным Минтранса России, наибольшие объемы выбросов загрязняющих
веществ автотранспортными средствами среди регионов Сибири отмечены в Новосибирской области
(0,32 млн тонн) и Красноярском крае (0,3 млн тонн).
http://news.babr.ru/?IDE=90741
8.
Пример хорошо структурированнойфактографической информации
Приоритетный список городов России с наибольшим уровнем
загрязнения атмосферного воздуха в 2009 г.
№
Город
п/п
1 Ачинск
2 Белоярский
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Благовещенск
Братск
Екатеринбург
Зима
Иваново
Иркутск
Красноярск
Курган
Кызыл
Лесосибирск
Магадан
Магнитогорск
Минусинск
Нерюнгри
Нижнекамск
Нижний Тагил
Новокузнецк
Норильск
Субъект Российской
Федерации
Красноярский край
Ханты-Мансийский автономный
округ – Югра
Амурская область
Иркутская область
Свердловская область
Иркутская область
Ивановская область
Иркутская область
Красноярский край
Курганская область
Республика Тыва
Красноярский край
Магаданская область
Челябинская область
Красноярский край
Республика Саха (Якутия)
Республика Татарстан
Свердловская область
Кемеровская область
Красноярский край
Вещества, определяющие высокий
уровень загрязнения атмосферы
ВВ, БП, Ф
Ф
БП, Ф
ВВ, NO2, БП, Ф, НF
NO2, БП, ЭБ, Ф
NO2, БП, Ф
БП, фенол, Ф
ВВ, NO2, БП, Ф
ВВ, NO2,БП,Ф
БП, сажа, Ф
ВВ, БП, Ф
ВВ, БП, фенол, Ф
БП, Ф
ВВ, NO2, БП, Ф
БП, Ф
ВВ, NO2, БП, Ф
БП, Ф
БП, NH3, фенол, Ф,
ВВ, NO2, БП, Ф, НF
SO2 , NO2
9. Особенности представления информации в ФИПС
1. В качестве объектов отражения в ФИПС выступают не документы в целом,а отдельные факты, выбранные из документов.
2. Каждое фактографическое описание составляется только на один объект.
3. Для заполнения каждого
несколько источников.
фактографического
описания
используется
4. Каждый факт, вводимый в ИПС, является результатом обобщения и
проверки многих фактических сведений.
5. Любая ФИПС является открытой системой, т. е. предполагает постоянное
пополнение и корректировку фактических сведений.
6. Фактографическое описание каждого объекта в ФИПС является строго
унифицированным.
7. Фактографические
данные,
взаимоисключающими.
вводимые
в
ФИПС,
являются
8. Процесс поиска фактографических данных в ФИПС носит одноступенчатый
характер («запрос-факт»), не опосредованный никаким другим источником.
10. Пример схемы фактографического описания на изделие (оборудование)
Параметры фактографического описания изделия (оборудования)1. Наименование
9. Страна-разработчик
2. Тип, марка
10. Страна-изготовитель
3. Назначение
11. Предприятие (фирма)-разработчик
4. Область применения
12. Предприятие (фирма)-изготовитель
5. Габариты (длина, ширина, высота) 13. Дата разработки
6. Вес
14. Цена
7. Конструктивные особенности
15. Фото или схема изделия
8. Преимущества по сравнению с
аналогами
11. Структура факта Триада: объект — признак — значение
Пациент Иванов Р.С. имеет 2-ю группу крови.Токарно-винторезный станок весит 320 кг.
Афродита родилась на Кипре.
У Игоря карие глаза
Фонд Кемеровской областной научной библиотеки
им. В. Д. Федорова – 2 млн 430 тыс. ед.
Объект
Признак
Значение
Пациент Иванов
Группа крови
Вторая
Токарно-винторезный
станок
Вес
320 кг
Афродита
Место рождения
Кипр
Игорь
Цвет глаз
Карие
Кемеровская ОУНБ
им. В. Д. Федорова
Объем фонда
2 млн 430 тыс. ед.
12. Определение понятия «Объектно-признаковый язык» (ОПЯ)
Определение понятия «Объектнопризнаковый язык» (ОПЯ)Объектно-признаковый информационно-поисковый
язык – фактографический ИПЯ, предназначенный для
индексирования описаний фактов в виде перечня объектов
(предметов) с указанием относящихся к ним признаков
(свойств) и соответствующих значений признаков
ГОСТ 7.74-96 Информационно-поисковые языки.
Термины и определения
13. Состав лексики ОПЯ
Три основных лексико-семантических классаназваний в составе лексики ОПЯ:
объектов
признаков
значений признаков
14. Виды признаков в ОПЯ: количественные и качественные
Количественные признаки – это именованные и неименованные числа,например: вес станка – 530 кг, площадь выставочного зала – 730 кв. м.
(именованные числа), количество посетителей выставки – 670, средняя
посещаемость – 217,8 (неименованные числа).
Типы значений количественных признаков:
Числовой номинальный признак, выражающийся числом, указывающим
номинальное значение признака, например: цена (признак) – 345 руб. 15 коп.
(значение признака), посещаемость выставки (признак) – 140 человек в день
(значение признака).
Числовой интервальный признак, выражающийся двумя числами,
указывающими минимальное значение, т. е. границы интервала признака,
например: длина (признак) – 160-170 см. (значение признака), полнота
выдачи информации в АСНТИ (признак) – 75-87% (значение признака).
15.
Виды признаков в ОПЯ:количественные и качественные
Качественные признаки – это признаки, значение которых выражается
описательно, словесно. Например, объект кадры имеет ряд признаков, которые
можно описать только качественными значениями: образование (признак) –
высшее гуманитарное (значение), должность (признак) – старший инженер
(значение).
Качественные признаки подразделяются:
Признаки наличия свойства и признаки степени свойства – это слова да,
нет и различные вариации: есть, не был, был, отсутствие, наличие.
Например: объект фактографического поиска – специалист (сотрудник),
признак – наличие ученой степени, значение признака – есть или нет.
Признаки степени свойства – слова слабый, средний, сильный, интенсивный,
мало интенсивный и т. п. Например: объект фактографического поиска – сплав,
признак – электропроводность, значение признака – средняя; объект –
электродвигатель, признак – вес, значение – очень малый; объект –
пользователь, признак – уровень информационной культуры, значение –
средний.
16.
Типы лексических единицв составе лексики ОПЯ
1. Термины
2. Номенклатурные знаки (номенклатура)
3. Кванторные лексические единицы
4. Модальные лексические единицы
5. Лексические единицы, служащие для обозначения
названий публикаций и источников сведений
17. Типы лексических единиц в составе лексики ОПЯ
1. Термины, отражающие предметную область соответствующейАФИПС: «Фтор», «Рудные месторождения», «Кадры», «Сплавы»,
«Технические средства железных дорог» и т. д.
Специфика: включение устойчивых словосочетаний, выполняющих
функции терминов: сварка электродной проволокой, сварка в среде
инертных газов, штамповка на горизонтально-ковочных машинах,
углы режущих инструментов статистические и т. п.
18. Типы лексических единиц в составе лексики ОПЯ
2. Номенклатурные знаки (номенклатура) – марки машин,станков, механизмов, приборов; географические названия,
названия
электростанций,
предприятий,
учреждений,
организаций и т. п.
Например:
Audi, Alfa Romeo, BMW, Jeep, Honda, Renault, Южно-Становой
пегматитовый пояс, Институт физики АН РФ,
Красноярская ГЭС и т. д.
Номенклатурные знаки могут выражаться аббревиатурами:
«М-100, М-200» – марки цемента.
19. Типы лексических единиц в составе лексики ОПЯ
3. Кванторные лексические единицы (от лат. quantum - «сколько») –слова, отвечающие на вопрос «Сколько?».
Квантовые лексические единицы в ОПЯ могут сочетаться с
названиями объектов.
Например: Все станки с числовым программным управлением
обладают высокой точностью; Все общеобразовательные школы
Кемеровской области подключены к Интернету.
Примеры кванторных лексических единиц
большая часть
большинство
все
всякий
каждый
любой
мало
меньшая часть
меньшинство
много
некоторые
нет
не существует
основная часть
отсутствуют
подавляющая часть
подавляющее
большинство
существует
20. Типы лексических единиц в составе лексики ОПЯ
4. Модальные лексические единицы – слова, выражающиеотношение автора к достоверности
сообщаемой
информации.
Примеры модальных лексических единиц:
вероятно
возможно
сомнительно
вряд ли
может быть
достоверно
неверно
невероятно
невозможно
не может быть
мало вероятно
наверняка
очевидно
очень вероятно
по-видимому
скорее всего
по всей вероятности
предположительно
21. Типы лексических единиц в составе лексики ОПЯ
5. Лексические единицы, служащие для обозначенияназваний публикаций и источников сведений, из которых
извлекается фактографическая информация, позволяющие
«привязать» каждый факт к источнику, из которого он взят.
Например: стандарт, отчет о НИР и ОКР, патент и т.п.
22. Варианты организационной структуры ОПЯ
Объектно-характеристические таблицыФактографические тезаурусы
Классификаторы технико-экономической
информации
23. Объектно-характеристические таблицы как вариант организационной структуры ОПЯ
№ Наименованиепредприятия
(организации)
1.
ВИНИТИ
URL сайта
Дата
регистрации
сайта
Дата
последнего
обновления
сайта
Кол-во
суточных
посещений
на момент
анализа сайта
http://www2.vi
niti.ru/
2004
01.09.2014
1500
24.
Общероссийский классификатор валют(фрагмент)
Код валюты
цифро
вой
буквен
ный
Наименование
валюты
Краткое наименование стран и
территорий
004
AFA
Афгани
Афганистан
008
ALL
Лек
Албания
012
DZD
Алжирский динар
Алжир
020
ADP
Андорская песета
Андорра
031
AZM
Азербайджанский
манат
Азербайджан
032
ARS
Аргентинское песо
Аргентина
036
AUD
Австралийский
доллар
Австралия; Кирибати; Кокосовые (Килинг)
острова; Науру; Норфолк, остров; Остров
Рождества; Тувалу; Херд и Макдональд,
острова
044
BSD
Багамский доллар
Багамские острова
048
BHD
Бахрейнский динар
Бахрейн
050
BDT
Така
Бангладеш
051
AMD
Армянский драм
Армения