Автоматическая обработка текста

1.

Автоматическая обработка текста
Лицензии, АП и
Википедия
Петрозаводский государственный
университет
Крижановский Андрей Анатольевич
andrew.krizhanovsky
1
... gmail.com

2.

Видео + вопросы
Jorge Cham. “Open Access Explained!”, 2012
2

3.

Что
за ценники?
Платят
ли журналы
авторам?
рецензентам?
3

4.

4

5.

5

6.

Citation Key
for more information see: http://open.umich.edu/wiki/CitationPolicy
Use + Share + Adapt
{ Content the copyright holder, author, or law permits you to use, share and adapt. }
Public Domain – Government: Works that are produced by the U.S. Government. (17 USC § 105)
Public Domain – Expired: Works that are no longer protected due to an expired copyright term.
Public Domain – Self Dedicated: Works that a copyright holder has dedicated to the public domain.
Creative Commons – Zero Waiver
Creative Commons – Attribution License
Creative Commons – Attribution Share Alike License
Creative Commons – Attribution Noncommercial License
Creative Commons – Attribution Noncommercial Share Alike License
GNU – Free Documentation License

7.

Википедия
7

8.

8

9.

Advantages of Free
License (Wikipedia)
Remains
non-proprietary
Decreases
Increases
=>
individual sense of ownership
a sense of shared ownership
Enhances the popularity of Wikipedia
Attribution
reader
requirement extends brand
writer

10.

Advantages of
commercial license
buyer
author

11.

Pros and cons
of commercial license
Revenue
Brand
buyer
Recognition
Competition
Confidentiality
Phil M. Fowler. Advantages & Disadvantages of Licensing the Rights to the Company's Production Process.
author

12.

What is Collaborative
Publishing?
Collaborative:
works are created by multiple
people together rather than individually
Some
projects are overseen by an editor or
editorial team
Many
grow without any top-down oversight

13.

Advantages of
open source code:
also Wikipedia texts
People
all over the world look at the same code
Potentially huge
development teams
Broader testing
base
Jonathan Hood. Practical Uses of Open Source // Practical Issues in Software Engineering

14.

Wikipedia Free Software
MediaWiki
all
is General Public License (GPL)
free software on the website
GNU/Linux
Apache
MySQL
PHP

15.

Главный вывод (для редакторов)
АВТОРСКИЕ ПРАВА
И ЦИТИРОВАНИЕ
В ВИКИПЕДИИ
15

16.

ВП:ОРИСС
Недопустимость
оригинальных
ВП:Цитирование
Объёмное цитирование
запрещено
исследований
Что можно писать?
16

17.

Статья
в Википедии — это не сочинение, а
изложение.
В
Википедии можно писать оригинальные
обзоры и обобщения, но не новые
заявления, утверждения или выводы.
Что можно писать?
17

18.

ВП:ОРИСС
ВП
– вторичный
источник информации,
собирает,
анализирует,
оценивает, интерпретирует и
синтезирует информацию из
Первичные
источники?
М.
ли научная статья
быть вторичным ист.?
Как
доказать, что
первичных и других
ваша статья в ВП -
вторичных источников.
вторичный источник?
18

19.

ВП:Проверяемость
Всё
сомнительное должно подкрепляться
ссылками на авторитетные источники (АИ)
19

20.

АИ или не АИ?
самиздат
и книги,
известные
научные
выпущенные на
рецензируемые
средства автора
журналы
академические
издания
бложики
Википедия
«Аффилированный источник»?
en, de
20

21.

Неотзывная лицензия (НЛ)
Что
?=
значит НЛ?
отказ от
Как
действительно
удалить статью?
исключительных прав
Можно
ли удалить
свою статью из ВП?
Википедия:Как угробить свою статью
21

22.

Неотзывная лицензия (НЛ)
Можно
Что
?=
значит НЛ?
ли разместить
фото СС-BY в бложике?
отказ от
исключительных прав
Можно
ли удалить
свою статью из ВП?
Википедия:Как угробить
свою статью
22

23.

Неотзывная лицензия (НЛ)
Что
?=
значит НЛ?
Зара в программе "Утро" на Пятом
канале, 2016 г. / JuryRephar / CC-BY
отказ от
исключительных прав
Можно
ли удалить
свою статью из ВП?
Википедия:Как угробить
свою статью
23

24.

Статья
существует
Есть независимые АИ
Нарушает АП
Википедия:Значимость
Оригинальное
Соответствует
исследование
консенсусу общества
удаляется
Не нарушает правила ВП
Ещё?
ВП:ОРИСС
Уже есть такая статья
Ещё?
24

25.

Загрузка иллюстраций
Свобода панорамы в России
25

26.

Свобода панорамы
C
До
2014
2014 свобода
панорамы в России:
для произведений
архитектуры,
градостроительства,
садово-паркового
искусства.
Нет
свободы для
картин, скульптур (см.
статью 1276 ГК РФ)

27.

Свобода панорамы в
России: Статья 1276 ГK РФ
1. Допускается без согласия автора или иного правообладателя и без
выплаты вознаграждения воспроизведение <...> произведения
изобразительного <...> или фотографического произведения, которые
постоянно находятся в месте, открытом для свободного посещения, за
исключением случаев, если изображение произведения является
основным объектом использования или изображение произведения
используется в целях извлечения прибыли.
2. Допускается свободное использование путём воспроизведения и
распространения изготовленных экземпляров, сообщения в эфир или
по кабелю, доведения до всеобщего сведения в форме изображений
произведений архитектуры, градостроительства и произведений
садово-паркового искусства, расположенных в месте, открытом для
27
свободного посещения, или видных из этого места.

28.

Задача: в каком году можно
публиковать иллюстрации памятников
без разрешения правопреемников?
28

29.

Скульптор — Матвей Маанизер (1891-1966),
архитектор — Лев Ильин (1880-1942)
Открыт 7 ноября 1930 г.
Открыт 10 мая 1960 г.
Igriks, 2010, CC-BY-SA 2.0
Igriks, 2009, CC-BY-SA 2.0
29

30.

В
общем случае произведение переходит в общественное
достояние в России, если с года смерти его автора прошло 70 лет.
Если автор работал во время Великой Отечественной войны или
участвовал в ней, то срок охраны авторских прав увеличивается на
4 года (то есть становится 74 года с года смерти автора). Если
автор был посмертно реабилитирован после репрессий, то срок
охраны прав начинает действовать с 1 января года, следующего за
годом реабилитации, и составляет также 70 лет. Все эти правила
не применяются в случае, если пятидесятилетний срок действия
авторского права или смежных прав истёк к 1 января 1993 года.

31.

(кратко)
PD в России, если
Если с года смерти его автора прошло 70 лет.
Если автор работал во время ВОВ, то +4 года (то есть
становится 74 года с года смерти автора).
Если реабилитирован посмертно, то год реабилитации +
70 лет.
Все эти правила не применяются, если
пятидесятилетний срок действия авторского права или
смежных прав истёк к 1 января 1993 года.

32.

Открытые вопросы
Скульптура или
архитектурный объект?
70 со дня обнародования
или со смерти?
32

33.

Для
размещения на Викискладе
фотографий с видом собственно несвободного
российского объекта, срок существования
которого не превышает 70 лет (или с года
смерти автора прошло меньше 70 лет),
придётся получать письменное разрешение
автора (правопреемника) на объект.
33

34.

Свобода панорамы
в странах Европы
Укажите ошибку
на карте (outdated)
34

35.

Анонимы, доверие, совместная работа
АНОНИМНЫЙ
РЕЖИМ РАБОТЫ
В ВИКИПЕДИИ
35

36.

Упражнения
Список
наблюдения
История
правок
История
статьи
Изменения
страницы

37.

Анонимы, доверие, совместная работа
АНОНИМНЫЙ
РЕЖИМ РАБОТЫ
В ВИКИПЕДИИ
37

38.

Анонимная работа
Плюсы
++++++???
Минусы
???
38

39.

Анонимная работа
Плюсы
Экономим две минуты,
Минусы
Раскрываем свой IP-адрес;
(не очень анонимно)
Более серьёзная проверка
вклада со стороны других
пропуская регистрацию
редакторов;
Нет своего списка
наблюдения (не уследить за
статьями);
Не все страницы разрешено
редактировать
39

40.

Edits by Anons — %
Anonymous
IP numbers can edit Wikipedia,
and do
But these edits make up a total of around 18%
of all edits, with some evidence of a
downward trend over time. Why?
Anecdotally, many regular users report
sometimes editing anonymously by accident
or as a quiet form of Sock Puppeting
(Википедия:Многоликость)

41.

Википедия:Правила
защиты страниц
Постоянная защита (где?)
Временная защита (зачем?)
Частичная защита <-> стабильная версия
Administrator
?
?
Autoconfirmed,
Confirmed
?
?
Unregistered,
New
?
?

42.

Википедия:Правила
защиты страниц
Постоянная защита
Временная защита
Частичная защита <-> стабильная версия
Administrator
RW
RW
Autoconfirmed,
Confirmed
R
RW
Unregistered,
New
R
R

43.

IP в истории правок

44.

Trust AND Wikipedia?
Simon
lays out a model of trust derived
from the sciences and then applies it to
Wikipedia.
Trust comes from assessment of honesty and
competence.
Honest = disinterested and free
Competence = proxies or indicators
“… the reason why people trust the content
of Wikipedia is that they trust the
processes – procedural trust, not trust in
persons.”
Paul
Conway,
Ethics and
Information
Technology
2010
Цит.по:
Simon,
Trust and
Knowledg
e (2010)

45.

Wikipedia
WikiScanner
– traces IP addresses of those
who change Wikipedia entries anonymously.
Members of Congress or CEOs editing their
biographies.
Radical transparency: WikiScanner (outdated)
New clone: WikiWatchdog
http://wikiwatchdog.com/#!search/ru/petrsu.ru
http://wikiwatchdog.com/#!search/ru/www.karelia-zs.ru
Paul Conway, Ethics and Information Technology, 2010
45

46.

46

47.

Literature
Paul
Conway, Ethics and Information
Technology, PhD, 2010
47

48.

ДОМАШНЯЯ РАБОТА
48

49.

Домашняя работа
Заполните
данные трёх «плохих» выбранных объектов Викиданных
(содержат мало информации). Ориентироваться на примеры
“хороших” объектов. Прочитать статьи в рувики и англовики для
поиска информации по этим объектам.
Придумайте
и сформулируйте три задачи, которые можно решить с
помощью SPARQL-запросов или Python+Pywikibot, используя
данные ваших объектов. Укажите поля (свойства объектов),
требуемые для решения задач (см. Войны, Страны).
Хотя бы одна из задач должна быть с визуализацией (карта, граф, диаграмма).
См. примеры SPARQL-запросов
d:Wikidata:SPARQL query service/queries/examples (SPARQL examples)
Больше внимания объектам России
49

50.

ДЗ: приоритет России
Больше
внимания объектам России
+ Более полные статьи в рувики.
Примеры
сравнения по каким-либо
параметрам:
национальные парки всего мира и России,
города мира (или каких-либо стран) и России,
вузы мира и ПетрГУ и России (+ рейтинг вузов?)
50

51.

Домашняя работа*
Решить
одну из трёх придуманных своих или предложенных задач,
по согласованию с преподавателем.
Задание обязательное, но делать к 1 марту — не обязательно всем.
Если
объектов мало (< 30)
Естественные катастрофы – 13 объектов.
Ядерные катастрофы – 13 объектов.
то найти новые источники (категории в Википедии), выбрать
свойство(а) для решения задачи, создать объекты ВД и заполнить
это свойство + Label (ru, en), а затем — решить задачу.
Свойство = f(Задача)
Ex.
Category:Military nuclear accidents and incidents – 18 объектов,
Category:Nuclear accidents and incidents – 55 (enwiki, Английская
Википедия)
51

52.

Кстати
Из
хорошей работы по Викиданным может
получиться бакалаврская или
магистерская работы…
записывайтесь в ученики :)
52
English     Русский Правила