Меню
Главная
Случайная статья
Настройки
|
Вандализм в Википедии — умышленное редактирование с целью нанести ущерб энциклопедии. К вандализму относятся любые добавления, удаления или изменения контента, сделанные с намерением снизить качество статей или помешать работе проекта[1]. По оценкам исследователей, около 7 % правок в Википедии являются вандальными[2][3]. Для борьбы с вандализмом используются как автоматизированные инструменты, так и проверка правок участниками сообщества[4].
Содержание
Общая характеристика
Масштабы вандализма в Википедии значительны. Только за период с августа по октябрь 2010 года в английской Википедии было сделано около 700 тысяч вандальных правок[2]. Доля вандальных правок от общего числа составила около 2 % правок[5].
Наличие вандализма создает несколько существенных проблем для проекта. Во-первых, требуются значительные усилия сообщества для выявления и устранения его последствий. Во-вторых, сама возможность вандализма снижает доверие к Википедии как источнику информации, что особенно критично для её использования в образовательных учреждениях. В-третьих, вандализм затрудняет создание стабильных версий статей для офлайн-распространения[6].
Для противодействия вандализму в Википедии используется комбинация технических и социальных мер. Автоматизированные инструменты позволяют быстро обнаруживать явные случаи вандализма, такие как массовые удаления текста или добавление нецензурных выражений. Более сложные случаи, требующие понимания контекста, выявляются опытными участниками проекта[7].
Большинство вандальных правок обнаруживается достаточно быстро. Среднее время существования вандализма составляет 2.1 дня, при этом медианное значение — всего 11.3 минуты[8]. Анализ времени совершения вандальных правок показывает, что они чаще происходят в дневное время по местному времени редактора, особенно в часы работы школ и офисов[9].
Влияние и последствия
Влияние на достоверность
Проблема вандализма существенно влияет на восприятие достоверности Википедии. Несмотря на то, что вандальные правки составляют относительно небольшой процент от общего числа редактирований, сам факт их возможности создает «ореол ненадежности», превышающий статистические масштабы проблемы[6].
Особенно остро стоит вопрос использования Википедии в образовании. Риск того, что учащиеся могут столкнуться с вандализированным контентом, часто становится препятствием для внедрения Википедии как образовательного ресурса в школах и университетах[6].
Различия между языковыми разделами
Масштабы и характер вандализма различаются в разных языковых версиях Википедии. В крупных разделах, таких как английский и немецкий, действуют развитые системы автоматического обнаружения вандализма. Современные алгоритмы обнаружения вандализма, тестировавшиеся на английской Википедии, достигают уровня обнаружения до 80 % при точности 75 %[5].
Малые языковые разделы сталкиваются с особыми проблемами в борьбе с вандализмом. Из-за небольшого количества активных участников вандальные правки могут оставаться незамеченными дольше. Кроме того, многие автоматизированные инструменты, разработанные для крупных разделов, требуют адаптации или неприменимы в малых разделах из-за специфики языка[10].
Отражение в культуре
Проблема вандализма в Википедии получила отражение в массовой культуре. Например, в музыкальном клипе «White & Nerdy» «Странного Эла» Янковича показан эпизод вандализма статьи про Atlantic Records, чей герой заменяет содержимое статьи на фразу «ВЫ СОСЁТЕ» (англ. YOU SUCK!), написанную огромными буквами. Этот эпизод — отсылка к актуальным тогда событиям для Янковича, связанными со сложностями при получении прав на выпуск песни «You’re Pitiful», пародии Эла на песню Джеймса Бланта «You’re Beautiful». После выхода клипа поклонники музыканта многократно повторяли показанное в нём вандальное редактирование, что привело к необходимости установить защиту на статью. Сам Янкович отметил, что не одобряет такую деятельность фанатов, но находит её, в определённой степени, довольно забавной (англ. I don't officially approve of that, but on a certain level it does amuse me)[11].
Типология вандализма
По способу внесения изменений
Вандализм в Википедии может проявляться несколькими основными способами[12]:
- Массовое удаление — полное или значительное удаление содержимого статьи без обоснования
- Добавление ложной информации — внесение заведомо неверных фактов или намеренное искажение существующей информации
- Граффити (от англ. graffiti в терминологии исследователей) — добавление неуместного, бессмысленного или оскорбительного текста, включая нецензурные выражения, бессвязные фразы или комментарии, не имеющие отношения к теме статьи
- Спам — вставка рекламных ссылок или материалов
По техническим характеристикам
С технической точки зрения выделяют следующие типы вандализма[13]:
- Текстовый вандализм — изменение текстового содержания статей, включая:
- Замену слов или фраз
- Вставку нерелевантного текста
- Изменение дат, имен и чисел
- Структурный вандализм — нарушение структуры статьи:
- Удаление или искажение разделов
- Нарушение форматирования
- Медиавандализм — действия, направленные на изображения и другие медиафайлы:
- Замена изображений неуместными
- Удаление иллюстраций
- Ссылочный вандализм — манипуляции с внешними ссылками:
- Добавление спам-ссылок
- Удаление источников
По сложности обнаружения
Различные типы вандализма требуют разных подходов к обнаружению[14]:
- Явный вандализм — легко обнаруживается автоматическими средствами:
- Массовые удаления
- Использование нецензурной лексики
- Очевидный спам
- Скрытый вандализм — требует анализа контекста:
- Незаметная подмена фактов
- Подмена или подлог источников
- Искажение статистических данных
Известные случаи
Инцидент с биографией Джона Сайгенталера
В 2005 году анонимный участник Википедии создал статью-мистификацию, содержащую клеветнические сведения о Джоне Сайгенталере, известном писателе и журналисте[15]. Ошибочные утверждения оставались незамеченными с мая по сентябрь 2005 года, до тех пор, пока они не были обнаружены Виктором С. Джонсоном-младшим, другом Сайгенталера.
Скандал поставил под сомнение надёжность сведений, взятых из Википедии, а также других сайтов, чей контент свободно создается своими посетителями (см. Веб 2.0). Этот случай привёл к тому, что в англоязычной Википедии был принят ряд мер для борьбы с добавлением в статьи ложной информации, в том числе был введен запрет на создание новых статей анонимными пользователями[16].
Стивен Кольбер
Комик Стивен Кольбер неоднократно упоминал Википедию в своём телешоу The Colbert Report, часто предлагая зрителям испортить определённые страницы в прямом эфире.
- В одном из эпизодов в 2006 году Кольбер предложил зрителям испортить статью «Слон» (англ. Elephant). В результате учётную запись Стивена в Википедии под псевдонимом «Stephencolbert» заблокировали, лишив его возможности редактирования. А многие статьи, связанные со слонами, были защищены от внесения исправлений[17].
- 7 августа 2012 года Кольбер предложил своим зрителям вандализировать страницы о возможных кандидатах в вице-президенты США от партии республиканцев в 2012 году. Речь шла о статьях про Тима Поленти и Роба Портмана. После объявления Кольбера и последующих правок его зрителей эти статьи были защищены администраторами Википедии от редактирования для анонимных пользователей[18].
Вандализм о катастрофе в Хиллсборо
В апреле 2014 года газета Liverpool Echo сообщила, что компьютеры во внутренней сети британского правительства использовались для публикации оскорбительных сведений о катастрофе в Хиллсборо на страницах Википедии, посвящённых этой проблематике. Правительство объявило, что начнёт расследование этих сообщений[19]. Последующее расследование The Daily Telegraph показало, что правительственные компьютеры, по-видимому, также использовались для вандализма и в ряде других статей. Вандальные правки часто включали в себя оскорбительные комментарии к биографическим статьям, а в одном случае в Википедию было добавлено ложное сообщение о смерти персоны[20].
Политический вандализм
Политики — частая цель вандализма в Википедии. Статья о Дональде Трампе была полностью удалена, затем заменена одним предложением с критикой в его адрес в июле 2015 года[21][22][23]. В ноябре 2018 г. вандалы заменили изображение в статье на фотографию полового члена. В результате этого виртуальный помощник Siri от компании Apple некоторое время показывал это изображение при выдаче ответов по теме[24].
В октябре 2016 года страницы Википедии про Хиллари и Билла Клинтона подверглись вандализму со стороны интернет-троллей из группы под названием «Gay Nigger Association of America[англ.]». Они добавляли порнографические изображения в эти статьи[25].
В том же месяце страница Википедии кандидата в Ассамблею штата Нью-Йорк Джима Тедиско была изменена, чтобы сказать, что он «никогда не был частью большинства» (англ. never been part of the majority) и «многие считают его полным провалом» (англ. is considered by many to be a total failure). Тедиско выразил обеспокоенность по поводу изменений на его странице[26].
24 июля 2018 года сенатор от штата Юта Оррин Хэтч опубликовал юмористические твиты о том, как обнаружил в поисковой выдаче Google информацию о том, что он умер 11 сентября 2017 года[27]. Эти ошибочные сведения были связаны с вандальными правками в статье про него в Википедии[28][29]. Точно так же вандализм статьи про Калифорнийскую республиканскую партию в Википедии стал причиной того, что в виджете выдачи Google в качестве идеологии партии был указан нацизм[30].
Случаи в русской Википедии
Известны случаи вандальных изменений в статьях русской Википедии, которые привлекали внимание русскоязычных СМИ.
Статью о главном здании МГУ анонимные пользователи дополнили шуточными сведениями о том, что «напротив здания стоит макет фундаментальной библиотеки МГУ в натуральную величину, в котором прячут выкопанную библиотеку Ивана Грозного». А в биографию ректора МГУ Виктора Садовничего добавили информацию про то, как он «объезжает… все свои владения на огненной колеснице, которая может домчать его в любое место на Земле в мгновение ока»[31].
Статья о популярном певце и музыканте, лидере группы «Кино» Викторе Цое также часто подвергалась вандализму. Недобросовестные участники настойчиво добавляли в статью информацию о том, что смерть музыканта была вызвана асфиксией в процессе поедания мацы[31].
Другой известный случай вандализма в русской Википедии был связан с редко посещаемой служебной страницей Википедии про древнерусские храмы. В течение трёх с половиной месяцев вместо информации о деятельности князя Владимира на этой странице присутствовали ложные сведения о том, что Крещение Руси в 988 году состоялось «по решению князя Шевелева Павла Викторовича». Это же имя впоследствии использовал автор издательства «Эксмо» при подготовке книги «7 великих соборов России и ещё 75 храмов, которые нужно знать». В результате напечатанные экземпляры книги содержали явно ошибочную информацию об этом историческом событии, основанную на вандальной правке в Википедии[32] Ошибку обнаружили, когда книга уже попала в продажу. Чтобы исправить ошибку, издательство вклеило на последнюю страницу лист с извинениями[33].
Методы противодействия
Автоматические инструменты и боты
Основным техническим средством борьбы с вандализмом являются специализированные программы-боты. Наиболее известные из них — ClueBot и VoABot II — используют списки регулярных выражений и «чёрные списки» участников для обнаружения вандализма. Однако их эффективность ограничена: они выявляют только около 30 % вандальных правок, хотя и с высокой точностью[34].
Полуавтоматические инструменты
Для повышения эффективности обнаружения вандализма в том числе полуавтоматические инструменты:
Эти инструменты достигали точности до 75 % при полноте обнаружения 80 %[35].
Социальные механизмы
Важную роль в борьбе с вандализмом играют механизмы социального взаимодействия участников. Страницы обсуждения статей и личные страницы участников используются для координации действий по противодействию вандализму. В случае сложных ситуаций, когда трудно определить является ли правка вандализмом, участники обсуждают спорные моменты и принимают коллективное решение на основе анализа контекста и истории правок[36][37].
Участники Википедии, которых выбрали администраторами проекта имеют возможность:
- Блокировать учётные записи вандалов
- Защищать статьи от редактирования определёнными группами пользователей
- Быстро откатывать вредоносные правки[38]
Автоматическое обнаружение
Основные подходы
В автоматическом обнаружении вандализма используется несколько основных подходов[13]:
- Анализ метаданных — изучение характеристик правки (время создания, размер изменений, наличие комментария)
- Текстовый анализ — исследование добавленного или изменённого текста
- Репутационный анализ — оценка предыдущих действий редактора
- Языковые модели — статистический анализ используемой лексики
Методы машинного обучения
Современные системы обнаружения вандализма используют различные алгоритмы машинного обучения[39]:
- Логистическая регрессия
- Случайные леса (Random Forests)
- Градиентный бустинг (Gradient Boosting)
- Методы опорных векторов (SVM)
Эффективность
Комбинирование различных подходов позволяет достичь высокой эффективности. При этом эффективность обнаружения зависит от типа вандализма: массовые удаления выявляются легче, чем точечный подлог фактической информации[40].
Исследования вандализма
Исследования вандализма в Википедии активно ведутся с 2007 года. Большинство работ (около 76 %) выполнено в области компьютерных наук и сосредоточено на разработке методов автоматического обнаружения вандализма. При этом относительно мало внимания уделяется изучению поведения вандалов и социальным аспектам этого явления[41].
Направления исследований
По данным систематического обзора литературы, исследования вандализма в Википедии ведутся с 2007 года и распределяются по нескольким основным направлениям[42]:
- Методы обнаружения вандализма (около 60 % исследований)
- Контроль качества контента (12 % работ)
- Анализ текстового содержания (6 %)
- Предотвращение вандализма (3 %)
Особенности исследований
Большинство исследований (76 %) выполнено в области компьютерных наук. Работы в области гуманитарных и социальных наук составляют около 10 % от общего числа. Междисциплинарные исследования, сочетающие технические и социальные аспекты, относительно редки — около 10 % работ[41].
Перспективные направления
Исследователи отмечают несколько недостаточно изученных аспектов проблемы вандализма[43]:
- Поведение вандалов и их мотивация
- Социальные механизмы противодействия вандализму
- Влияние правил и политик Википедии на уровень вандализма
- Различия в проявлениях вандализма между языковыми разделами
Примечания
- Adler, de Alfar, Mola-Velasco, Rosso, West, 2011, p. 277.
- 1 2 Adler, de Alfaro, Mola-Velasco, Rosso, West, 2011, p. 277.
- Susuri, Hamiti, Dika, 2017, p. 1.
- Chin, Street, Srinivasan, Eichmann, 2010, p. 3.
- 1 2 Tran, Christen, 2013, p. 271.
- 1 2 3 Adler, de Alfaro, Mola-Velasco, Rosso, West, 2011, p. 278.
- Chin, Street, Srinivasan, Eichmann, 2010, p. 4.
- Roessing, 2011, p. 2.
- Roessing, 2011, p. 3.
- Susuri, Hamiti, Dika, 2017, p. 2.
- Adams, Cameron. Weird Al Yankovic . Herald Sun (5 октября 2006). Архивировано из оригинала 12 марта 2007 года.
- Chin, Street, Srinivasan, Eichmann, 2010, p. 4—5.
- 1 2 Adler, de Alfaro, Mola-Velasco, Rosso, West, 2011, p. 278—279.
- Chin, Street, Srinivasan, Eichmann, 2010, p. 5—6.
- Seigenthaler, John (29 ноября 2005). A false Wikipedia "biography". USA Today. Архивировано 6 января 2012. Дата обращения: 17 сентября 2017.
- Википедия временно заблокировала создание новых статей анонимами, Lenta.ru, 06.12.2005. Дата обращения: 30 мая 2008. Архивировано 10 марта 2008 года.
- Did Colbert hack Wikipedia? – VIDEO . Tvsquad.com. Дата обращения: 7 июня 2012. Архивировано из оригинала 19 января 2011 года.
- Stephen Colbert's Wikipedia Vice Presidential Scheme Short Circuited . The Hollywood Reporter (8 августа 2012). Дата обращения: 8 августа 2012. Архивировано 11 августа 2012 года.
-
-
- Ben Popper (22 July 2015). «Someone just deleted Donald Trump’s entire Wikipedia page» Архивировано 26 февраля 2018 года.. The Verge (Vox Media).
- «All The Content On Donald Trump’s Wikipedia Page Was Just Deleted» Архивировано 23 июля 2015 года.. TPM.
- Andrea Peterson (22 July 2015). «Donald Trump’s Wikipedia page was deleted today. Twice.» Архивировано 23 июля 2015 года.. Washington Post.
- Brandom, Russell. Wikipedia's Trump penis vandals have struck again (англ.). The Verge (24 ноября 2018). Дата обращения: 29 августа 2019. Архивировано 27 июля 2019 года.
- O'Connor, Brendan. Internet Trolls Vandalize Hillary and Bill Clinton's Wikipedia Pages in Extremely NSFW Way (англ.) (13 октября 2016). Дата обращения: 13 октября 2016. Архивировано 13 октября 2016 года.
- Assemblyman Tedisco's Wikipedia vandalized (англ.) (22 октября 2016). Архивировано 3 августа 2021 года.
- Ehrlich, Jamie. GOP senator says he is alive amid Google searches suggesting he is dead (англ.). CNN (24 июля 2018). Дата обращения: 11 сентября 2018. Архивировано 11 сентября 2018 года.
-
- All Things Considered (24 July 2018), from National Public Radio.
-
- 1 2 Вандалы переписали статью "Википедии" об МГУ (рус.). Lenta.ru (17 мая 2007). Дата обращения: 20 марта 2023. Архивировано 20 марта 2023 года.
- Дмитрий Кузьмин. Как и почему врет Википедия (рус.). Colta.ru (8 августа 2012). Дата обращения: 20 марта 2023. Архивировано 20 марта 2023 года.
- Издательство «Эксмо» приписало крещение Руси Шевелеву Павлу Викторовичу . Деловой Петербург (22 ноября 2011). Дата обращения: 20 июня 2018. Архивировано 20 июня 2018 года.
- Belani, 2010, p. 1.
- Adler, de Alfaro, Mola-Velasco, Rosso, West, 2011, p. 290.
- Tramullas, Garrido-Picazo, Snchez-Casabn, 2016, p. 4.
- Chin, Street, Srinivasan, Eichmann, 2010, p. 6.
- Roessing, 2011, p. 2—3.
- Tran, Christen, 2013, p. 270—271.
- Chin, Street, Srinivasan, Eichmann, 2010, p. 5.
- 1 2 Tramullas, Garrido-Picazo, Snchez-Casabn, 2016, p. 3.
- Tramullas, Garrido-Picazo, Snchez-Casabn, 2016, p. 3—4.
- Tramullas, Garrido-Picazo, Snchez-Casabn, 2016, p. 5.
Литература
Ссылки
Категория:Вандализм
Категория:Википедия
|
|