Меню
Главная
Случайная статья
Настройки
|
Для защиты проекта от спамеров, массово размещающих ссылки на коммерческие и прочие неприемлемые сайты, а также для ограничения возможности ссылаться на сайты, признанные неавторитетными для статей Википедии, существует техническая возможность запрета добавления активных (кликабельных) ссылок на заданные сайты или разделы сайтов. Существует два различных технических механизма, реализующих эту функцию:
- Более старый, основанный на описании URL-а заблокированного сайта регулярными выражениями. Состоит из общего для всех проектов Фонда блэклиста, локального блэклиста Русской Википедии и локального «белого списка», имеющего приоритет перед двумя блэклистами выше.
- Более новый, пополняемый через страницу Служебная:BlockedExternalDomains, список заблокированных доменов хранится здесь. Не требует знания регулярных выражений, но позволяет заблокировать лишь весь домен целиком, а не только часть разделов сайта.
Правку, вносящую активную ссылку, подпадащую под любое определение в блэклистах и не подпадающую ни под одно определение в белом списке, невозможно внести, кроме случаев, когда её вносит бот (исключение ввели для возможности корректной архивации обсуждений, содержащих ссылки, внесённые в спам-лист уже после их размещения).
Сайты вносятся в и исключаются из локальных чёрных и белых списков по обсуждению на странице ВП:Изменение спам-листа, по результатам обсуждения на ВП:КОИ, а также решением администраторов в случае массового спама. Глобальный блэклист меняется по обсуждениям на meta:Talk:Spam blacklist.
Ведётся два журнала попыток внесения правок со спам-ссылками: Special:Log/spamblacklist для ссылок, заблокированных старым методом, Special:Log/abusefilterblockeddomainhit для ссылок, заблокированных новым методом.
Содержание
Старый метод
Основы регулярных выражений
Регулярное выражение — паттерн (образец, шаблон) для синтаксического разбора текста.
Выражение может состоять из следующих частей (конкретные примеры и полная информация приведены по ссылкам, тут только небольшой обзор):
- Обычные символы (все, кроме представленных в пункте ниже) — записываются как есть.
- Спецсимволы (
[ ] \ ^ $ . | ? * + ( ) { } ) — используются в качестве служебных для обозначения классов символов, группировки и т. п. При необходимости использовать спецсимволы в качестве обычных они должны быть экранированы с помощью знака \. То есть . обрабатывается как любой символ, \. — как точка.
- Управляющие символы — представляют собой замену для некоторых символов, вывод которых может быть затруднён (
\t — знак табуляции, \r — возврат каретки и т. д.).
- Символьные классы — набор символов в [ ], представляют собой подстановку любого из набора символов. Например,
[abc] означает любой из символов a, b, c; [0-9] — цифра от 0 до 9. Существуют сокращенные записи для частоиспользуемых классов (\d — только цифры, \S — непробельные символы и т. п.)
- Символы позиционирования внутри строки — определяют, в каком месте строки должно встречаться искомое выражение.
- Квантификаторы — подставляются после символа, класса или группы и определяют, сколько раз может повторятся выражение. Например,
* означает, что предыдущий символ, класс символов или группа может повторятся сколько угодно. То есть a* — любая последовательность букв a.
Конкретные примеры
Новый метод
Для добавления домена в спамлист на странице Служебная:BlockedExternalDomains достаточно ввести в соответствующие поля сам домен и комментарий, а затем нажать кнопку «Отправить». После этого домен будет добавлен на страницу MediaWiki:BlockedExternalDomains.json. Там же можно откорректировать имеющуюся информацию.
|
|