Меню
Главная
Случайная статья
Настройки
|
Содержание
Разное
Убрал некоторые неработающие и уе присутствующие в программе автозамены. Но думаю, что вообще не стоит включать сюда замены, не связанные с орфографией, чтобы не создавать путаницы. Вообще конечно было бы удобно иметь возможность произвольно подключать к AWB любые подобные списки автозамены, которые можно было совместно редактировать в вики. Но это уже скорее вопрос к разработчикам. Solon 11:20, 12 апреля 2008 (UTC)[ответить]
еще ещё ?
Предлагаю убрать эту замену. Есть мнение [1], что «еще» (безударная частица) и «ещё» (наречие) — воообще разные слова. Shureg 13:25, 13 июня 2008 (UTC)[ответить]
- Слова-то может и разные, но писать одно из них через Е — это бред сивой кобылы. Или вы произносите в каких-то случаях ещё через Е (еще / еще) ??? — Dirl 20:54, 13 июня 2008 (UTC)[ответить]
- По крайней мере, в в словаре Ушакова пишется именно так. А произносятся они действительно по-разному. Как минимум можно говорить о неустоявшейся норме. А значит, (полу)автоматически заменять где попало еще на ещё не стоит.
- Вот что говорит на этот счёт грамота.ру. — Dirl 15:41, 14 июня 2008 (UTC)[ответить]
kg->кг
у меня AWB испортил стилевые слова "background"... infovarius 22:43, 25 августа 2008 (UTC)[ответить]
- Мне он тоже предлагает заменить "background" на "bacкгround". Где это можно исправить? — ОВ3Я2ДСН23 18:36, 9 октября 2008 (UTC)[ответить]
Бангладеш
По правилам русского языка[2] слово Бангладеш не слоняется, поэтому нужна замена Бангладеш(а,у,е,ь) на Бангладеш --Tat1642 21:49, 25 января 2009 (UTC)[ответить]
репер
Успокойте меня, пожалуйста - скажите, что вот это дополнение не означает смертного приговора термину репер. Андрей Романенко 15:55, 9 марта 2009 (UTC)[ответить]
- Спасибо. Честно говоря, впервые узнал о существовании этого списка. Изучаю его в задумчивости. Пытаюсь понять, например, как существование строчки
- согласуется с существованием статьи Макс Брэнд. Андрей Романенко 16:02, 9 марта 2009 (UTC)[ответить]
- Именно поэтому исправление орфографии Автовикибраузером в автоматическом режиме отключено. Я считаю, что в подавляющем большинстве случаев замена оправдана, а в тех единичных случаях, где нет ответственность лежит на пользователе бота или AWB. — Obersachse 16:08, 9 марта 2009 (UTC)[ответить]
- То есть эту штуку запускают вручную, в управляемом режиме? Тогд ОК — кажется, все возможные сомнительные случаи в этом списке человек может отследить. Разве что на всякий случай хочу сообщить всем пользующимся, что если когда-нибудь им встретится словосочетание «зеленое вино» (например, в песне из оперы Римского-Корсакова «Садко»: «Обносите зеленым вином, Зеленым вином заморским!»), то в этом древнерусском обороте нет буквы «ё», потому что ударение падает на окончание: «зелено вино», «зеленым вином» (и имеется в виду отнюдь не цвет). Андрей Романенко 16:26, 9 марта 2009 (UTC)[ответить]
Как это сделано?
Почему в статье Ли Тхай То фраза "Ле Нгоа Чиеу" викификатором не изменяется на "Ле Нога Чиеу", хотя соответсвующая замена для ноги прописана на странице. Как это сделано? — Дмитрий Никитин 13:52, 11 июня 2009 (UTC)[ответить]
- Замечательно. Тогда давайте исключим эту Ногу, раз нельзя запретить эту автозамену для определенноой статьи. — Дмитрий Никитин 15:11, 11 июня 2009 (UTC)[ответить]
- False positives есть всегда, не только на этой ошибке. Тот же бренд/брэнд. Просто надо ботов лишний раз не гонять по ним. —LimeHat 16:25, 11 июня 2009 (UTC)[ответить]
- Никто специально и не гоняет. Просто будешь проставлять\удалять\изменять категории или проставлять шаблоны и в фоновом режиме сделаешь такую групую замену. Причем не понятно ее происхождение. Факт опечатки единичен, зачем ее занесли в общий список частых опечаток\орфографических ошибок. — Дмитрий Никитин 17:15, 11 июня 2009 (UTC)[ответить]
- Я же говорю — такие случаи встречаются на разных заменах. И на ёфикации (например, статьи Ё (кириллица)); и на бренд/брэнд (примеры сейчас не вспомню, но буквально сегодня несколько раз сталкивался, исправляя эту ошибку) и прочее прочее. Поэтому, проблема более "глобальна", чем с ногой. Поэтому и говорю — а стоит ли лишний раз (при той же массовой категоризации) исправлять их ботами? —LimeHat 17:39, 11 июня 2009 (UTC)[ответить]
АгенТсТво
То, что ищется слово целиком приводит к тому, что часто не срабатывает тупо-фикс. ·Carn !? 11:26, 17 апреля 2009 (UTC)[ответить]
автозамены
Если нет возражений и ошибок, то предлагаю добавить следующие автозамены
<Typo word="военачальник" find="\b(В|в)оен+оначальник(\w*)\b" replace="\1оеначальник\2" />
<Typo word="комментарий" find="\b(К|к)оментари(\w+)\b" replace="\1омментари\2" />
<Typo word="команда, командир" find="\b(К|к)омманд(\w*)\b" replace="\1оманд\2" />
<Typo word="приемлемый" find="\b(П|п)р[еи]емлим(\w*)\b" replace="\1риемлем\2" />
- Опс, надо исключить как то "действия отрядов коммандос" — Дмитрий Никитин 14:14, 11 июня 2009 (UTC)[ответить]
- (К|к)омманд(?!ос|о\b)(\w*) -- так? Коммандир комманды коммандосов коммандовал коммандо.
- добавил — Дмитрий Никитин 15:01, 16 июня 2009 (UTC)[ответить]
Наряду
А почему у нас такое странное правило?
<Typo word="наряду (с)" find="\b(Н|н)а ряду\b(?= с )" replace="$1а ряду" />
Кто-нибудь может пояснить? — GranD 11:42, 26 августа 2009 (UTC)[ответить]
- Думаю, что это опечатка, где-то там пробела не должно быть. Вот правка 2007 года, спросите участника Solon. — AlexSm 14:17, 26 августа 2009 (UTC)[ответить]
в/на Украине
Предлагаю добавить замену с "в Украине" на "на Украине". Есть кто против? Advisor 20:40, 22 сентября 2009 (UTC)[ответить]
- А как быть с цитатами и названиями статей или книг? Dinamik 20:55, 22 сентября 2009 (UTC)[ответить]
- Не учёл. Тогда не получится, а жаль, надоедает откатывать переправляльщиков. Advisor 22:17, 22 сентября 2009 (UTC)[ответить]
нужно исправить
представляет из себя представляет собой — Dirl 11:02, 8 декабря 2009 (UTC)[ответить]
- Сделано. --Volkov (?!) 12:27, 8 декабря 2009 (UTC)[ответить]
Image
Не то, чтобы это было ошибкой, но замена «[[Изображение:» или «[[Image:» на «[[Файл:» следовала бы принципам викификатора. --Obersachse 12:45, 8 декабря 2009 (UTC)[ответить]
- Можно ведь просто в AWB поставить галочку, чтобы выполнялись general fixes --Volkov (?!) 12:47, 8 декабря 2009 (UTC)[ответить]
- Возможно ты прав. Я, кажется, снял эту галочку после того, что где-то прозвучала критика этих general fixes. --Obersachse 13:28, 8 декабря 2009 (UTC)[ответить]
Республика ххх
Есть ли возражения против добавления и аналога для винительного и творительного падежа? Вопрос подняли на Википедия:Запросы к ботоводам#Ещё раз про республики (кардинальное предложение). --Obersachse 13:49, 14 июля 2010 (UTC)[ответить]
- word="аксиома"? Ashik talk 14:21, 14 июля 2010 (UTC)[ответить]
- Эх, проклятый копи-паст. Наверное word="Республика ххх" будет понятным описанием. --Obersachse 05:34, 15 июля 2010 (UTC)[ответить]
Проблемные замены- В статье Бунин, Юлий Алексеевич предлагается замена: переговоры с петербургскими народниками -> переговоры санкт-петербургскими народниками. Нужно как то подправить.
- Замена
<Typo word="белорусский" find="\b(Б|б)еларусс?к(\w*)\b" replace="$1елорусск$2" />
глючит на каждом полустанке. К примеру, в статьях Годлевский, Винцент, Федута, Александр Иосифович, Олехнович, Франтишек используются названия на белорусском языке и в итоге предлагаются варианты:
Беларуская - Белорусская
Беларускі - Белорусскі
Целесообразен ли такой шаблон, со многими неизвестными? Артём Л. 12:06, 5 августа 2010 (UTC)[ответить]
- В большинстве случаев замена пока оправдана. Нужно смотреть, что чаще - ошибка или исключение из правила. --Obersachse 13:16, 9 августа 2010 (UTC)[ответить]
- Раз пять точно встретилось Артём Л. 13:23, 9 августа 2010 (UTC)[ответить]
- Именно поэтому нужно тщательно проверять дифф перед тем, как записывать правку, и, при необходимости, исправлять вручную. Rainbow 14:00, 9 августа 2010 (UTC)[ответить]
Итти
Просмотрел случаи употребления: половина — в цитатах из источников с дореволюционной орфографией, половина — какие-то месопотамские имена собственные. Думаю, можно безболезненно удалить замену «итти — идти», так как потенциальный вред от ее существования превышает возможную пользу. --Bandar Lego 22:12, 3 сентября 2010 (UTC)[ответить]
бол->bol, л->l
Что-то не могу найти, почему у меня AWB заменяет эти буквосочетания в ключах сортировки шаблонов... infovarius 14:56, 2 октября 2010 (UTC)[ответить]
Санкт-Петербург
Лишнего меняет во фразе Вместе с петербургскими оркестрами она... К сожалению в регэкспах не силен, поправить не смогу. --IGW 09:17, 24 января 2011 (UTC)[ответить]
римейк -> ремейк
Предлагаю добавить замену "римейк" на "ремейк". Основание: [3]. Ошибка встречается довольно часто, сейчас около 700 статей содержат ошибку [4]. -- NZeemin 00:49, 31 марта 2011 (UTC)[ответить]
Написание «каратэ» присутствует в официальных наименованиях нескольких организаций и в названии огромного числа книг и статей на русском языке. Считаю, что автоматическая замена «каратэ карате» безусловна вредна, так как приведёт к искажению наименований организаций и выходных данных источников. Предлагаю эту строчку удалить. INSAR о-в 13:49, 3 августа 2011 (UTC)[ответить]
- раз так -- удаляйте. Я полагаю, что консенсуса тут можно ждать годами, поэтому вообразим, что процедура по изменению носит уведомительный характер, а не согласовательный, т.е. изменил, оповестил на странице обсуждения и дело в шляпе. — Dnikitin 14:07, 3 августа 2011 (UTC)[ответить]
(Санкт-)Петербург
Я временно удалил замену, связанную с этим словом, по причине большого числа ложных срабатываний ("параллельно с Петербургской" на "параллельно санкт-Петербургской", "200 л. с. петербургского завода" на "200 л. санкт-петербургского завода", информация от INSAR). Поскольку код довольно сложный, прошу тех, кто лучше разбирается в регэкспах, сузить его область действия.
Либо вообще его отменить, т.к. название "Петерберг" без префикса тоже активно употребляется (см. статью История Санкт-Петербурга), и буква "с" перед ним тогда не является сокращением от "Санкт". Смотрите также темы выше - #Санкт-Петербург и #Проблемные замены MaxBioHazard 16:12, 10 августа 2011 (UTC)[ответить]
{{Шаблон: {{
по-умолчанию, поумолчанию по умолчанию
Предлагаю добавить. -- NZeemin 06:00, 27 октября 2011 (UTC)[ответить]
- Да, ошибка встречается в ру-вики не менее 90 раз. Добавил. --Movses 07:43, 27 октября 2011 (UTC)[ответить]
ареал обитания ареал
Ы? 17:24, 25 февраля 2012 (UTC)[ответить]
- В списке нет ни слова "ареал", ни слова, похожего на "обитание" и мой АВБ в режиме исправления ошибок подобных замен не делает (проверил на этой СО). Где такое было ? MaxBioHazard 17:32, 25 февраля 2012 (UTC)[ответить]
- Это предложение ввести. К слову "ареал" определение "обитания" лишнее, между тем весьма распространённая ошибка. Когда говорят "ареал обитания", всегда в таких случаях нужно заменить на ареал. 17:48, 25 февраля 2012 (UTC)[ответить]
- Поступили возражения, что ареал обитания тоже правильно (demography academic ru/1366/АРЕАЛ_ОБИТАНИЯ). MaxBioHazard 18:22, 25 февраля 2012 (UTC)[ответить]
- Непрофильный источник, к тому же в географии населения (99,9% используется в биологии). А вообще есть даже специализированные словари такие, что должны даже прежде Каутского в печку лететь (печально известный Соколов). Но вопрос падежей автозаменами не решается, так что здесь это не актуально. 18:39, 25 февраля 2012 (UTC)[ответить]
Есть ещё ареал распространения (992 включения в Википедии, по Яндексу). --С уважением, Borealis55 13:46, 26 марта 2012 (UTC)[ответить]
деревянистый
Неверное исправление: деревянистый деревяннистый (dic.academic ru/dic.nsf/ogegova/46982). Нужно подправить.--Cinemantique 21:21, 27 марта 2012 (UTC)[ответить]
- Так подойдёт ? --Movses 07:13, 28 марта 2012 (UTC)[ответить]
- Нет. Попробуйте обработать викификатором слово деревянистый или фамилию Деревянко — появляется второе «н». --Bff 11:43, 29 марта 2012 (UTC)[ответить]
- Так это не викификатор, у викификатора свои замены, о его проблемах пишите на его СО. MaxBioHazard 11:48, 29 марта 2012 (UTC)[ответить]
- Извиняюсь. --Bff 11:54, 29 марта 2012 (UTC)[ответить]
Дети
Добавьте «ребенок ребёнок». INSAR о-в 01:43, 6 апреля 2012 (UTC)[ответить]
Белорусский язык
Подскажите, пожалуйста, как-то можно отключить автозамену отдельных слов белорусского языка? Например, «раён» «район». Пробел в начале строки не получается, так как слово находится в списке литературы. — StanTRC 09:24, 27 июня 2012 (UTC)[ответить]
в городе Москве
В названии закона: «О внесении изменений в Закон города Москвы от 15 октября 2003 года № 59 „О наименованиях и границах внутригородских муниципальных образований в городе Москве“» AutoWikiBrowser убирает слово городе. Permjak 18:10, 1 июля 2012 (UTC)[ответить]
WPCleaner
Hi,
If you're interested, WPCleaner can now be configured to use the same list as AWB to detect spelling and typography mistakes and provide suggestions. --NicoV 09:44, 23 сентября 2012 (UTC)[ответить]
"чем"
Какой-то код, используемый викификатором, заменяет "чем" на "чём", что не всегда корректно (пример: "нам не о чем сожалеть" "нам не о чём сожалеть"). -- AVBtalk 01:28, 22 ноября 2012 (UTC)[ответить]
Замена "в месте с" на "вместе с"
Думаю, что данную автозамену надо убирать. Сегодня один участник пожаловался на то, что у него эта замена сработала некорректно. Там фраза «рухнул в месте с координатами ...» была заменена на «рухнул вместе с координатами ...». Причём это уже было неоднократно. Так что я строчку пока убираю.-- Vladimir Solovjev обс 11:57, 2 декабря 2012 (UTC)[ответить]
Сочетание «ответств»
… в словах «соответствовать», «ответственный» и т. д. Исключений вспомнить не смог. --88.81.32.220 09:04, 23 февраля 2013 (UTC)[ответить]
- Я что-то не пойму, это проблемы с текущей какой-то автозаменой или предложение новой автозамены ? --Movses 09:09, 23 февраля 2013 (UTC)[ответить]
- Предложение. 88.81.32.220 09:20, 23 февраля 2013 (UTC)[ответить]
- Несколько сложно читать мысли...
<Typo word="Ответственно" find="(О|о)твеств" replace="$1тветств" />
- Вы эту строчку имеете в виду ? --Movses 12:26, 23 февраля 2013 (UTC)[ответить]
- Она самая. Кстати, здесь упомянули одну очень распространённую ошибку «справочнник» — более 1000 (на тот момент) случаев. Можно внести? 89.189.29.215 19:03, 24 февраля 2013 (UTC)[ответить]
- Ну, раз она самая, то я добавил и из кивипедии вычистил. Спасибо, что обратили внимание! А «справочнник» MaxBioHazard уже внёс. --Movses 20:00, 24 февраля 2013 (UTC)[ответить]
И снова «ответств»
Нашлось ещё одно искажение — пропуск третьей «Т» (пример — «соответсвующим»), примерно 65 вхождений. Никто не натыкался? 92.242.86.133 19:11, 11 марта 2013 (UTC)[ответить]
- Наткнулись. Добавились. Спасибо ! Аффтар пеши исчо :-) --Movses 06:28, 12 марта 2013 (UTC)[ответить]
Что-то «везёт» сочетанию «СТВ» на пропажи: «отсутсвие» (больше 30 вхождений) — похоже, непроизносимые согласные выпадают ещё и на письме... 149.62.3.233 18:20, 16 марта 2013 (UTC)[ответить]
- Добавлено. Благодарствую. --Movses 20:32, 16 марта 2013 (UTC)[ответить]
ТСТВ
Проблему с ТСТВ я закрыл на 99 % таким образом:
- Идём на сайт http://www.krossw.ru и забиваем маску *тств*
- Выцепляем нужное и формируем строку нужного вида для всех начальных букв
<Typo word="ТСТВ" find="(А|а)(бба|ген|гна|двока|дъюнк|дъютан|кроба|мана|нахоре|ристокра|рхимандри|спиран)т?ст?в" replace="$1$2тств" />
--Movses 09:19, 17 марта 2013 (UTC)[ответить]
лейтенат
Ещё одна предлагаемая запись (Л|л)ейтенат $1ейтенант 88.81.40.178 12:10, 22 марта 2013 (UTC)[ответить]
- Добавил, а заодно и замены для «летенант», «лейтинант», «лейтеннант» и подобного. — putnik 12:30, 22 марта 2013 (UTC)[ответить]
Растояние
Огромное количество включений--Хомелка :) / обс 06:27, 24 апреля 2013 (UTC)[ответить]
- Поддерживаю включение в список для автоисправлений. --Pessimist 11:00, 24 апреля 2013 (UTC)[ответить]
- Сделано. Добавил и исправил. --Movses 19:10, 24 апреля 2013 (UTC)[ответить]
Котрансплантация
Викификатор превращает медицинский термин «котрансплантация» в «которансплантация» (на этой странице почему-то случается, только если выделить само слово). На странице обсуждения Викификатора сказано писать сюда. DmitTrix 09:18, 23 мая 2013 (UTC)[ответить]
- Это срабатывала замена для «котрая» «которая», поправил. — putnik 09:24, 23 мая 2013 (UTC)[ответить]
«Ничего этого»
<Typo word="ничего" find="\b(Н|н)и\s?че[го]{2}([^-бы]{3,3})" replace="$1ичего$3" /> неверно срабатывает на «ничего этого» и «ничего другого». Отключаю. KPu3uC B Poccuu 05:44, 27 июля 2013 (UTC)[ответить]
Бангладеш 2
Викификатор заменяет сочетание "в Бангладеше" на "вБангладеш". Пример - Виейра ди Меллу, Сержиу, Обсуждение:The Simpsons Hit & Run. Kalendar 12:15, 12 ноября 2013 (UTC)[ответить]
- Да, есть такая проблема. В гаджете актуальные замены, но в что именно не так, пока не нахожу. — putnik 13:28, 12 ноября 2013 (UTC)[ответить]
- Исправлено, но правило пока вообще убрано из замен для Викификатора, надо будет думать, как корректно написать преобразование в JS-регекспы. — putnik 18:05, 14 ноября 2013 (UTC)[ответить]
нашлось в старом файле
/// — собственно замены, после них комментарии
- r/[Рр]а[ий]{1,2}сполком/$1айисполком/
- Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
- r/[Рр]екомм?енд/$1екоменд/
- Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
- Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
- r/[Пп]ревоначаль/$1ервоначаль/
- Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
- r/[Сс]териотип/$1тереотип/ скорее всего, уже вычищено, но повтор возможен
- Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
- r/[фФ]ранцузк/$1ранцузск/
- Хотя замена уже была, я её немного улучшил. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
- r/[Кк]орр?еспон?ден/$1орреспонден/ !вариант с одной "р" встречается в украиноязычных фрагментах
- r/[Пп]омош/$1омощ/ "помощь" и производные
- r/[Оо]кк?упир/$1кк?упир/ оккупировать
- r/[Оо]кк?упаци/$1ккупаци/ "оккупация" и производные
- r/[Пп]аралл?ель/$1араллель/ ! но Паралельная
Там ещё 10 Кб слов с ошибками 149.62.8.217 11:00, 26 декабря 2013 (UTC)[ответить]
- Спасибо ! С радостью посмотрим ваши 10 кб, если зальёте в википедию, например сюда. --Movses 11:34, 26 декабря 2013 (UTC)[ответить]
- Залито; собственно слова под чертой, выше порция более менее однозначных замен, продублированы здесь:
- r/[Вв]осемдесят\b/$1осемьдесят/ числительные надо бы в отдельной группе
- r/[Вв]осемдесят\B/осьмидесят/ особенно порядковые
- r/[Дд]естятысячн/$есятитысячн/
- r/[Чч]етыремя/$1етырьмя/
- r/[Тт]ринн?ад?цат/$1ринадцат/
- r/[Аа]вгут/$1август/
- r/[Аа]бб?р[ие]в[еи]атур/$1ббревиатур/ вроде уже было?
- r/[Вв]аринт/$1ариант/
- r/[Вв]сётаки/$1сё-таки/
- r/[Гг]луюок/$1лубок/ опечатка б-ю
- r/[Ии]нфркрасн/$1нфракрасн/
- r/[Ии]стичени/$1стечени/
- r/[Кк]омиси/$1омисси/
- r/[Кк]онтр-атак/$1онтратак/
- r/[Оо]бепокоен/$1беспокоен/
- r/[Пп]лавнк/$1лавник/
- r/[Пп]ригорд/$1ригород/
- r/[Пп]оло[шщ]ад/$1лощад/
- r/[Пп]рородител/$1рародител/
- r/[Пп]р[еи]обрел\b/$1риобрёл/ !граница слова
- r/[Пп]одданы/$1одданны/ !внимание на контекст
- r/[Пп]оломник/$1аломник/ "половник" маловероятно, но возможно
- r/[пП]роишестви/$1роисшестви/
- r/[Сс]ред[ие]земномо?р/$1редиземномор/
- r/[Тт]еме?п?ератур/$1емператур/
- r/полога/полага/ лаг-лож,
- r/Филл?ипп?ин/Филиппин/
- r/резеден/резиден/
- r/\Bних\b/ниях/ попытка отловить именно окончания: по идее \B должно отсечь "\bних\b" (местоимение после предлога)
- r/обсулов/обуслов/
37.147.194.106 16:30, 28 декабря 2013 (UTC)[ответить]
- Да, неслабый файлик, спасибо ещё раз ! Работы предстоит немало :) --Movses 22:47, 29 декабря 2013 (UTC)[ответить]
Оккупация
Думаю, «оккупацию» нужно доработать-подправить. Примеры (при редактировании в AWB):
- 10-я пехотная дивизия (Третий рейх) — заменяет «оккупации» на «окк?упации»,
- Дубоссары — заменяет «оккупированны» на «окк?упированны»,
- Марки виртуальных государств — заменяет «оккупационных» на «окк?упационных»,
- в описании правки пишет либо всё предложение после редактируемого слова, либо вообще непонятную хрень. Vs64vs 18:20, 28 декабря 2013 (UTC)[ответить]
- Я удалил эту замену - насколько я знаю регэкспы, она вообще ничего не делает, кроме добавления этого вопроса (я мог бы её исправить, но тогда она бы вообще ничего не делала), а нормальная замена для этого же слова прописана строкой выше. MaxBioHazard 18:29, 28 декабря 2013 (UTC)[ответить]
- Замена "окупац" > "оккупац" нормально работает если убрать лишний знак вопроса. Сделано (diff) --Movses 19:28, 30 декабря 2013 (UTC)[ответить]
ценральный
Было find="\b([Цц])етр(\w*)\b" replace="$1ентр$2" . Чтобы ловило как в заголовке, надо find="\b([Цц])е(тр|нр)(\w*)\b" replace="$1ентр$3" 92.242.90.246 02:32, 18 мая 2014 (UTC)[ответить]
Штуттгарт Штутгарт
С одним "т". --Fedor Babkin talk 18:13, 19 июня 2014 (UTC)[ответить]
афициальный
Работа над ошибками от Яндекса утверждает, что так тоже ошибаются 88.81.43.41 16:53, 14 января 2015 (UTC)[ответить]
- В википедии "афициальный" я не нашёл, но модицифировал регулярное выражение, авось когда поймаем. --Movses 08:43, 15 января 2015 (UTC)[ответить]
Зеленой
Викификатор некорректно обрабатывает такие случаи. --Insider 51 11:50, 24 февраля 2015 (UTC)[ответить]
- Викификатор берёт замены не из этого списка, ответственность за корректное составление списка для викификатора - на составителе того списка. АВБ делает здешние замены только в полуручном режиме, оператор должен отслеживать подобные случаи. Не сделано MaxBioHazard 17:54, 21 мая 2015 (UTC)[ответить]
Група
В режиме исправления Typos'ов в АВБ нельзя включить полный автомат, в нём работает только ручное сохранение каждой правки после предпросмотра диффа. Исходя из этого, подобные замены, неадекватные в других языках, в списке оставляются, т.к. предполагается, что правщик увидит дифф перед сохранением правки и не станет его сохранять. Не понравившаяся вам правка не могла быть совершена через АВБ, т.к. отключить добавление в описание правки текста "с помощью АВБ" можно только с учётки со флагом бота, кроме того правка вообще немассовая. Возможно, это сделал викификатор, но у него свой список замен, лежащий в его js-файле, он не берёт замены из АВБшного списка. На основании вышенаписанного предлагаю восстановить удалённую вами замену. MaxBioHazard 12:09, 3 мая 2015 (UTC)[ответить]
- Насколько я понимаю, Putnik обновляет гаджет скриптом, а специальной отметки «только для ботов, в гаджет не переносить» в ВП:Typos не предусмотрено. Кроме того, есть достаточно много примеров, где это срабатывает некорректно и в русском тексте — всевозможные названия организаций, групи…; в то же время, некоторые нужные автозамены не проводились (например, в русском тексте «групой» «группой»). Думаю, что эта замена достаточно сложная, поэтому её лучше периодически производить отдельным проходом по результатам поиска. NBS 18:53, 3 мая 2015 (UTC)[ответить]
- Да, переношу скриптом, копируются все правила, которые можно воспроизвести при помощи регулярных выражений на JS. — putnik 18:58, 3 мая 2015 (UTC)[ответить]
- правило как-то барахлит, удалил. сейчас не помню где, но предлагало заменить "группировка" на "групппировка". Shabe (обс.) 00:54, 30 июня 2025 (UTC)[ответить]
- p. s. возможно, в слове "группировка" был знак мягкого переноса, из-за которого "груп" рассматривалось как отдельное слово, аналогично "пировка". и затем менялось "груп" на "групп", давая на выходе "групппировка" с тремя "п". добавил удаление таких знаков в Опечатки. Shabe (обс.) 12:30, 13 августа 2025 (UTC)[ответить]
дествительно - дйствительно
Викификатор заменяет «дествительно» на «дйствительно». Kalendar 09:40, 29 января 2016 (UTC)[ответить]
- Здесь я исправил, а вот у викификатора это надо бы написать на страницу Обсуждение Википедии:Викификатор. --Movses 10:01, 29 января 2016 (UTC)[ответить]
Комунига
т.к. Обсуждение Википедии:Викификатор посылает сюда ...
Викификатор заменяет «Комунига» на «Коммунига», что неправильно--User№101 22:09, 26 февраля 2016 (UTC)[ответить]
Война правок
По поводу правила "Коммунизм". Я понял, коллега, что не понимаете, потому и написал, тренируйтесь в личном пространстве. Я вернул страницу к консенсусной версии от 10 февраля и начинать обсуждение должны вы, а не я. Претензии изложены в комментариях к правкам. Что я должен к ним добавить? Лишь то, что, если видите работающее правило, не стоит ломать его, а постараться модернизировать. В данном случае, например, возможен такой вариант: find="\b(К|к)ом+ун+(?!ерос|иг)", но вы предпочли сделать из одного работающего правила два, причём одно из них неработающее. Я уже не раз, как вы помните, правил за вами новые правила, но в данном случае, когда вы ломаете старые, счёл правильным этот путь исправления. Игорь Темиров 05:05, 28 февраля 2016 (UTC)[ответить]
- Объясните, какие неправильные замены вызовет мой вариант и при чём здесь некий "комумунизм" MaxBioHazard 05:57, 28 февраля 2016 (UTC)[ответить]
- некий "комумунизм" - это из вашей правки: <Typo word="коммунизм", чтобы было понятно, о каком правиле идёт речь.
- По поводу неправильных замен этой вашей версии, я написал в комментарии: "Съедаются две буквы в правиле "комумунизм". Тренируйтесь в личном пространстве". Что тут непонятного? Вместо того, чтобы спрашивать здесь, просто применили бы ваше правило и, если бы и после этого было непонятно, тогда бы писали. Игорь Темиров 06:12, 28 февраля 2016 (UTC)[ответить]
- см. например Комун... и т.п., - нужно ли это правило автозамены (или надо ещё исключения добавлять)?--User№101 17:50, 28 февраля 2016 (UTC)[ответить]
четыремя четырёмя
AWB предлагает вот такую странную замену: четыремя четырёмя. -- NZeemin (обс) 21:26, 19 июля 2016 (UTC)[ответить]
-
- Вы исключили из обработки сложные слова типа «четырёхэтажный» — пожалуйста, верните. А слово «четыремя» разве существует, что ради него надо что-то менять? Должно быть «четырьмя», не? DmitTrix (обс) 07:30, 20 июля 2016 (UTC)[ответить]
- P.S.: попросил ботоводов заменить «четыремя» на «четырьмя». DmitTrix (обс) 08:04, 20 июля 2016 (UTC)[ответить]
-
Клиппертон
Превращает Клиппертон в Клипертон. --Insider 51 06:32, 12 сентября 2016 (UTC)[ответить]
- Уточнение: превращает Остров Клиппертон в Остров Клипертон (не меняет название статьи, но меняет отображаемый текст). Kalendar (обс) 06:36, 12 сентября 2016 (UTC)[ответить]
- Участник:Jack who built the house. Oleg3280 (обс.) 07:55, 21 июля 2019 (UTC)[ответить]
агентство
Надо убрать дубль из секции А — есть в секции ТСТВ 92.242.79.77 19:59, 16 ноября 2016 (UTC)[ответить]
Коммунарский район
Вот здесь (правки) викификатор отработал некорректно. Поскольку существует корректное слово укр. Комунарський, то предлагаю в коде MediaWiki:Gadget-wfTypos.js исправить строку
r( /((?:^|\s)[Кк])ом+ун+(?!ерос)/g, '$1оммун' );
на
r( /([^іїєґІЇЄҐ]{100}(?:^|\s)[Кк])ом+ун+(?!ерос)([^іїєґІЇЄҐ]{100})/g, '$1оммун$2' );
Я проверил регулярку с помощью https://regex101.com/#javascript и проблем не увидел. --Movses (обс) 18:46, 17 августа 2016 (UTC)[ответить]
Буква ё
Добрый день!
Скажите, пожалуйста, викификатор умеет заменять е на ё? Здесь написано что да, однако у меня (Google Chrome 55) этого не происходит (по крайней мере на тексте "Найдем зеленый цвет"), хотя другие функции работают (в частности замена "т.е." на "то есть"). Спасибо! Дима74 (обс.) 18:24, 27 января 2017 (UTC)[ответить]
br
AWB не превращает . Почему? Включены Typos. Пришлось копировать код замены br’ов вручную в «поиске и замене». ALEX GREAT [обсуждение] 05:02, 22 мая 2017 (UTC)[ответить]
- Я надеюсь, вы не одну эту сверхмелкую правку сохраняете? MBH 10:01, 22 мая 2017 (UTC)[ответить]
- О чём вы говорите? Вы думаете, что я захожу в АвтоВикиБраузер, чтобы вручную вписать туда код замены br’ов, пройтись по статьям и заменить исключительно их? Мне проще было бы это делать через Википедию, где викификатор с этим прекрасно справляется. Поэтому мой ответ — да, я сохраняю правку с другими необходимыми изменениями (вычищал ненужные флаги из карточек, можете посмотреть в моё вкладе). ALEX GREAT [обсуждение] 02:43, 26 мая 2017 (UTC)[ответить]
Цетрария
Исправление орфографии неправильно срабатывает на статье Цетрария исландская. К сожалению, я не понимаю, почему там ошибочно срабатывает (ведь исключение прописано), потому просьба посмотреть более подкованным людям. — Movses (обс.) 21:13, 26 декабря 2019 (UTC)[ответить]
- Movses, я посмотрела, это не только в исландской, но и в других цетрариях тоже не работало. Там в исключении не был прописан вариант со строчной буквой и с ударением. Добавила, вроде работает, и в викификаторе тоже обновила. К слову, надо бы везде ударные буквы проверить. — Alexandrine (обс.) 13:30, 12 июля 2020 (UTC)[ответить]
на протяжение на протяжении
Исправил около двуж сотен случаев; по-моему, достаточно для включения в список. Здесь был Вася 1234qwer1234qwer4обсвклад 22:20, 15 июня 2020 (UTC)[ответить]
Тем не менее
Я сделал запрос к ботоводам, запрошу и здесь. Встретил два раза подряд ошибку (и исправил её) в выражении: тем ни менее вместо правильного тем не менее . Если этого ещё нет в коде викификатора, предлагаю добавить. — 217.197.250.65 19:05, 4 июля 2020 (UTC)[ответить]
привелопривёло
Уберите из автовикифкатора эту замену.— Inctructor (обс.) 12:44, 12 августа 2023 (UTC)[ответить]
1960-ые 1960-е
Так правильно будет? — Obersachse 18:12, 3 февраля 2009 (UTC)[ответить]
словесные суффиксы у чисел
Предлагаю заменять последовательность цифр, после которой идёт неверный суффикс, на цифры с верным суфиксом. Ориентировочный регеэксп для правила "Однобуквенное наращение используется, если последней букве числительного предшествует гласный звук или мягкий знак":
(\d-)[аеёиоуыэюя](\a\b) $1$2
Здесь из конструкции вида (цифра)(дефис)(гласная буква)(ещё одна буква) убирается гласная буква после дефиса (списки гласных и согласных букв см. в согласные). Пример: "5-ый" "5-й". Под "\a" и "\b" я обозначил "любая кириллическая буква" и "не буква" соответственно.
В варианте (цифра)(дефис)(три буквы) нужно убирать одну (первую) букву, если вторая буква согласная (иначе: не-гласная) в соответствии с правилом "Двухбуквенные наращения используют, если последней букве числительного предшествует согласный звук", либо убирать две (первую и вторую) буквы, если вторая - гласная (см. выше правило про однобуквенный суффикс). Примеры: "10-ого" "10-го", "16-тый" "16-й".
-- AVBtalk 03:03, 27 июля 2010 (UTC)[ответить]
словесные суффиксы у годов
Наконец, нужно доработать обработку годов. Во-первых, я встречал конструкции вида
В этом случае суффикс ("-е" и "-х") нужно вносить в ссылку:
[[1960-е]] и [[1960-е|1960-х]]
соответственно. Разумеется, суффикс должен пройти обработку, упомянутую выше:
Во-вторых, если после числа (простого или в текстовой части ссылки) идёт суффикс (кроме "-е" и "-х") и буквы "год" (через простой или неразрывный (!) пробел), то суффикс надо убирать (см. правило "Кроме того, не наращивают окончания для номера года и числа месяца, если слово «год» и названия месяца следуют тотчас за числом... Неправильно: в 1991-м году; 5-го марта 1953-го года"). То есть должны обрабатываться случаи
1991-м году 1991 году
[[1991]]-го года [[1991 год]]а
[[1991 год|1991]]-ого года [[1991 год]]а
-- AVBtalk 03:03, 27 июля 2010 (UTC)[ответить]
оффицер офицер
странно это, учитывая что в реальности их officer это офисный работник (тот кто работает в office), а совсем не наш офицер — Эта реплика добавлена с IP 46.160.200.10 (о) 15:13, 23 октября 2019 (UTC)[ответить]
Typo word="манёвр"
а слово "манёвренный" у вас без ё будет ? — Эта реплика добавлена с IP 46.160.200.10 (о) 13:24, 22 октября 2019 (UTC)[ответить]
Неверные наращения числительных
@Gromolyak, приветствую. В вашей реализации появился баг, меняющий:
- ой_ ой-й_
- ою_ ою-ю_
- ое_ ое-е_
- ом_ ом-м_
- ого_ ого-го_
- ому_ ому-му_
- ая_ ая-я_
- ую_ ую-ю_
- ий_ ий-й_
- им_ им-м_
- их_ их-х_
- ими_ ими-ми_
- ем_ ем-м_
- ей_ ей-й_
- ею_ ею-ю_
- его_ его-го_
- ему_ ему-му
Просьба поправить или откатить. Solidest (обс.) 20:48, 29 мая 2024 (UTC)[ответить]
- Здравствуйте! Не совсем вас понял. Для замены обязательно наличие цифр и дефиса, но даже с ними не смог подобрать примера, приводящего к неправильной замене. Не могли бы вы привести хотя бы один такой пример?
На всякий случай — последние по дате изменения регулярное выражение и строка замены в скрипте —
"\b(\d+)-(?:(?:ы([ймех]|ми))|(?:о([йюем]|го|му))|(?:а(я))|(?:у(ю))|(?:и([ймх]|ми))|(?:е([мйю]|го|му)))\b"
и
"$1-$2$3$4$5$6$7"
Gromolyak (обс.) 22:41, 29 мая 2024 (UTC)[ответить]
- Эту регулярку на днях добавили в викификатор и она стала вызывать подобные ошибки: [5], [6], [7], и тд. Сам не уверен почему она реагирует только на нижнее подчеркивание. Возможно проблема возникает в связи с чем-то ещё, но появилась она ровно в день этой правки. Solidest (обс.) 22:50, 29 мая 2024 (UTC)[ответить]
- В начале регулярного выражения присутствует "(\d+)-", что означает одну или несколько цифр, а следом — дефис, они являются обязательными для того, чтобы шаблон сработал. Если в тексте их нет — выражение сработать не может ни при каких прочих условиях, что и было мной проверено раньше, когда с помощью AWB и этого выражения я заменил множество (несколько тысяч) ошибочных наращений, при этом не было ни одной жалобы. Кроме того, вот эта правка https://ru.wikipedia.org/w/index.php?title=%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:AutoWikiBrowser/Typos&diff=prev&oldid=135455251 участника Putnik показывает, что он не увидел ничего подозрительного в выражении, а, по слухам, он является специалистом в этой области. Кстати, и подчёркивания в рег. выр. нет, ни нижнего, ни верхнего. Gromolyak (обс.) 02:28, 30 мая 2024 (UTC)[ответить]
- Кстати, добавленная версия не соответствует моей и вообще не может правильно работать, так как первая скобка, которой не было, захватывает и копирует всё исходное выражение и ставит его перед дефисом, что уже неверно.
Правильная версия:
\b(\d+)-(?:(?:ы([ймех]|ми))|(?:о([йюем]|го|му))|(?:а(я))|(?:у(ю))|(?:и([ймх]|ми))|(?:е([мйю]|го|му)))\b
Добавленная неправильная версия:
((?:^|\s)(?:\d+)-(?:(?:ы([ймех]|ми)))|(?:о([йюем]|го|му))|(?:а(я))|(?:у(ю))|(?:и([ймх]|ми))|(?:е([мйю]|го|му)))\b
Не могу себе представить, что скрипт произвёл такую замену, так как при этом он поменял захватывающие скобки на незахватывающие ("(\d+)" на "(?:\d+)"), а также произвольно поместил всё выражение ещё в пару захватывающих скобок, чего быть не должно. Похоже, будто кто-то неправильно изменил выражение вручную. Копирование выражения без модификаций, без сомнений, решит проблему.
Gromolyak (обс.) 02:57, 30 мая 2024 (UTC)[ответить]
Прошу исправить её. Gromolyak (обс.) 13:05, 1 июня 2024 (UTC)[ответить]
Молодёжь
Предлагаю добавить в гаджет исправления орфографии слово «молодёжь» и все производные. С белорусским, болгарским и украинским нежелательных совпадений нет, я проверил. Могу ошибаться, но выглядеть это должно так:
r( /((?:^|\s)[Мм])олодеж/g, '$1олодёж' );
Или так:
r( /((?:^|\s)[Мм])олодеж(\w+)(?=[^A-ZА-ЯЁa-zа-яёъ|$)/g, '$1олодёж$2' );
- Вторая регулярка выглядит более безопасно, но она не ловит "науч.-практ. молодеж. конф." И обе регулярки не ловят "Техника-Молодежи" и "(молодежь)". Также не ловятся "«Молодежь Эстонии»", "«Молодежь Алтая»", хотя кавычки лучше и не ловить — вполне возможно, что в оригинале имя собственное без "ё". --Movses (обс.) 09:22, 1 февраля 2017 (UTC)[ответить]
Намёк
Добавьте, пожалуйста, намек намёк. Здесь был Вася 1234qwer1234qwer4обсвклад 11:37, 18 августа 2019 (UTC)[ответить]
Использование в других проектах
Коллеги, правильно ли я понимаю, что для того, что бы всё представленное здесь работало в ру-викиновостях, нужно перетащить это в викиновости? VladimirPF (обс.) 11:19, 20 февраля 2022 (UTC)[ответить]
Замеченная ошибка
Нужно исправить: а то ныне выдаёт: вплетена вплейтенант, переплетена переплейтенант. С уважением, Олег Ю. 16:54, 2 ноября 2013 (UTC)[ответить]
- Спасибо! С уважением, Олег Ю. 13:57, 3 ноября 2013 (UTC)[ответить]
Оптимизация
Использование символьных классов ускоряет обработку выражений, поэтому рекомендуется вместо (А|а) применять [Аа] . KPu3uC B Poccuu 08:35, 30 июля 2013 (UTC)[ответить]
- Можно, чисто для расширения кругозора, пруфлинк на это утверждение ? --Movses 09:30, 30 июля 2013 (UTC)[ответить]
- http://www.php.net/manual/ru/regexp.reference.performance.php. KPu3uC B Poccuu 11:56, 30 июля 2013 (UTC)[ответить]
Хочу заменить ссылки на шаблон- для строки Find учтите, что
[[ надо записать как \[\[ . чтобы замэтчить любые символы внутри этих квадратных скобок, надо (.+?) — любые символы, минимум 1. ну а в строке Replace ваш шаблон. в него вставить $1 вместо тех круглых скобок: (.+?) . вуаля Shabe (обс.) 19:07, 28 июня 2025 (UTC)[ответить]
«Лучший»
Приветствую всех!
Требуется сделать автозамену для неправильных форм слов «лучше», «лучший» и других однокоренных. Для слова «лучше» встречаются такие неправильные варианты: «лутше», «лучще», «лушче», «лучьше», «лудше» (даже такое встречается). Насколько я вижу в последних правках, правильное регулярное выражение подобрать не удаётся. --newMitЁk 06:28, 7 марта 2013 (UTC)[ответить]
- Проблема тут скорее в том, что есть слова исключения, которые подходят под регулярное выражение. Например:
- Я пытался сделать универсальную регулярку, но, видимо, если достигать цели, чтобы замены работали максимально аккуратно, то нужно сделать набор из нескольких регулярных выражений, чтобы отсекать вышеуказанные false positive. --Movses 08:39, 7 марта 2013 (UTC)[ответить]
- Думаю, цитату надо в nowiki заключать - мало ли какая ещё цитата с "неправильным" написанием будет, не на современном русском языке. С цитатами это вопрос сложный, интересно, где-нибудь есть рекомендация заключать цитаты в nowiki?--newMitЁk 09:35, 7 марта 2013 (UTC)[ответить]
- Если желаете, то можете дополнить Википедия:Цитирование ... Практически вы всё равно не заставите людей оформлять по правильному, поэтому при использовании регулярок надо учитывать, что может быть всё что угодно... --Movses 10:00, 7 марта 2013 (UTC)[ответить]
- Например, эта статья будет «исправлена», и никакими выражениями этого не изменить, если не использовать nowiki — статья намеренно так написана. А вообще, пользователь AWB должен следить за правками и проверять, не испортилось ли что-нибудь после редактирования. Тут уже ответственность как и автора статьи, так и редактора.
- Я к чему это всё… с цитатами — проблема отдельная, а остальное уже надо решать регулярными выражениями. --newMitЁk 10:28, 7 марта 2013 (UTC)[ответить]
- Ну, учитывать в автозамене цитаты с авторским написанием слов невозможно - именно поэтому у AWB, который эту автозамену использует, стоит пометка - проверяйте изменения перед сохранением. Теоретически, в английской справке написано что цитаты вообще не обрабатываются автозаменой, но не указано как именно он определяет где цитата а где нет. По поводу непосредственно регэкспа: "Лутш" и "Лушчыцкi" отсекаются, если указать в конце регэкспа (и|е), тем самым ограничив его применение словами типа лушче, лушчий, лушчие и так далее. Основная проблема - исправлять написание "лучче", но при этом не исправлять "Луччи" - и я не совсем представляю как это написать компактно, без расползания на два регэкспа, для "лучше" и для "лучший"/"лучшие" и так далее. --Mitas57 10:58, 7 марта 2013 (UTC)[ответить]
- Предлагаю такое:
<Typo word="лучший" find="\b(Л|л)у(тш|чщ|шч|чьш|дш|шш|шщ|щщ|щч)(и\B|е\b)" replace="$1учш$3" /> . Конструкция в конце обрабатывает либо "и" не на конце слова, либо "е" на конце - так что Луччи пропускается. --Mitas57 11:18, 7 марта 2013 (UTC)[ответить]
-
- Гм, нет. Значит, нужно ограничение что "и" не может быть в конце слова, а вот "е" - может быть и в конце и не в конце.
(и\B|е) . Еще хорошо бы учесть, что есть слова типа "улучшение", "улучшить" и подобные. Получится <Typo word="лучший" find="\b(У|у)?(Л|л)у(тш|чщ|шч|чьш|дш|шш|шщ|щщ|щч)(и\B|е)" replace="$1;2учш$3" />
- Вот это поймать ещё не желаете :-) ? --Movses 12:17, 7 марта 2013 (UTC)[ответить]
- Мда, это уже жестче. Я бы не взялся и это поймать и невинных выражений не наловить. И вообще, регэкспы же не всесильный инструмент :) --Mitas57 18:28, 7 марта 2013 (UTC)[ответить]
- добавил "лудший" Shabe (обс.) 13:27, 29 июня 2025 (UTC)[ответить]
Вавилон 5 «Вавилон-5»
Я являюсь автором/слежу за многими статьями по вселенной «Вавилона-5». Проблема в том, что многие правки изобилуют неграмотными фразами и т.д. Все это решаемо. Однако, прописать подобное исправление мог бы и бот. Одна закавыка - нет ли пересечений со статьями по известной древней цивилизацией?
Прошу переписать в текстах статей все совпадения подобного рода, особенно тех статей, которые прописаны в категории Вавилон-5. — Эта реплика добавлена участником Zac Allan (о • в) 20:03, 30 июня 2009 (UTC)[ответить]
- По-прежнему нет желающих? Жаль. А то ляпы в тексте лежут глаз. Можно было бы в какой-нибудь «литературно-исправляющий» бот добавить функцию... - Allow 21:16, 1 июля 2009 (UTC)[ответить]
- Если знаете регулярные выражения, то можете добавить правило к списку: Википедия:AutoWikiBrowser/Typos --Ashik talk 04:17, 2 июля 2009 (UTC)[ответить]
- А на примере моего случая должно быть так?
<Typo word="«Вавилон-5»" find="Вавилон 5" replace="«Вавилон-5»" /> ? Или как правильнее, научите плиз. - Zac Allan Слова / Дела 12:00, 6 июля 2009 (UTC)[ответить]
- Так мы получим замену в "Вавилон 567 до н.э." --> "Вавилон-567 до н.э." — Дмитрий Никитин 12:30, 6 июля 2009 (UTC)[ответить]
- включения статьи исправлены. если ещё попадаться будет, вот код:
\bВавилон([ауе]|ом)?\s5 Вавилон$1-5 Shabe (обс.) 00:01, 30 июня 2025 (UTC)[ответить]
Маленькая орфографическая правка
«Рейх» --> «рейх» (-а, -у, -ом, и т. д.) — Zac Allan Слова / Дела 18:15, 12 июля 2009 (UTC)[ответить]
- Только осторожно! Есть такая фамилия, а она, естественно, пишется с прописной буквой. — Obersachse 18:21, 12 июля 2009 (UTC)[ответить]
- Это через Typo у AWB лучше делать rubin16 18:28, 12 июля 2009 (UTC)[ответить]
- Я не знаю. как с ним работать. Можешь сделать сам? - Zac Allan Слова / Дела 22:16, 12 июля 2009 (UTC)[ответить]
[[//site.com ... km2 ...]]
Заменяет «km2» внутри ref, нужно отключить. ~~~~ Jaguar K · 17:41, 8 декабря 2023 (UTC)[ответить]
Жы, шы, жэ, шэ, чя, щя
Протестировал, но слишком много исключений: китайских заимствований (Шэньчжэнь), беларусских цитат (жыццё), армянских фамилий (Мкртчян). Пока не добавляю. Shabe (обс.) 13:37, 24 июня 2025 (UTC)[ответить]
Мягкий ЧЬ
Встретил ошибку "передачь". Понятно, что произносим мягко, а пишем без мягкого знака. Конкретно эта ошибка встречается не часто (всего 2 раза), потому не добавлял в список автозамен. Но есть чуйка, что если поискать по дампу, то найдётся таких ошибок не одна и тогда можно будет добавить в список автозамен. — Movses (обс.) 22:37, 28 декабря 2019 (UTC)[ответить]
- Непонятно как различать с такими словами как "ночь", "прочь", "речь". Дима74 (обс.) 14:02, 29 декабря 2019 (UTC)[ответить]
брошурі брошюрі
Ошибочно исправляет украинское брошура (в польській брошурі исправляет на в польській брошюрі). Radmir Far (обс.) 07:09, 4 сентября 2021 (UTC)[ответить]
Замены с учётом иных языков
Есть некоторые проблемы с заменами из этой группы:
- они не попадают в викификатор
- (вроде бы) если два слова находятся на расстоянии меньше 200 символов, то будет обработано только одно из них
Предлагаю изменить эти замены с использованием lookahead и lookbehind. Например, замену "учасник участник":
<Typo word="участник" find="([^іїєґІЇЄҐuk]{100,100}\b)([Уу])часник([^іїєґІЇЄҐ]{100,100})" replace="$1$2частник$3" />
изменить вот так:
<Typo word="участник" find="\b(?<=(?:[^іїєґІЇЄҐuk]|^){100})([Уу])часник(?=(?:[^іїєґІЇЄҐuk]|$){100})" replace="$1частник" />
Это позволит решить вторую проблему (если она есть, конечно) и когда-нибудь в будущем первую. Дима74 (обс.) 18:30, 2 апреля 2019 (UTC)[ответить]
Партнер, шахтер порождает длинное описание в описании правки
Понятно, что это проверка для гарантирования ложных срабатываний в украинских текстах, однако может стоит добавить квалификатор ?>= для того, чтобы сократить описание. И будет проще понимать, какая замена производится. A.sav (обс.) 16:33, 22 октября 2024 (UTC)[ответить]
Комунерос
Не могу составить правило для исключения слова комунерос. Сделал было так (К|к)ом+ун+(?!ерос), но оно не работает. Тут бы пригодился свержадный квантификатор (К|к)ом++ун++(?!ерос), но они не поддерживаются. Есть идеи? Игорь Темиров 13:12, 21 июля 2015 (UTC)[ответить]
Путаница ш/щ
Сообщать о таких ошибках или не надо? Что общего правила нет, понимаю, потому и спрашиваю. Если надо, вот первый случай: (Н|н)астояш(его|ий|ие|...) $1астоящ$2 37.147.205.162 16:46, 2 апреля 2013 (UTC)[ответить]
- Я вот не сторонник добавления редко встречающихся замен опечаток. Их проще один раз их поправить, чем захламлять список. А вот какие-то общие правила вполне можно. Например, для «ш» «щ» можно добавить замену «-ншик» «нщик» (там только «пуншик» исключение). Ну и вообще подумать, какие ещё есть паттерны. — putnik 17:56, 2 апреля 2013 (UTC)[ответить]
- А я вот — сторонник. Сообщайте ещё ! --Movses 20:47, 2 апреля 2013 (UTC)[ответить]
- Вы считаете, что не все ошибки следует заносить в данный список автозамен ? Я что-то не увидел никаких дисклеймеров на странице Википедия:AutoWikiBrowser/Typos. Хотите внести такой дисклеймер ? Может желаете его сформулировать поточнее ? --Movses 15:36, 3 апреля 2013 (UTC)[ответить]
- мне кажется, действительно не стоит слишком редкое вписывать: зачем программу лишний раз нагружать? ошибок есть бесконечное количество, стоит учитывать лишь самые-самые. я бы сформулировал так: "Пополняйте список лишь часто встречающимися ошибками." что скажете? @Movses, @Putnik, @Lvova, @A.sav Shabe (обс.) 15:28, 24 июня 2025 (UTC)[ответить]
Акт второй марлезонского балета (это про "хреначить"): (Б|б)лиз?жай[шщ](ий|ая|ое|…) $1лижайш$2 37.147.207.122 15:11, 11 мая 2013 (UTC)[ответить]
- Добавил и исправил. Поиск вёл по "ближайщ*" и "близжа*". Спасибо. Кстати, вы могли бы зарегистрироваться ... --Movses 11:33, 12 мая 2013 (UTC)[ответить]
Викификация слов с ударением
Текст с ударением в преамбуле: Викификатор превращает «Коэффициент рассеяния» в «Коэффициент расеяния». Kalendar (обс) 07:09, 12 сентября 2016 (UTC)[ответить]
Формы слова
Хотелось бы узнать мнение, в каком виде лучше давать формы слова?
Можно явно указывать все суффиксы и окончания для максимальной точности, сооружая примерно такие выражения:
\b(А|а)банент(а(?:ми?|х)?|у|о[вм]|е|ы)?\b — причём только для существительных.
Если добавить поиск и прилагательных во всех формах (абонентный, абонентский) то получается вообще ужасно.
Или же можно писать просто \b(А|а)банент(\w*?)\b , но тогда будут находиться и «исправляться» в том числе и явно ошибочные варианты типа «абанентовпредупреждают». Причём это будет внесено в описание правки.
Я обратил внимание, что в английском и французском списках всегда явно указывают все словоформы и не используют подобные подстановки. Solon 15:26, 1 декабря 2006 (UTC)[ответить]
- Англичанам и французам проще - у них морфология поскромнее. Можно вместо * (zero or more times) использовать например {0,5} (0 to 5 times). BTW, *? не имеет смысла, т.к. ? = 0 or 1 time. Если я конечно ничего не путаю ;-) --Volkov (?!) 15:44, 1 декабря 2006 (UTC)[ответить]
- На самом деле, имеет. "*" и "+" - так называемые "жадные" (greedy), то есть повторение происходит наибольшее возможное число раз. Например из строки "профффесор кислых щей" по шаблону: \b(П|п)ро(ф+)е(с+)ор(.*)\b будет найдено целиком "профффесор кислых щей", а не просто "профффесор", так как под "(.*)\b" будет расценена последовательность: " кислых щей". Если вместо ".*" написать ".*?", то "*" станет "ленивым" (lazy), и повторение будет произведено минимальное количество раз, то есть до первого "\b", и результат будет "профффесор". А вообще есть рекомендация "use the dot sparingly", и вместо точки лучше использовать что-то более конкретное. Но это не совсем по теме. :) Solon 16:56, 1 декабря 2006 (UTC)[ответить]
- Про обрубание окончаний ниже. Нужно проверять все правила отдельно. Где-то есть смысл \b оставлять, где-то — нет)Недавно проводил тест, в котором длинное слово с границами быстрее распознавалось, чем то же слово без \b (слово disadvantageously).А потом аналогично попробовал короткое "dis" — и результаты обратные: без границ быстрее. Оно и логично: если мне подходят все "дис" (и внутри слова, и в начале, и в конце), то быстрее производится поиск, никаких ограничений. А если мне нужны только самостоятельные "dis", то время уходит на отсев лишнего (слово dis не существует, это просто пример) (обс.) 20:54, 16 августа 2025 (UTC)[ответить]
Орфография
Хочу попросить отправить бота исправить «агенств_» на «агентств_», «приемлим_» на «приемлем_», «военоначальник», «военноначальник» на военачальник, коммандир на командир, комманд_ на команд_, коментари_ на комментари_. Ещё нужно исправить ошибки по этому списку, иначе для чего он существует в Википедии?! Кроме кеш/кэш, там сейчас война. Большое спасибо! Четыре тильды 08:55, 11 июня 2009 (UTC)[ответить]
- Лучше внести в RegexTypoFix, потом попутно править rubin16 10:59, 11 июня 2009 (UTC)[ответить]
- Внесите, пожалуйста, я в этом совсем ничего не понимаю. Четыре тильды 12:23, 11 июня 2009 (UTC)[ответить]
- если нет возражений, то добавлю в общий список — Дмитрий Никитин 14:08, 11 июня 2009 (UTC)[ответить]
- Ещё добавьте "[Сс]эмпл*" "[Сс]емпл*". -- AVBtalk 17:42, 11 июня 2009 (UTC)[ответить]
- удалено. есть "сэмпл": сэмпл, [8] Shabe (обс.) 22:17, 26 июня 2025 (UTC)[ответить]
- не вызовет ли это споры, так же как кэш\кеш и бренд\брэнд — Дмитрий Никитин 19:02, 11 июня 2009 (UTC)[ответить]
- Всё, что может вызвать споры, обязательно их вызовет. К примеру, на странице обсуждения Ё (кириллица) вы можете найти сентенции, что нужно вернуться к "стандартному языку" без написания "ё". А в данном случае Четыре тильды приводит авторитетный источник: Русский орфографический словарь: около 180 000 слов / Российская академия наук. Институт русского языка им. В. В. Виноградова / О. Е. Иванова, В. В. Лопатин (отв. ред.), И. В. Нечаева, Л. К. Чельцова. — М., 2005. — 960 с. — ISBN 5-88744-052-X. -- AVBtalk 19:47, 11 июня 2009 (UTC)[ответить]
Ещё предложение, исправлять написание единиц измерений (далее регэксп-псевдокод):
- ([0-9]+)\s*Герц \1 герц
- ([0-9]+)\s*гц \1 Гц
- ([0-9]+)\s*[кК]гц \1 кГц
- ([0-9]+)\s*[мМ]гц \1 МГц
Здесь имеется ввиду, что "герц" после числа должен идти с пробелом и со строчной буквы, сокращение пишется с прописной ("Гц"), "кило" со строчной ("кГц"), а "мега" - с прописной ("МГц"). Причём в исходном контексте суффикс может идти без пробелов после числа, с одним или несколькими пробелами (\s*), а пробелы могут быть простыми или неразрывными (а если будет обрабатываться тег , будет тоже хорошо). Соответственно, при замене после числа должен добавляться неразрывный пробел (дай бог памяти, это \uA000). Ещё было бы здорово, если бы игнорировались ссылки в суффиксах (пример). -- AVBtalk 20:27, 13 июня 2009 (UTC)[ответить]
- Добавлено
- неразрывный пробел нужно указывать просто символом:
(виден в коде 2010)
Ёфикация
Просьба добавить замену таких слов: шахтер шахтёр, молодежный молодёжный, партнер партнёр, провел провёл, прошел прошёл, пришел пришёл, перешел перешёл. Спасибо. — Mitte27 (обс.) 22:19, 31 января 2018 (UTC)[ответить]
(Добавлено в список техзадач на будущее)- Предлагаю добавить следующие замены:
<Typo word="шахтёр" find="\b(Ш|ш)ахтер" replace="$1ахтёр" />
<Typo word="молодёжный" find="\b(М|м)олодежн" replace="$1олодёжн" />
<Typo word="партнёр" find="([^іїєґІЇЄҐJjЈј]{100,100})\b(П|п)артнер([^іїєґІЇЄҐJjЈј]{100,100})" replace="$1$2артнёр$3" /><!-- Исключение: украинские слова партнер, партнерка, партнерський -->
Дима74 (обс.) 00:43, 2 апреля 2019 (UTC)[ответить]
Теплый тёплый, ночевка ночёвка, береза берёза, днем днём. — Оркрист 01:05, 25 июня 2019 (UTC)[ответить]
"Начнется" и "самопровозглашенный"
Прошу сделать так, чтобы при викификации текста слово «начнется» заменялось на «начнётся», а «(само)провозглашенный» (-ая и прочие окончания) — на «(само)провозглашённый». Кадош 20:57, 22 марта 2015 (UTC)[ответить]
Ограничения на начало слова
Я не понимаю, почему все маски неправильного написания начинаются с ограничителя \b, говорящего о том, что слово должно начинаться на этом месте. Вполне можно себе представить сложносоставные слова, отличающиеся от приведённых какой-либо приставкой или вторым корнем, такие при текущей схеме будут пропущены. Соответственно, предлагаю из начала масок \b поубирать. MaxBioHazard 04:15, 20 января 2012 (UTC)[ответить]
- Занялся этим.Всё тестировать надо, т. к. будут индивидуальные исключения для каждого правила, это первый минус. Порой исключений больше, чем всех правильных окончаний — тогда нет смысла обрубать ограничители (\b). Поэтому Не сделано: черн+ (чёрный, но чернь, чернеть, чернеющий, Чернигов и т. д.), зелен+, желт+. Сделано: +гражденн+; молодеж+; четырех+, +ключен+, маневр+, намек+ и др.Но нарастающий вопрос ещё и в оптимизации. Как будет работать программа быстрее: с ограниченным поиском (с ограничителями
\b([Вв])ада\b ) или с неограниченным (без указания окончаний: ([Вв])ада )? Насколько велика разница в скорости будет? Доля секунды? +5 секунд на статью? Shabe (обс.) 14:21, 24 июня 2025 (UTC)[ответить]
Орфография 2- Теоретически может быть и «по окончанию», например, «по окончанию слова можно определить падеж», возможно, что-то подобное может встретиться в статьях по лингвистике. --Дарёна 17:21, 14 июня 2009 (UTC)[ответить]
- Мне кажется, этот сравнительно небольшой урон статьям по лингвистике быстро ликвидируют наблюдающие за ними лингвисты. Четыре тильды 17:44, 14 июня 2009 (UTC)[ответить]
- Согласна. Если это будет сделано разово, то нет проблем. --Дарёна 18:37, 14 июня 2009 (UTC)[ответить]
- Спасибо за поддержку. :) Четыре тильды 18:39, 14 июня 2009 (UTC)[ответить]
- Нужно исправить _в следствие чего_ на _вследствие чего_. Основание: вследствие - предлог, пишется слитно. Спасибо! Четыре тильды 10:13, 14 июня 2009 (UTC)[ответить]
- Сделано Нужно исправить _исскуств_ на _искусств_. Спасибо! Четыре тильды 13:20, 14 июня 2009 (UTC)[ответить]
- Можно ещё добавить замену _французк_ на _французск_. //Николай Грановский 13:38, 14 июня 2009 (UTC)[ответить]
- Пожалуйста, ещё _располога_ на _располага_ и
- Сделано _територи_ на _территори_. Спасибо! Четыре тильды 13:53, 14 июня 2009 (UTC)[ответить]
- _благодоря_ на _благодаря_. Спасибо! Четыре тильды 13:54, 14 июня 2009 (UTC)[ответить]
- Сделано Ещё _продюссер_ на _продюсер_. //Николай Грановский 13:56, 14 июня 2009 (UTC)[ответить]
- Сделано _режисёр_ на _режиссёр_, а _режиссер_ на _режиссёр_. Спасибо! Четыре тильды 14:00, 14 июня 2009 (UTC)[ответить]
- _в течении года_ на _в течение года_
- _следущ_ на _следующ_ Спасибо! Четыре тильды 17:39, 14 июня 2009 (UTC)[ответить]
_процес_ на _процесс_ Спасибо! Четыре тильды 18:00, 14 июня 2009 (UTC)[ответить]
-
- \b(П|п)роцес(?!с)(\w*)\b \1роцесс\2 ?? — Дмитрий Никитин 14:52, 16 июня 2009 (UTC)[ответить]
- _комиси_ на _комисси_ Спасибо! Четыре тильды 21:43, 14 июня 2009 (UTC)[ответить]
- _окресност_ на _окрестност_
- _по истечению_ на _по истечении_ Спасибо! Четыре тильды 10:20, 15 июня 2009 (UTC)[ответить]
- _тысячилети_ на _тысячелети_ Четыре тильды 10:44, 15 июня 2009 (UTC)[ответить]
- _экспортер_ на _экспортёр_ Четыре тильды 08:57, 16 июня 2009 (UTC)[ответить]
- _вследствии_ на _вследствие_ Четыре тильды 09:19, 16 июня 2009 (UTC)[ответить]
- _вцелом_ на _в целом_ Четыре тильды 09:21, 16 июня 2009 (UTC)[ответить]
- Сделано _впоследствие_ на _впоследствии_ Четыре тильды 09:22, 16 июня 2009 (UTC)[ответить]
- _приемуществен_ на _преимуществен_ Четыре тильды 10:08, 16 июня 2009 (UTC)[ответить]
- _растояни_ на _расстояни_ Четыре тильды 14:15, 16 июня 2009 (UTC)[ответить]
- _серебрянн_ на _серебрян_ Четыре тильды 14:28, 16 июня 2009 (UTC)[ответить]
- _государствено_ на _государственно_, _государствены_ на _государственны_, _государствена_ на _государственна_ Четыре тильды 15:16, 16 июня 2009 (UTC)[ответить]
- _разведовательн_ на _разведывательн_ Четыре тильды 15:45, 16 июня 2009 (UTC)[ответить]
- _предшественик_ на _предшественник_ Четыре тильды 15:59, 16 июня 2009 (UTC)[ответить]
- _сделаных_ на _сделанных_ Четыре тильды 16:04, 16 июня 2009 (UTC)[ответить]
- _ученый_ на _учёный_
- _заведущ_ на _заведующи_ Четыре тильды 18:13, 16 июня 2009 (UTC)[ответить]
- _промо-акци_ на _промоакци_ Четыре тильды 18:35, 16 июня 2009 (UTC)[ответить]
- _распостран_ на _распростран_ Четыре тильды 18:44, 16 июня 2009 (UTC)[ответить]
- _определенн_ на _определённ_ Четыре тильды 08:41, 17 июня 2009 (UTC)[ответить]
- _финнск_ на _финск_ Четыре тильды 09:41, 17 июня 2009 (UTC)[ответить]
- _иследова_ на _исследова_
- _обьект_ на _объект_
- _обьеди_ на _объеди_
- _аглийск_ на _английск_
- _священик_ на _священник_
- _мученник_ на _мученик_
- _сельк_ на _сельск_ Четыре тильды 10:37, 17 июня 2009 (UTC)[ответить]
- _предидущ_ на _предыдущ_
- _пробыва_ на _пробова_--Bandar Lego 20:19, 23 сентября 2009 (UTC)[ответить]
\b(В|в)ертолет $1ертолёт иBell AH-1 Super Cobra
Правило из WP:AutoWikiBrowser/Typos#В почему-то не работает в статье Bell AH-1 Super Cobra, хотя если его перенести в личные, производится 45 таких замен. В статье Афон замена производится. Что-то не так с regex, самой статьёй или оформлять Bug Report на фабрикаторе? A.sav (обс.) 18:30, 21 октября 2024 (UTC)[ответить]
- У меня всё сработало. Странно. Посмотрите в консоль на той версии статьи, на которой у вас не работало. stjn 21:01, 21 октября 2024 (UTC)[ответить]
- Судя по характеру изменений и отсутствию метки AWB в описании изменения Вы использовали Викификатор, а не AWB? — Эта реплика добавлена участником A.sav (о • в)
- А, да. Лучше указывать точнее, с чем у вас проблемы, потому что этот список используется и в викификаторе. stjn 10:39, 22 октября 2024 (UTC)[ответить]
- Оказалось документированным поведением — если исправляемый вариант попадается во внутренней ссылке, правило отключается для всего файла. И это порождает следующий класс проблем. Сейчас многие правила написаны таким образом, что включают в себя вариант правильного написания слова, это сильно их упрощает, а замена правильного написания на правильное вроде как не было проблемой. Однако из-за этой особенности поведения AWB многие ошибки не исправляются. Вчера проверил на примере "реген
тство" (пропущена первая буква "т") — AWB действительно пропускает, приходится исправлять руками. Насколько я знаю регулярные выражения, нельзя задать исключение для правильного варианта? A.sav (обс.) 14:43, 24 ноября 2024 (UTC)[ответить]
Автозамены
См. обсуждение Участник:Mariluna/автозамены в AutoWikiBrowser --Mariluna 06:54, 17 марта 2008 (UTC)[ответить]
Устаревшие параметры
Предлагаю добавить в автоисправление удаление устаревших параметров шаблона {{НП}} (размер карты (страны/региона/района) и ЯндексКарта). Гонять ради них бота жалко, а вот если добавить сюда, то небольшими темпами оно частично будет вычищено вместе с сопутствующими правками. -- dima_st_bk 07:56, 2 мая 2016 (UTC)[ответить]
- Поддерживаю. --Insider 51 06:32, 12 сентября 2016 (UTC)[ответить]
|
|