Меню
Главная
Случайная статья
Настройки
|
Вопросы к авторам итога по постановке задачи и методологии
Накопились вопросы, надеюсь, что тут (в отличие от общего форума) можно будет спокойно получить ответы от авторов итога. В решении по именования статьи АК первым же пунктом процитировал ВП:ИС: "вопрос сводится выбору названия «наиболее узнаваемого для большинства носителей русского языка» из числа относящихся к энциклопедическому и научному стилю речи". Для разрешения вопроса предложил обратиться к авторитетным источникам, констатировал, что на момент принятия решения в его распоряжении нет авторитетных источников, отвечающих на поставленный вопрос. Следовательно, первый вопрос к рабочей группе. А не появились ли таковые источники? Исследовался ли вообще этот вопрос рабочей группой? Отправлялся ли запрос (там что-то осталось, например, от "Викимедиа РУ" для составления запроса?) в ИРЯ РАН, упомянутый АК, как безусловно авторитетный в вопросе? Прямо такой задачи рабочей группе АК не ставил, но, учитывая сколько времени прошло с момента первой эскалации проблемы, было бы разумно этот вопрос исследовать, возможно появились соответствующие АИ со всеми ответами. Выяснение распределения языковой нормы среди носителей русского языка АК возложил на рабочую группу, причем не дав каких-либо исчерпывающих рекомендации по применяемой методологии со ссылками на соответствующие АИ. В итогах рабочих групп я также не вижу каких-либо ссылок на АИ, как либо обосновывающих выбор методологии. Обе рабочие группы просто переходят к подсчету частоты использования обоих топонимов в различных массивах текстов, без обоснования того, что полученные значения с достаточной степенью точности соответствуют распределению предпочтений среди носителей русского языка. При этом первые же постулаты последней рабочей группы во введении вызывают сомнения. В частности утверждение, что "статистика поисковых запросов может показывать узнаваемость того или иного варианта, но не в контексте авторитетных источников". Что именно понимается под "контекстом авторитетных источников"? Не ясно также, почему прямой подсчет запросов варианта топонима у поисковой машины даст худшую экстраполяцию на все множество носителей языка, нежели подсчет частоты употребления того же топонима в массивах текстов. Рабочая группа во введении упоминает нормирование, но тут же отказывается от него со ссылками на трудозатратность, необоснованность и сложность математических формул. При этом какого-либо подтверждения (например, на малой выборке с приемлемыми трудозатратами), что пренебрежение не повлияло на окончательный результат, не приводит. Упоминание "обоснованности" в отсутствии какого-либо обоснования (по АИ) для всего исследования и "сложности математических формул", когда речь идет по существу о простейшей операции деления, при использовании "черного ящика" - алгоритма сторонней поисковой машины (который, как было только что обнаружено, еще и некорректно работает), также вызывает недоумение. Вызывает вопросы и отсутствие исследования предпочтений по регионам (при том, что авторы выполнили какой-то анализ по различным подмножествам источников, например, для российских государственных СМИ), т.к. похоже (а если нет, то это нужно исследовать), что у авторов из РБ тотально доминирует один из вариантов топонима, а также то, что статьи авторов из РБ о РБ (т.е. с употреблением исследуемого топонима) встречаются значительно чаще. В сочетании с отсутствием нормирования это может заметно исказить результаты в исходной постановке задачи (о поиске наиболее узнаваемого для большинства носителей русского языка варианта). Также хотелось бы видеть и оценку по двум введенным в (судя по всему официальном) ответе РАН "функциональным категориям": "официальное название государства" и "неофициальное наименование... в бытовой сфере общения", т.к. на момент ответа (более 10 лет назад) РАН прямо утверждает, что в последней категории один из вариантов топонима преобладает. SfeoAC (обс.) 22:29, 10 января 2025 (UTC)[ответить]
- @SfeoAC, рабочая группа действовала в рамках полномочий, переданных ей АК, и пользовалась инструментом, принятым в Википедии для оценки распространённости того или иного названия — прямым подсчётом словоупотреблений в различных массах авторитетных источников. Этот подход применялся в решении предыдущей рабочей группы, в итогах по Туркменистану и Кыргызстану, и, таким образом, является консенсусным.В то же время ведущие журналы по корпусной лингвистике публикуют статьи, использующие те же методы, что и наша работа, поэтому мы считаем это обоснованным. Пример: статья, опубликованная в International Journal of Corpus Linguistics.Нормирование с помощью весов требует введения коэффициентов (например, для тиража издания, цитируемости публикаций). Подобные коэффициенты ранее не использовались в Википедии, их подбор и обоснование будет являться оригинальным исследованием. Предложение о нормировании по региону публикации в обсуждении Кыргызстана было пресечено администратором. Рабочая группа не считает уместным введение неконсенсусных методик. — Le Loy 23:03, 11 января 2025 (UTC)[ответить]
- Вы не отвечаете на заданные вопросы. Еще раз, каким образом распространенность в источниках стала эквивалентна наибольшей узнаваемости для большинства носителей русского языка (из постановки задачи АК)? Вы это можете пояснить? Я правильно понимаю, что единственное имеющееся у вас обоснование - это применение такого подхода предыдущей рабочей группой, а также действия администратора при подведении итога (подмена консенсуса своим решением, не основанном на аргументах, логике и АИ), которые указанием для АК (как и для назначенной им рабочей группе) совершенно точно не являются?
Что до консенсуса, так см. ВП:КММ ("Если же какой-либо участник (или небольшая группа участников) считает, что у него есть достаточные основания полагать, что ранее достигнутый консенсус более не соответствует действительности, он вправе поднять этот вопрос на соответствующей странице обсуждения статьи или на соответствующем форуме, пригласив заинтересованных участников высказаться по этому поводу" и т.д.), а также базовое определение о здравом смысле при поиске "консенсуса", который в данном случае заключается в том, что у статистического метода должно быть или вполне очевидное (в случае элементарной проблемы) или научное (по АИ) обоснование. А если методика первой рабочей группы каким-то не вполне понятным образом стала безусловно "авторитетной", то не ясно, почему последняя группа позабыла про предложенный первой порог - "на порядок", видимо призванный нивелировать чудовищную погрешность измерения? Предложенная ссылка содержит документ, озаглавленный как "Keywords through time. Tracking changes in press discourses of Islam" и описывающий "new approach to the identification of discourses". Вы точно хотели сослаться именно на это? Какое отношение отслеживание изменения дискурса в прессе по ключевым словам имеет к определению названия, узнаваемого большинством носителей языка? @NN21, вы утверждали, что знакомы с мат.статистикой. От вас можно получить пояснения, хоть как-то связанные с этой предметной областью? Или вы на самом деле не принимали участия? SfeoAC (обс.) 01:02, 12 января 2025 (UTC)[ответить]
- ВП:ИС определяет узнаваемость так: «по этому названию читатель, поверхностно знакомый с предметной областью, не обязательно специалист в ней, сможет определить предмет статьи». Если трактовать определение буквально, то следует сказать, что оба названия обладают свойством узнаваемости, об этом заявил ещё Арбитражный комитет (АК:683 п. 4.1.: обе нормы «Белоруссия»/«Беларусь» узнаваемы для подавляющего числа носителей русского языка). Тем не менее, в спорных случаях в Википедии часто прибегают к «сравнению узнаваемости», где под узнаваемостью понимают скорее привычность формы для читателей. Но здесь возникают многочисленные проблемы. Так, например, узнаваемость не может вступать в противоречие с правилами ВП:АИ, ВП:НТЗ — об этом писал ещё u:Chronicler в итоге по Беларуси, п. 2.1.: как уже не раз обращалось внимание, это правило <ВП:ИС — прим.> не может использоваться таким образом, когда формальная ссылка на него вела бы к обходу ВП:АИ и ВП:НТЗ. И на практике простая статистика поисковых запросов не является достаточной для вынесения решения о переименовании. Итог участника Chronicler имеет статус предварительного, однако конкретно это положение Арбитражный комитет подтвердил (АК:683 п 3.1.1: Ни одно из положений 2.1-2.5. <итога участника Chronicler — прим.> итога не противоречит общим принципам, изложенным в разделе 1 настоящего решения, арбитры согласны со всеми утверждениями). Утрированный пример: представим, что для подавляющего большинства носителей русского языка наиболее привычным стало название «Бульбастан». Они его используют в соцсетях, блогах и на поздравительных открытках. Проведённое ИРЯ РАН лексикографическое исследование показало, что действительно русскоговорящие чаще всего сталкиваются с названием «Бульбастан». Тем не менее, статья, очевидно, не будет переименована в «Бульбастан», будет выбрано одно из названий «Белоруссия»/«Беларусь», причём в том числе из соображений узнаваемости, хотя ни одно из них не является наиболее узнаваемым. Этот пример призван показать, что википедийная узнаваемость не берётся as is, а выводится из массива авторитетных источников. Другой аспект, снова-таки цитирую подтверёжднное АК положение итога Chronicler, п. 2.2: из статистики по определённым регионам нельзя делать автоматический вывод: ведь число жителей данного региона не равно числу потенциальных читателей русской Википедии даже для самых распространённых названий. Мне кажется, вышеперечисленного достаточно, чтобы утверждать: понятие узнаваемости в Википедии — это не та величина, которую теоретически можно было бы замерить, опросив каждого носителя русского языка на предмет наиболее привычного для него названия. Это некоторая иная, неточно сформулированная характеристика, специфичная именно для Википедии. АК:1023 п. 2.3.1 говорит это прямо: в сообществе в настоящее время нет консенсуса о том, как в спорных случаях определять название, которое «является наиболее узнаваемым», и что понимать под узнаваемостью.
- В силу того, что узнаваемость не имеет в Википедии строгого определения и, более того, отсутствие определения констатировано АК, рабочая группа не видит возможности провести обоснование того или иного метода. Потому, действительно, мы опиралась на прецеденты. АК:1023 п. 2.3.2: на практике при выборе названия для статьи зачастую используются отсылки к частотному анализу на разных выборках (включая гугл-букс, гугл-школяр, яндекс-новости и т. д.). В соответствии с этой практикой подводились итоги под многими сложными обсуждениями (некоторые из них перечислил выше коллега @Le Loy). Более того, именно в соответствии с этой практикой Арбитражный комитет ставил задачу перед нашей рабочей группой: оценить текущее соотношение частоты употребления обоих топонимов в авторитетных источниках. — micier Dzikaski 12:09, 12 января 2025 (UTC)[ответить]
- Вы анализ проводили относительно какого-либо третьего названия? Нет. Оба исследуемых названия используются во вторичных, в т.ч. и академических АИ? Используются. Причем тогда тут гипотетическое третье название ("Бульбостан")? Множеству носителей языка нужно сделать выбор между двумя академическими названиями. В чем проблема? Провести опрос по предпочтению этих двух названий (или фиксировать де факто предпочтительное использование носителем). Не какого-либо еще третьего, а только этих двух.
Вы сами то видите, что ваши соображения привели вас к противоположному относительно прямой постановки задачи исходу. Вам ставят задачу: определите наиболее узнаваемый большинством носителей вариант (из двух академических), сопроводив это вторичными оговорками, относительно сложности задачи и пр. Вы, пожонглировав вторичными оговорками (с нарушением формальной логики в частности при введении третьего варианта названия), приходите к совершенно отличной постановке задаче, а именно, подсчету употребления в выборке из массива источников. При том, что очевидно, взятая вами выборка в статистическом смысле неравномерная, причем значительно, вы это осознаете? И вы даже не взяли на себя труда определить равномерность выборки. Ну вот, пожалуйста, первичная проверка: рассмотрим уже использовавшийся для верификации (формально проваленной в части повторяемости) вашего исследования массив источников cyberleninka.ru, фраза "экономика Беларуси". Выборочный подсчет (за пару лет и нескольких активных исследователях его не напрягаясь можно было сделать и полным) дает следующую картину по географии авторов 1:3 (определенной по расположению научного учреждения автора, в большинстве случаев указанного в публикации). Т.е. на 3 авторов из белорусского научного учреждения приходится только 1 из российского. А, соответственно, для фразы "экономика Белоруссии" соотношение уже, наоборот, 1 к 13 (точность оценки при таком соотношении на имеющейся выборка невысока). Все, если вы это без оснований игнорируете, в этот момент ваше исследование становится некорректным. Далее нужно безусловно проверять предпочтительность словоупотребления в зависимости от региона (я могу потратить время и сделать выборку и для этого) и, если оно тоже неравномерное, нормировать полученное соотношение численностью региона относительно количества авторов. И только если каким-то чудом, после нормирования, соотношение в пользу того или иного варианта не изменится, причем по нескольким более распространенным словоформам/словосочетаниям, то можно что-либо делать дальше. В противном случае - это просто липа. Можно было с тем же успехом подсунуть, например, относительную частоту запросов по двум вариантам в google и этим ограничится, а не имитировать 2-х летнее исследование. Причем все изложенное это даже не статистика, это арифметика. Хорошо, допустим, вы гуманитарий, а я плохо объясняю очевидные вещи. Тогда на простом примере. Предположим, что всего у вас всего два говорящих на исследуемом языке региона. В первом - 100 млн. жителей, во втором - 1 млн. Вы исследуете предпочтение одного из двух вполне академических вариантов названия по письменным источникам. При этом по каким-то причинам название это употребляется в 100 раза чаще в письменных источниках второго региона и при этом во втором регионе доминирует в соотношении 1:100 второй вариант названия, и наоборот, в первом регионе доминирует в тем же соотношением первый вариант. Будет ли обоснованно посчитать отношение количества статей с двумя вариантами для определения предпочтений всей популяции? Ничего не смущает? Или уж совсем просто: у вас всего 10 человек носителей языка и один из них написал статью, где предпочел один из вариантов. Это что-то говорит о предпочтении всей популяции? Ну и далее, в порядке мысленного эксперимента, еще вспомните, что в подавляющем большинстве случаев авторы статей - это люди с учеными степенями (их всего ~400 тыс. в РФ), а не эээ... "глубинный народ", это к вопросу о равномерности выборки. Первая рабочая группа хотя бы подстраховалась 10-кратным порогом "с запасом"... SfeoAC (обс.) 16:39, 12 января 2025 (UTC)[ответить]
- Задача "определить более узнаваемый вариант" в данном случае некорректно поставлена, содержит в себе ложную посылку о том, что узнаваемость вариантов хоть сколько-либо отлична. В отличие, например, от пар "Денали - Мак-Кинли" или "Свазиленд - Эсватини", узнаваемость обсуждаемых вариантов строго равна - не существует людей, знающих, что такое Белоруссия и не знающих, что такое Беларусь, и наоборот. Поэтому от так поставленной задачи надо отказаться и исследовать нечто иное, на поставленную же задачу можно ответить тремя словами безо всякого изучения источников: "Узнаваемость вариантов равна". 16:50, 12 января 2025 (UTC)[ответить]
- Безусловно. Но вроде бы вполне логично вместо узнаваемости говорить о предпочтении. В том смысле, что носитель языка устойчиво использует все же один из вариантов, если у него возникнет необходимости составить предназначенный к широкой публикации текст. Или нет? SfeoAC (обс.) 17:32, 12 января 2025 (UTC)[ответить]
- И если исходить из описанной иной выше логики, то есть, что знание слова "Белоруссия" с неизбежностью влечёт за собой понимание слова "Беларусь", то исследование географической неоднородности употребления теряет смысл - если люди понимают любой вариант, достаточно определить лишь, какой употребляется активнее. 16:52, 12 января 2025 (UTC)[ответить]
- Да я понимаю вашу логику. Если "второй" вариант используется преимущественно во "втором" регионе, даже несмотря на то, что в "первом" предпочтение обратное и там популяция больше, тем не менее, для выборки читателей, которые сознательно выбрали текст содержащий топоним, будет предпочтителен второй вариант, т.к. эта выборка неравномерна примерно в той же пропорции относительно предпочтений варианта, что и все источники. Осталось только, чтобы именно так сформулировал задачу и АК, но он то сделал нечто противоположное. При том, что его прямо спрашивали о том, не следует ли понимать под целевой выборкой все-таки читателей ВП и пр. Но увы, пока формулировка описывает всю популяцию.
А если использовать ваш подход, то что там было считать 2 года? Взять статистику запросов в поиске, вот вам и vox populi. А в рез-те данного исследования мы что получили? Подтверждение, что собственном регионе пишут о себе больше, чем соседи, и что при этом предпочитают собственный вариант топонима? А что, в этом кто-то сомневался разве? SfeoAC (обс.) 17:49, 12 января 2025 (UTC)[ответить]
- Пример с «Бульбастаном» был призван помочь показать, что ваша трактовка понятия «узнаваемость» не является консенсусной и может противоречить правилам Википедии. Я могу высказать и более предметное возражение. Вы предлагаете изучить географию авторов и сделать на этом основании выводы об узнаваемости топонима в разных регионах. Я не считаю этот подход корректным. Выбор того или иного топонима может быть обусловлен не личным выбором автора, а, скажем, редакторской политикой издания, где он публикуется. Так, например, не для всех участников Википедии, пишущих сейчас в статьях «Белоруссия», этот вариант наиболее узнаваем. С другой стороны, на примере Киберленинки, объективным фактом является то, что читатель, обратившийся к статьям на данном ресурсе, — а ему в равной степени доступны материалы, изданные в любой стране — значительно чаще будет встречать вариант «Беларусь», а не «Белоруссия». Я считаю, что больший смысл могло бы иметь нормирование по числу просмотров — то есть вклад каждой конкретной статьи в узнаваемость того или иного топонима среди читателей.
- Я не смею утверждать, что я однозначно прав, а вы однозначно ошибаетесь. Я лишь хочу напомнить, что правило ВП:КОНС существует не просто так. Вы предлагаете использовать подход, который противоречит многолетней практике подведения итогов в сложных обсуждениях переименования; который противоречит отдельным положениям некоторых решений АК; который прямо противоречит административному итогу участника @u:Biathlon; который, вероятно, противоречит ВП:ОРИСС; и по которому у меня лично, как у участника сообщества, есть возражения. Безусловно, ваш подход может стать принятой в Википедии практикой, но для этого нужно как минимум провести обсуждение на ВП:Ф-ПРА. Рабочая группа не считает возможным применять неконсенсусные методы исследования в рамках итога по частному вопросу. Рабочая группа стремилась применять те подходы, которые соответствуют текущим правилам Википедии и прецедентным практикам.
- Также хочу ещё раз обратить ваше внимание на то, как Арбитражный комитет сформулировал задачу, стоящую перед рабочей группой: оценить текущее соотношение частоты употребления обоих топонимов в авторитетных источниках, а также, возможно, существующие долгосрочные тенденции, определить, каков порог замены действующего правила ВП:БЕЛ на противоположное, на основе выводов по предыдущему вопросу определить, пройден ли уже требуемый порог. АК прямо проговаривает зависимость правила ВП:БЕЛ от соотношения частоты употребления топонимов в источниках. — micier Dzikaski 21:17, 12 января 2025 (UTC)[ответить]
- Ну еще раз, это не моя трактовка узнаваемости и не мой подход. Это всего лишь прочтение решения АК:683, ставившего задачу для исследования рабочей группе. Собственно, основные положения я уже цитировал коротко в первом сообщении обсуждения. И опираться последней рабочей группе нужно прежде всего на решение АК, трактующее правило (каким бы оно не было и как бы некорректно не было выполнено исследование предыдущей рабочей группы), которое имеет приоритет над трактовкой правил отдельными администраторами в при подведении отдельных итогов. В вашей трактовке правила, хоть и далекой от буквального прочтения, с предложением нормирования по числу просмотров есть определенный практический смысл ("дадим нашему читателю то, что он предпочитает видеть"), но она противоречит логике АК, как в общих положениях решения, так и в деталях, в частности п. 3.2.1.: "Сопоставляться должны не количества запросов, а количества потенциальных читателей, придерживающихся той или иной нормы.", что еще раз указывает на необходимость оценки предпочтения по всему множеству носителей языка.
Относительно консенсусности метода я уже напоминал вашему коллеге, что консенсус может меняться в рез-те обсуждения. Именно это обсуждение сейчас и происходит. Было продемонстрировано на первом попавшемся примере, что используемая вами выборка является неравномерной, что полностью ставит под сомнение методику и вашей и предыдущей рабочих групп. Попытка же в таком случае ссылаться на ранее используемую некорректную методику в качестве основания для ее повторного некорректного же применения, только потому, что первый раз ее некорректность не была замечена, является нонсенсом. В вашем случае необходимо уведомить назначивший вас АК о том, что в текущей постановке задачи при имеющихся исходных данных установить предпочтения для множества носителей языка не представляется возможным без поиска соответствующих АИ или собственных оригинальных исследований (а именно, применения нормирования в связи неравномерностью выборки), а также, что в применявшемся предыдущей рабочей группой подходе обнаружены методические ошибки, связанные с использованием неравномерной выборки. Формулировка задачи АК для вашей рабочей группы была дана исходя из допущения, что подход предыдущей рабочей группы был корректным. Так как сейчас выяснилось, что это не так, задача должна быть переформулирована. Кроме того, заявивший о компетентности в мат.статистике член рабочей группы, как мне стало известно, в написании решения участия не принимал и с выводами не согласен. В сочетании с приведенными выше возражениями это полностью дискредитирует результаты, изложенные в итоге. SfeoAC (обс.) 23:36, 12 января 2025 (UTC)[ответить]
- Я тоже член рабочей группы, заявивший о владении матстатистикой. Я понимаю то возражение, которое вас тревожит. Оно не ново, и озвучивалось ещё 15 лет назад. И, мне кажется, это принципиальный момент: несмотря на то, что подобное возражение озвучивалось, трактовка соотношения узнаваемости как соотношения частоты употребления в АИ стала консенсусной. Консенсус действительно может меняться в ходе обсуждения при появлении новых аргументов, но ваш аргумент в сущности не нов. Несмотря на его известные недостатки, сообщество принимает такой подход. На его основе принимаются решения и сформулировано АК:1257. Я вижу этому два объяснения. Во-первых, назначение правил Википедии — разрешать спорные ситуации, между участниками, и обсуждаемый подход — простое в реализации и доступное средство, позволившее завершить некоторые сложные обсуждения. В то же время проведение полноценных академических лексикографических исследований назначением Википедии не является (скорее, наоборот). Во-вторых, как я уже показывал, понятие «узнаваемость» в контексте правил Википедии не имеет строгого определения. Под более узнаваемым (более привычным) названием можно иметь в виду и то, которое читатель привык видеть в актуальных авторитетных источниках (не в устно-разговорной речи и не в частной переписке) — в такой трактовке подход имеет право на существование. Вы предлагаете отказаться от устоявшегося работающего инструмента разрешения спорных ситуаций, опираясь на возражения, которые уже были озвучены ранее, и в то же время, на мой взгляд, не предлагаете корректной альтернативы. Какую пользу это принесёт Википедии? — micier Dzikaski 11:42, 13 января 2025 (UTC)[ответить]
- Тот консенсус, очевидно, касался задач, для которых предполагалась относительная однородность выборки, по которой производится оценка характеристик для всего множества. Я не нашел в упоминавшихся выше решениях АК какого-либо указания игнорировать факт неоднородности, в случае если он будет обнаружен (возможно, я не знаком с каким-либо еще не упоминавшимся решением АК, и вы мне на него укажете?). Более того, ничего подобного в не отмененном и не пересмотренном решении АК:683, ставившего исходную задачу, не усматривается. АК (и в общем и в частностях, как уже было отмечено выше) указывает на необходимость оценки для всего множества носителей.
П.6. упомянутого ваим АК:1257 указывает, что рабочая группа набирается для "пересмотра и дальнейшего применения методологии анализа частотности словоупотребления". Учитывая изложенное выше, включая подтвержденный на примере факт существенной (1:3 на примере) неоднородности выборки в данных настоящего исследования, первоначальная методика должна быть рабочей группой пересмотрена. Грубая последовательность ожидаемых лично мной действий просматривается в первом сообщении темы: 1. Поиск новых АИ с искомой оценкой на настоящий момент. 2. Тщательно (действующим специалистом в мат.статистике) составленный для исключения ответов, предполагающих широкое толкование, запрос в ИРЯ РАН. 3. При отсутствии результатов по пп.1-2., определение по имеющихся данным, однородна ли выборка (включая проверку упомянутой вами гипотезы о редактуре вполне счетного числа издательств и пр.). 4. В случае неоднородности поиск в АИ, а при отсутствии - согласование обсуждением (специалистов в мат.статистике) простейшей методики для компенсации неоднородности выборки (в частности, если неоднородность связана только с численностью популяции двух регионов и доминированием АИ из одного региона в выборке, то задача выглядит тривиально). 5. Применение методики. Методика в текущем варианте тоже может быть применена, но только после отмены решения АК:683 и принятии нового решения относительно игнорирования предпочтении всего множества носителей языка при выборе именования статей. Инструмент разрешения спорных ситуаций не просто не пострадает, а, наоборот, примет корректный с математической точки зрения вид, исключив обвинения в подтасовках результатов (с далекими от энциклопедических мотивами). А в вырожденном случае - при отсутствии неоднородности выборки - методика вообще останется неизменной. SfeoAC (обс.) 15:48, 13 января 2025 (UTC)[ответить]
- Нет, вы не правы о консенсусе. Повторюсь, свежий пример — это обсуждение Кыргызстана, где один из участников приводил ровно те же самые соображении о необходимости соотнести полученные данные с распределением авторитетных источников по странам мира. Участник не получил поддержки. Есть административный итог, он не был оспорен, он действует, следовательно сейчас консенсус в этой точке. По предложенному вами плану действий:
- По пунктам 1 и 2 возражений нет, любой участник может проявить соответствующую инициативу. Обнаружение нового авторитетного лингвистического исследования или получение эксклюзивного ответа из ИРЯ РАН будет, полагаю, значимым новым аргументом, достаточным для того, чтобы пересмотреть название статьи.
- Начиная с пункта 3, вы опираетесь на недоказуемое (считаю, что ошибочное) положение, что вариант, который автор выбирает для научной статьи, — это наиболее узнаваемый для него вариант. «Проверка счетного числа издательств и пр.» — не думаю, что правила Википедии предполагают исследование редакторских политик каждого русскоязычного научного издательства.
- Допустим даже, мы каким-то разрешили проблему с узнаваемостью у автора. Вы пишете — определить, однородна ли выборка. Если рассматривать множество авторов научных статей как подмножество множества носителей русского языка, то нет, конечно выборка не однородна. Она почти на 100% состоит из людей с высшим образованием, занимающихся научной деятельностью, имеющих публикации. Это всё представители единственного социального класса, и каким образом вы планируете нормировать такие данные на всё русскоязычное населения, я не представляю.
- Допустим даже, что такая нормировка возможна. Очевидно, в таком случае, это не тривиальный подход, то есть действительно, как вы пишете, понадобится консультация со специалистами в матстатистике. Тут мы встречаемся с противоречием с АК:683 п. 1.5 (необходимо избегать нарушения ВП:ОРИСС, то есть механизм исследования должен быть достаточно очевидным, простым, надёжным, а его результат легко воспроизводимым любым участником и при этом достаточно убедительным и наглядным). Вы правы, АК не прописывает запрет на нормировку прямым текстом, но едва ли, с учётом вышесказанного, можно её провести очевидным, простым и надёжным методом.
- К сожалению, предложенная вами методика не является математически корректной, она опирается на неочевидные (вероятно, ошибочные) предпосылки и приводит к сложно разрешимым противоречиям, причём возможные подходы к устранению этих противоречий, даже если они существуют, лежат далеко за пределами ВП:ОРИСС. Поэтому мне не кажется, что рабочей группе следует пересматривать устоявшуюся консенсусную методику, которая позволяет получить значимые статистические факты: распространённость названий в АИ и, соответственно, наибольшая привычность названия в контексте АИ. — micier Dzikaski 12:42, 14 января 2025 (UTC)[ответить]
Хорошо, допустим, вы гуманитарий, а я плохо объясняю очевидные вещи Коллега, не забывайте о правилах ВП:ЭП и ВП:НО. Иначе мне придётся делать другие довольно очевидные вещи. — Le Loy 22:25, 12 января 2025 (UTC)[ответить]
Не совсем обычный вопрос участника рабочей группы
Коллеги, не подскажете ли, каким образом и в каком порядке один из участников рабочей группы (конкретно, я) может высказать свои альтернативные, так скажем, соображения относительно недавно опубликованного проекта и в целом той задачи, которая была перед группой поставлена? Этот проект я не готов подписать. С уважением, NN21 (обс.) 12:14, 14 января 2025 (UTC)[ответить]
- В любом порядке, который сочтёте нужным. Хоть здесь, хоть на основной странице этой СО (темой "Особое мнение"), хоть на СО иска, вводящего эту рабочую группу, хоть на общем форуме в теме о предитоге. 12:37, 14 января 2025 (UTC)[ответить]
|
|