Меню

Главная
Случайная статья
Настройки
Википедия:Недопустимые способы использования нейросетей
Материал из https://ru.wikipedia.org

С конца 2022 года получили распространение компьютерные сервисы наподобие ChatGPT, которые автоматически генерируют тексты по запросу пользователя. К сожалению, полученные таким образом тексты обычно содержат ложные утверждения, внешне похожие на достоверные и ошибочные ссылки на источники. Также созданные нейросетями тексты могут быть ненейтральными, содержать клевету на ныне живущих людей или нарушать авторские права. Поэтому весь текст, сгенерированный БЯМ, должен быть проверен редактором перед использованием в статьях.

Большие фрагменты сгенерированного текста, которые явно не были проверены в достаточной степени, следует удалять при обнаружении. При сомнениях относительно происхождения такого фрагмента это правило следует применять при наличии консенсуса участников.

Не рекомендуется использование БЯМ для написания комментариев в обсуждениях или кратких описаний правок.

Содержание

Оригинальные исследования и галлюцинации

В БЯМ чаще всего используется архитектура трансформера. При генерации вывода БЯМ максимизируют вероятность, назначенную следующему слову в обучающих данных, с учётом предыдущего контекста. Используемые для обучения БЯМ данные извлекаются в том числе из таких источников, как произведения художественной литературы и посты на форумах. Из-за этого БЯМ не гарантирует ни того, что сделанные в созданном ей тексте выводы действительно присутствуют в каком-либо надёжном источнике, ни того, что они не являются полным вымыслом.

Поскольку сделанные БЯМ выводы обычно звучат правдоподобно, людям может быть трудно выявить указанные проблемы. Даже если 90% контента верно, а 10% — ложь, это большая проблема для энциклопедии. Что особенно опасно, БЯМ показывают худшие результаты, если задавать им сложные вопросы, касающиеся малознакомых тем, или задачи, для которых они не подходят (например, задачи, требующие обширных знаний или анализа).

Сомнительные, отсутствующие и подложные источники

Основанием для включения в Википедию информации является не её «истинность», а проверяемость. Это означает, что читатель должен иметь возможность удостовериться в том, что представленный в Википедии материал уже был опубликован в авторитетных источниках. Авторы статей должны указывать авторитетные источники для цитат и другой информации, которая ставится или может быть поставлена под сомнение, — в противном случае эти сведения могут быть удалены.ВП:ПРОВ

Созданный БЯМ текст чаще всего не удовлетворяет требованиям Википедии, касающимся проверяемости и использования только надёжных источников. Иногда он не содержит никаких ссылок или ссылается на ненадёжные источники, включая саму Википедию. В некоторых случаях БЯМ могут создавать лжецитаты и подтверждать их ссылками, содержащими выдуманные заголовки и URL, что прямо запрещено ВП:ПРОВ.

Нарушение авторских прав

Текст может быть размещён в разделе Википедии на русском языке только при выполнении одного из следующих условий:
  • вы являетесь автором этого текста и согласны с его распространением, изменением и использованием (в том числе коммерческим) на условиях лицензии CC BY-SA версии 4.0 и также GFDL. Википедия не принимает тексты под лицензией CC BY-SA версии 1.0, а также тексты под любыми несвободными лицензиями, содержащими -NC и -ND условия, или тексты только под GNU FDL (GFDL).</ref>;
  • этот текст является общественным достоянием (как в США, так и в стране происхождения);
  • этот текст не является объектом авторского права (например, в ряде стран к таким текстам относят законы и другие официальные документы, фольклор, расписания движения транспорта и телепередач);
  • правообладатель этого текста дал разрешение на распространение, изменение и использование (в том числе коммерческое) на условиях лицензии CC BY-SA, CC BY или CC0. Также можно двойное лицензирование CC-BY-SA c GFDL;
    подробнее о регистрации разрешений см. Википедия:ДОБРО.ВП:АП


БЯМ могут генерировать материалы, нарушающие авторские права. Это также касается случаев, когда модель ИИ находится в юрисдикции, где работы, созданные исключительно ИИ, не могут быть защищены авторским правом, хотя вероятность этого крайне мала. Сгенерированный текст может включать дословные цитаты из несвободных источников или быть производным произведением. Кроме того, использование БЯМ для краткого пересказа авторских материалов (например, новостных статей) может привести к слишком близкому перефразированию.

Статус авторских прав БЯМ, обученных на защищённых авторским правом материалах, ещё не полностью понятен. Созданные такими моделями тексты могут не соответствовать требованиям лицензии CC BY-SA и GNU, необходимым для публикации в Википедии.

Комментарии в обсуждениях

Как уже было описано выше, БЯМ хуже справляются со сложными вопросами, касающимися малознакомых тем, или задачами, для которых они не подходят (например, задачами, требующими обширных знаний или анализа). Обсуждения в Википедии являются одной из таких задач. В частности, установление значимости статьи требует доказательства того, что её предмет описан в авторитетных источниках или удовлетворяет каким-то частным критериям. Кроме того, обсуждения статей в Википедии обычно посвящены узкоспециальным темам. Поэтому попытка заставить нейросети писать комментарии обычно приводит к высказыванию нейросетью мнения о предмете статьи или к характерным для спамеров ошибкам, вызванным непониманием ряда используемых в обсуждениях в Википедии терминов.
Downgrade Counter