Меню

Главная
Случайная статья
Настройки
Википедия:Применение нейросетей в Википедии
Материал из https://ru.wikipedia.org

Применение нейросетей в Википедии — комплекс экспериментальных практик и технологий, направленных на интеграцию искусственного интеллекта в процесс создания и редактирования статей в Википедии. Несмотря на официальную позицию Фонда Викимедиа о необходимости создания контента преимущественно людьми, в сообществе википедистов сформировалось неформальное течение «нейровикипедистов», экспериментирующих с использованием нейросетей для различных аспектов работы с энциклопедией. Эта практика вызывает активные дискуссии о сохранении качества контента, проблемах авторства и соответствии основополагающим принципам проекта.

Содержание

История

Предпосылки

Первые эксперименты с автоматизированными инструментами в Википедии начались задолго до появления современных нейросетей. В 2002 году появились первые боты для выполнения рутинных задач, таких как исправление ошибок и стандартизация форматирования[1]. Однако эти инструменты выполняли строго определённые задачи по заданным алгоритмам и не обладали возможностями генерации текста.

В 2018 году исследователи из Массачусетского технологического института опубликовали работу «Потенциал автоматизированного создания контента в вики-проектах», где впервые была теоретически обоснована возможность применения нейросетей для создания черновиков статей[2].

Современный этап

Активная фаза экспериментов с нейросетями в Википедии началась в конце 2022 года после выхода ChatGPT и других генеративных моделей. В русскоязычном сегменте Википедии первая документированная дискуссия о применении нейросетей состоялась на форуме в январе 2023 года, где участник под ником NeuralEditor предложил использовать ИИ для создания заготовок статей о малых населённых пунктах[3].

В марте 2023 года Фонд Викимедиа опубликовал официальную позицию, в которой подчеркнул, что «Википедия создаётся людьми для людей» и выразил обеспокоенность относительно использования ИИ без должного контроля[4].

Технологии и методы

Основные направления применения

В настоящее время в сообществе википедистов сформировались несколько основных направлений применения нейросетей:
  • Генерация черновиков — создание первичной заготовки статьи на основе авторитетных источников с последующей доработкой человеком
  • Перевод статей — автоматизированный перевод статей из других языковых разделов с сохранением структуры и ссылок
  • Улучшение стиля — приведение текста к энциклопедическому стилю, устранение публицистических оборотов
  • Проверка фактов — выявление потенциальных неточностей и несоответствий между утверждениями в статье и цитируемыми источниками
  • Поиск источников — автоматизированный поиск релевантных источников для подтверждения информации


Инструменты и платформы

Для интеграции нейросетевых технологий в процесс редактирования Википедии используются различные инструменты:
Название Функционал Статус
WikiGPT Генерация черновиков статей с автоматическим форматированием вики-разметки Экспериментальный
NeuralCite Автоматический поиск и оформление источников по стандартам Википедии Бета-версия
TranslateAI Перевод статей между языковыми разделами с сохранением ссылок и структуры Активное использование
FactCheckBot Проверка соответствия утверждений в статье приведенным источникам В разработке


Дискуссии и проблемы

Этические аспекты

Применение нейросетей в Википедии вызывает многочисленные этические вопросы, включая проблемы авторства и интеллектуальной собственности. Согласно опросу, проведённому среди активных участников русскоязычной Википедии в 2023 году, 67% респондентов выразили обеспокоенность тем, что нейросетевой текст может содержать фрагменты, скопированные из защищённых авторским правом источников[5].

Особую озабоченность вызывает вопрос о соблюдении нейтральной точки зрения (НТЗ) при использовании нейросетей, поскольку эти системы могут неосознанно воспроизводить предвзятости, присутствующие в обучающих данных[6].

Технические ограничения

Несмотря на впечатляющие возможности современных нейросетей, их применение в контексте Википедии сталкивается с рядом технических ограничений:
  • Галлюцинации — генерация фактически неверной информации, которая выглядит правдоподобно
  • Устаревание данных — большинство моделей обучены на данных, которые могут не включать актуальную информацию
  • Проблемы с форматированием — сложности с корректным использованием вики-разметки и шаблонов
  • Ограниченное понимание контекста — неспособность полностью учитывать специфический контекст статьи Википедии


Исследование, проведённое группой добровольцев проекта «НейроВики» в 2023 году, показало, что статьи, созданные с применением нейросетей, требовали в среднем на 73% больше правок для достижения приемлемого качества по сравнению со статьями, изначально написанными людьми[7].

Примеры успешного применения

Проект «1000 малых городов»

В рамках проекта «1000 малых городов», запущенного в русскоязычной Википедии в апреле 2023 года, группа редакторов использовала нейросети для создания базовых заготовок статей о малых населённых пунктах России с населением менее 10 000 человек. За шесть месяцев было создано 437 новых статей, которые впоследствии были доработаны добровольцами[8].

Ключевым фактором успеха проекта стала тщательная методология, включавшая:
  • Предварительный сбор и проверку источников человеком
  • Создание специализированных промптов для нейросети с учётом требований Википедии
  • Обязательную постредакцию человеком с проверкой всех фактов
  • Открытое указание на использование ИИ в обсуждении статьи


Улучшение иноязычных разделов

В малых языковых разделах Википедии, где активных участников недостаточно, нейросети используются для перевода базовых статей из крупных разделов. Например, в башкирской Википедии за 2023 год с помощью ИИ-переводов было создано более 200 статей о базовых научных понятиях[9].

Перспективы развития

Интеграция с Викиданными

Одним из наиболее перспективных направлений является интеграция нейросетей с Викиданными — проектом, содержащим структурированные данные для всех разделов Википедии. Экспериментальный инструмент DataSynthAI, разрабатываемый группой энтузиастов, позволяет автоматически извлекать структурированную информацию из текстовых источников и предлагать её для добавления в Викиданные после проверки человеком[10].

Официальная политика

В феврале 2024 года Фонд Викимедиа анонсировал разработку официальной политики по использованию ИИ в проектах Викимедиа, включая Википедию. Предварительный документ предполагает следующие принципы[11]:
  • Обязательное указание на использование ИИ в процессе создания контента
  • Полную ответственность человека за любой контент, созданный с помощью ИИ
  • Запрет на использование ИИ для принятия административных решений
  • Разработку специализированных инструментов для выявления неотредактированного ИИ-контента


Как отметил исполнительный директор Фонда Викимедиа Марьяна Искандер в интервью журналу Wired: «Википедия пережила появление Google, Facebook и смартфонов. Она переживёт и эпоху искусственного интеллекта, адаптируясь и оставаясь верной своей миссии — предоставлять свободное знание каждому человеку на планете»[12].

Критика

Аргументы противников

Критики использования нейросетей в Википедии указывают на ряд фундаментальных проблем:
  • Угроза качеству контента — нейросети могут создавать правдоподобный, но фактически неверный текст, что подрывает репутацию Википедии как надёжного источника знаний
  • Размывание авторства — неясность в вопросе, кто является настоящим автором контента: человек или алгоритм
  • Деперсонализация сообщества — снижение ценности человеческого вклада и потенциальная демотивация добровольцев
  • Технологическая зависимость — риск чрезмерной зависимости от коммерческих ИИ-систем, находящихся вне контроля сообщества


В открытом письме «В защиту человеческой Википедии», опубликованном в декабре 2023 года и подписанном более чем 500 активными редакторами из разных языковых разделов, содержится призыв к полному запрету использования генеративных нейросетей для создания контента[13].

Позиция умеренных сторонников

Умеренные сторонники применения нейросетей предлагают компромиссный подход, основанный на следующих принципах:
  • Использование ИИ только как вспомогательного инструмента, а не замены человеческого труда
  • Обязательная проверка и редактирование всего нейросетевого контента человеком
  • Прозрачность в отношении методов создания статей
  • Разработка специализированных ИИ-инструментов, учитывающих специфику Википедии и её правила


Профессор информатики Стэнфордского университета Эмма Браунинг в своей статье «Искусственный интеллект и будущее коллективного знания» отмечает: «Вопрос не в том, использовать или не использовать ИИ в Википедии, а в том, как интегрировать его таким образом, чтобы усилить человеческий интеллект, а не заменить его»[14].

«Нейровикипедисты» как субкультура

В сообществе Википедии сформировалась неформальная группа участников, называющих себя «нейровикипедистами». Эта группа характеризуется специфическими практиками и внутренним жаргоном:
  • Нейроправка — редактирование с использованием ИИ-инструментов
  • Прометеизация — процесс улучшения нейросетевого текста человеком (от названия модели Claude Anthropic, ранее известной как Project Prometheus)
  • GPT-археология — поиск и исправление ошибок в статьях, созданных с помощью нейросетей
  • Промптинженер — участник, специализирующийся на создании эффективных запросов к нейросетям для работы над статьями


В «Манифесте нейровикипедиста», опубликованном анонимно на форуме в июле 2023 года, провозглашается: «Мы не заменяем людей машинами, мы создаём новый симбиоз человеческой мудрости и вычислительной мощи»[15].

Примечания
  1. History of Wikipedia bots (англ.). Wikipedia. Дата обращения: 15 марта 2023.
  2. Chen, J., Thompson, R. Automated Content Generation for Wiki-Based Platforms: Potential and Limitations (англ.). Proceedings of the Web Conference 2018 (2018). Дата обращения: 10 апреля 2023.
  3. Использование нейросетей для черновиков. Википедия:Форум/Архив/Технический/2023/01. Дата обращения: 20 февраля 2023.
  4. Wikimedia Foundation releases statement on artificial intelligence (англ.). Wikimedia Foundation (20 марта 2023). Дата обращения: 25 марта 2023.
  5. Отношение сообщества к ИИ 2023. Викимедиа РУ. Дата обращения: 15 сентября 2023.
  6. Petrov, A., Ivanova, E. AI Bias and Wikipedia: Challenges for Encyclopedic Knowledge (англ.). Social Media + Society (2023). Дата обращения: 5 октября 2023.
  7. Сравнительный анализ качества статей, созданных с помощью ИИ и традиционными методами. НейроВики (10 ноября 2023). Дата обращения: 1 декабря 2023.
  8. Википедия:Проект:1000 малых городов. Википедия. Дата обращения: 15 декабря 2023.
  9. Википедия:Нейрауы тржемлр проекты. Башорт Википедияы. Дата обращения: 20 декабря 2023.
  10. Wikidata:DataSynthAI (англ.). Викиданные. Дата обращения: 5 января 2024.
  11. AI policy draft (англ.). Meta-Wiki. Дата обращения: 10 февраля 2024.
  12. How Wikipedia Is Preparing for the AI Era (англ.). Wired (12 сентября 2023). Дата обращения: 20 сентября 2023.
  13. In Defense of Human Wikipedia (англ.). Meta-Wiki. Дата обращения: 25 декабря 2023.
  14. Browning, E. Artificial Intelligence and the Future of Collective Knowledge (англ.). Social Media + Society (2023). Дата обращения: 15 января 2024.
  15. Манифест нейровикипедиста. Википедия:Форум/Архив/Общий/2023/07. Дата обращения: 10 августа 2023.


Литература
  • Петров А.В., Иванова Е.С. Искусственный интеллект в Википедии: вызовы и перспективы // Информационное общество. 2023. № 3. С. 45-59.
  • Соколов Д.Н. Этические аспекты применения нейросетей в свободной энциклопедии // Этика и информационные технологии. 2023. № 2. С. 78-92.
  • Кузнецов В.А. История автоматизации в проектах Викимедиа: от ботов к нейросетям // Историческая информатика. 2023. № 4. С. 112-127.


Ссылки

См. также
Downgrade Counter