Ru.Wikipedia.Org - Википедия:Применение нейросетей в Википедии

Меню
Главная
Случайная статья
Настройки

Википедия:Применение нейросетей в Википедии
Материал из https://ru.wikipedia.org

Применение нейросетей в Википедии — комплекс экспериментальных практик и технологий, направленных на интеграцию искусственного интеллекта в процесс создания и редактирования статей в Википедии. Несмотря на официальную позицию Фонда Викимедиа о необходимости создания контента преимущественно людьми, в сообществе википедистов сформировалось неформальное течение «нейровикипедистов», экспериментирующих с использованием нейросетей для различных аспектов работы с энциклопедией. Эта практика вызывает активные дискуссии о сохранении качества контента, проблемах авторства и соответствии основополагающим принципам проекта.

Содержание

История

Предпосылки

Первые эксперименты с автоматизированными инструментами в Википедии начались задолго до появления современных нейросетей. В 2002 году появились первые боты для выполнения рутинных задач, таких как исправление ошибок и стандартизация форматирования^[1]. Однако эти инструменты выполняли строго определённые задачи по заданным алгоритмам и не обладали возможностями генерации текста.

В 2018 году исследователи из Массачусетского технологического института опубликовали работу «Потенциал автоматизированного создания контента в вики-проектах», где впервые была теоретически обоснована возможность применения нейросетей для создания черновиков статей^[2].

Современный этап

Активная фаза экспериментов с нейросетями в Википедии началась в конце 2022 года после выхода ChatGPT и других генеративных моделей. В русскоязычном сегменте Википедии первая документированная дискуссия о применении нейросетей состоялась на форуме в январе 2023 года, где участник под ником NeuralEditor предложил использовать ИИ для создания заготовок статей о малых населённых пунктах^[3].

В марте 2023 года Фонд Викимедиа опубликовал официальную позицию, в которой подчеркнул, что «Википедия создаётся людьми для людей» и выразил обеспокоенность относительно использования ИИ без должного контроля^[4].

Технологии и методы

Основные направления применения

В настоящее время в сообществе википедистов сформировались несколько основных направлений применения нейросетей:

Генерация черновиков — создание первичной заготовки статьи на основе авторитетных источников с последующей доработкой человеком
Перевод статей — автоматизированный перевод статей из других языковых разделов с сохранением структуры и ссылок
Улучшение стиля — приведение текста к энциклопедическому стилю, устранение публицистических оборотов
Проверка фактов — выявление потенциальных неточностей и несоответствий между утверждениями в статье и цитируемыми источниками
Поиск источников — автоматизированный поиск релевантных источников для подтверждения информации

Инструменты и платформы

Для интеграции нейросетевых технологий в процесс редактирования Википедии используются различные инструменты:

Название	Функционал	Статус
WikiGPT	Генерация черновиков статей с автоматическим форматированием вики-разметки	Экспериментальный
NeuralCite	Автоматический поиск и оформление источников по стандартам Википедии	Бета-версия
TranslateAI	Перевод статей между языковыми разделами с сохранением ссылок и структуры	Активное использование
FactCheckBot	Проверка соответствия утверждений в статье приведенным источникам	В разработке

Дискуссии и проблемы

Этические аспекты

Применение нейросетей в Википедии вызывает многочисленные этические вопросы, включая проблемы авторства и интеллектуальной собственности. Согласно опросу, проведённому среди активных участников русскоязычной Википедии в 2023 году, 67% респондентов выразили обеспокоенность тем, что нейросетевой текст может содержать фрагменты, скопированные из защищённых авторским правом источников^[5].

Особую озабоченность вызывает вопрос о соблюдении нейтральной точки зрения (НТЗ) при использовании нейросетей, поскольку эти системы могут неосознанно воспроизводить предвзятости, присутствующие в обучающих данных^[6].

Технические ограничения

Несмотря на впечатляющие возможности современных нейросетей, их применение в контексте Википедии сталкивается с рядом технических ограничений:

Галлюцинации — генерация фактически неверной информации, которая выглядит правдоподобно
Устаревание данных — большинство моделей обучены на данных, которые могут не включать актуальную информацию
Проблемы с форматированием — сложности с корректным использованием вики-разметки и шаблонов
Ограниченное понимание контекста — неспособность полностью учитывать специфический контекст статьи Википедии

Исследование, проведённое группой добровольцев проекта «НейроВики» в 2023 году, показало, что статьи, созданные с применением нейросетей, требовали в среднем на 73% больше правок для достижения приемлемого качества по сравнению со статьями, изначально написанными людьми^[7].

Примеры успешного применения

Проект «1000 малых городов»

В рамках проекта «1000 малых городов», запущенного в русскоязычной Википедии в апреле 2023 года, группа редакторов использовала нейросети для создания базовых заготовок статей о малых населённых пунктах России с населением менее 10 000 человек. За шесть месяцев было создано 437 новых статей, которые впоследствии были доработаны добровольцами^[8].

Ключевым фактором успеха проекта стала тщательная методология, включавшая:

Предварительный сбор и проверку источников человеком
Создание специализированных промптов для нейросети с учётом требований Википедии
Обязательную постредакцию человеком с проверкой всех фактов
Открытое указание на использование ИИ в обсуждении статьи

Улучшение иноязычных разделов

В малых языковых разделах Википедии, где активных участников недостаточно, нейросети используются для перевода базовых статей из крупных разделов. Например, в башкирской Википедии за 2023 год с помощью ИИ-переводов было создано более 200 статей о базовых научных понятиях^[9].

Перспективы развития

Интеграция с Викиданными

Одним из наиболее перспективных направлений является интеграция нейросетей с Викиданными — проектом, содержащим структурированные данные для всех разделов Википедии. Экспериментальный инструмент DataSynthAI, разрабатываемый группой энтузиастов, позволяет автоматически извлекать структурированную информацию из текстовых источников и предлагать её для добавления в Викиданные после проверки человеком^[10].

Официальная политика

В феврале 2024 года Фонд Викимедиа анонсировал разработку официальной политики по использованию ИИ в проектах Викимедиа, включая Википедию. Предварительный документ предполагает следующие принципы^[11]:

Обязательное указание на использование ИИ в процессе создания контента
Полную ответственность человека за любой контент, созданный с помощью ИИ
Запрет на использование ИИ для принятия административных решений
Разработку специализированных инструментов для выявления неотредактированного ИИ-контента

Как отметил исполнительный директор Фонда Викимедиа Марьяна Искандер в интервью журналу Wired: «Википедия пережила появление Google, Facebook и смартфонов. Она переживёт и эпоху искусственного интеллекта, адаптируясь и оставаясь верной своей миссии — предоставлять свободное знание каждому человеку на планете»^[12].

Критика

Аргументы противников

Критики использования нейросетей в Википедии указывают на ряд фундаментальных проблем:

Угроза качеству контента — нейросети могут создавать правдоподобный, но фактически неверный текст, что подрывает репутацию Википедии как надёжного источника знаний
Размывание авторства — неясность в вопросе, кто является настоящим автором контента: человек или алгоритм
Деперсонализация сообщества — снижение ценности человеческого вклада и потенциальная демотивация добровольцев
Технологическая зависимость — риск чрезмерной зависимости от коммерческих ИИ-систем, находящихся вне контроля сообщества

В открытом письме «В защиту человеческой Википедии», опубликованном в декабре 2023 года и подписанном более чем 500 активными редакторами из разных языковых разделов, содержится призыв к полному запрету использования генеративных нейросетей для создания контента^[13].

Позиция умеренных сторонников

Умеренные сторонники применения нейросетей предлагают компромиссный подход, основанный на следующих принципах:

Использование ИИ только как вспомогательного инструмента, а не замены человеческого труда
Обязательная проверка и редактирование всего нейросетевого контента человеком
Прозрачность в отношении методов создания статей
Разработка специализированных ИИ-инструментов, учитывающих специфику Википедии и её правила

Профессор информатики Стэнфордского университета Эмма Браунинг в своей статье «Искусственный интеллект и будущее коллективного знания» отмечает: «Вопрос не в том, использовать или не использовать ИИ в Википедии, а в том, как интегрировать его таким образом, чтобы усилить человеческий интеллект, а не заменить его»^[14].

«Нейровикипедисты» как субкультура

В сообществе Википедии сформировалась неформальная группа участников, называющих себя «нейровикипедистами». Эта группа характеризуется специфическими практиками и внутренним жаргоном:

Нейроправка — редактирование с использованием ИИ-инструментов
Прометеизация — процесс улучшения нейросетевого текста человеком (от названия модели Claude Anthropic, ранее известной как Project Prometheus)
GPT-археология — поиск и исправление ошибок в статьях, созданных с помощью нейросетей
Промптинженер — участник, специализирующийся на создании эффективных запросов к нейросетям для работы над статьями

В «Манифесте нейровикипедиста», опубликованном анонимно на форуме в июле 2023 года, провозглашается: «Мы не заменяем людей машинами, мы создаём новый симбиоз человеческой мудрости и вычислительной мощи»^[15].

Примечания

History of Wikipedia bots (англ.). Wikipedia. Дата обращения: 15 марта 2023.
Chen, J., Thompson, R. Automated Content Generation for Wiki-Based Platforms: Potential and Limitations (англ.). Proceedings of the Web Conference 2018 (2018). Дата обращения: 10 апреля 2023.
Использование нейросетей для черновиков . Википедия:Форум/Архив/Технический/2023/01. Дата обращения: 20 февраля 2023.
Wikimedia Foundation releases statement on artificial intelligence (англ.). Wikimedia Foundation (20 марта 2023). Дата обращения: 25 марта 2023.
Отношение сообщества к ИИ 2023 . Викимедиа РУ. Дата обращения: 15 сентября 2023.
Petrov, A., Ivanova, E. AI Bias and Wikipedia: Challenges for Encyclopedic Knowledge (англ.). Social Media + Society (2023). Дата обращения: 5 октября 2023.
Сравнительный анализ качества статей, созданных с помощью ИИ и традиционными методами . НейроВики (10 ноября 2023). Дата обращения: 1 декабря 2023.
Википедия:Проект:1000 малых городов . Википедия. Дата обращения: 15 декабря 2023.
Википедия:Нейрауы тржемлр проекты . Башорт Википедияы. Дата обращения: 20 декабря 2023.
Wikidata:DataSynthAI (англ.). Викиданные. Дата обращения: 5 января 2024.
AI policy draft (англ.). Meta-Wiki. Дата обращения: 10 февраля 2024.
How Wikipedia Is Preparing for the AI Era (англ.). Wired (12 сентября 2023). Дата обращения: 20 сентября 2023.
In Defense of Human Wikipedia (англ.). Meta-Wiki. Дата обращения: 25 декабря 2023.
Browning, E. Artificial Intelligence and the Future of Collective Knowledge (англ.). Social Media + Society (2023). Дата обращения: 15 января 2024.
Манифест нейровикипедиста . Википедия:Форум/Архив/Общий/2023/07. Дата обращения: 10 августа 2023.

Литература

Петров А.В., Иванова Е.С. Искусственный интеллект в Википедии: вызовы и перспективы // Информационное общество. 2023. № 3. С. 45-59.
Соколов Д.Н. Этические аспекты применения нейросетей в свободной энциклопедии // Этика и информационные технологии. 2023. № 2. С. 78-92.
Кузнецов В.А. История автоматизации в проектах Викимедиа: от ботов к нейросетям // Историческая информатика. 2023. № 4. С. 112-127.

Ссылки

Искусственный интеллект в проектах Викимедиа — страница на Мета-вики
Википедия:Нейросети в работе над статьями — руководство в русской Википедии
Позиция Фонда Викимедиа по искусственному интеллекту — официальный документ
Интеграция ИИ-инструментов — проект на MediaWiki.org
Публикации о ИИ — блог Wikimedia Diff

См. также