Ru.Wikipedia.Org - Обсуждение проекта:Искусственный интеллект

Меню
Главная
Случайная статья
Настройки

Обсуждение проекта:Искусственный интеллект
Материал из https://ru.wikipedia.org

Пожалуйста, добавляйте новые темы внизу страницы.

Добавить

Инструменты для чекинга

Было бы неплохо поискать инструменты для проверки на ИИ-генерацию. У меня есть несколько в сохраненках, но они очень простые и, в идеале, нужен какой-нибудь аля Turnitin. Потом их потестить на предполагаемых статьях и добавить в список инструментов. Kylain Aixter (СО) 17:38, 7 мая 2025 (UTC)[ответить]

Все «ИИ-детекторы», которые я видел, либо мошеннические (и определяют много процентов ИИ в текстах, написанных задолго до нейросетей), либо определяют только очевидный копипаст результата работы самых дешёвых моделей. Фундаментальная проблема с ИИ-детекторами состоит в том, что в процесс обучения нейросети входит проверка результата генерации на дискриминаторе — как раз таком детекторе, который отличает сгенерированные тексты от обучающей выборки. Когда он перестаёт отличать — нейросеть обучена. Если мы придумали какой-то продвинутый дискриминатор, который будет чётко отличать ответы предыдущей версии нейросети - следующая версия уже это учтёт. Котик полосатый (обс.) 18:07, 7 мая 2025 (UTC)[ответить]
- О, спасибо большое за ликбез!
  Тогда получается что проверить мы не сможем (только если не более ранние тексты), а предполагать, что кто-то использует старые нейросети - вероятно, ошибочно. Kylain Aixter (СО) 18:31, 7 мая 2025 (UTC)[ответить]

Проект:Искусственный интеллект/Красные ссылки

Создал страницу Проект:Искусственный интеллект/Красные ссылки. Oleg4280 (обс.) 12:19, 8 мая 2025 (UTC)[ответить]

Юзербокс DeepSeek

Коллеги, я создал юзербокс для авторов, использующих DeepSeek при работе над статьями {{Userbox/DeepSeek}}. Считаю, что лучше сразу предупредить коллег, что я пользуюсь ИИ для работы над статьями.
Если сочтёте нужным, я могу сделать юзербоксы и для других LLM. VladimirPF 11:16, 20 июля 2025 (UTC)[ответить]

GPT-5 для сверки статей

Коллеги, думаю, GPT-5 уже показывает достаточно приемлемый уровень правильных ответов в качестве ассистента по сверке статей с источниками, что может пригодиться для рецензирования статусных статей. Есть идея сделать автоматизированный инструмент, который берёт утверждения, подтверждённые в статье сносками, и отправляет их ИИ вместе со ссылками на источники или с текстами, извлечёнными из этих источников. Результатом работы инструмента будет отчёт, в котором будет список проанализированных фактов и сносок, их подтверждающих, и вердикт ИИ относительно подтверждённости информации в источниках. Если по какому-то факту ИИ даёт отрицательный вердикт — лезем проверять источник сами.

Есть идея сделать подобное самому, но я могу сделать десктоп или веб, в то время как в идеале хорошо бы этому быть у нас на тулсервере. С другой стороны, видя то, как «оперативно» у нас с тулсервера всё грузится — может, лучше и десктоп.

В качестве подопытной взята КХС Super Mario Bros..

User

Есть информация:

Super Mario Bros. разрабатывалась для картриджей, вмещавших 256 килобайт памяти, 64 из которых занимали спрайты и графика задних фонов.

Есть ссылка:

https://www.nintendo.com/en-gb/Iwata-Asks/Super-Mario-Bros-25th-Anniversary/Vol-5-Original-Super-Mario-Developers/3-The-Grand-Culmination/3-The-Grand-Culmination-212856.html

Проверь, есть ли указанная информация по указанной ссылке.

ChatGPT 5

Да, информация подтверждена: на странице серии интервью Iwata Asks – Volume 5: Original Super Mario Developers говорится:

«When you first made Super MarioBros., you used 256kilobit memory at first. … The characters stayed at 64kilobits, though.» (iwataasks.nintendo.com)

В этом контексте:

256-килобит (kilobit) эквивалентно 32 КиБайтам (килобайтам) — это общий объём памяти картриджа, отведённой под игру.
64-килобит — это 8 КиБайт, которые использовались для спрайтов и графики заднего фона.

Таким образом, ваше утверждение полностью соответствует информации из оригинального источника.

Стоит отметить, что интерпретация "characters" как "спрайты и графика задних фонов" может быть неочевидной, но в целом, учитывая контекст, она подходит (хотя, может быть, и можно сделать текст в статье более точным).

User

Есть информация:

Будучи одной из самых популярных игр Nintendo, Super Mario Bros. переиздавалась множество раз, и каждая новая консоль компании (за исключением Nintendo 64) имела свой собственный порт или ремейк игры.

Есть ссылка: https://arstechnica.com/gaming/2015/09/30-years-30-memorable-facts-about-super-mario-bros/

Проверь, есть ли указанная информация по указанной ссылке.

ChatGPT 5

Да, указанная вами информация подтверждена — и именно на странице статьи Ars Technica: “30 years, 30 memorable facts about Super Mario Bros.” содержится утверждение, что:

“The Nintendo 64 is Nintendo’s only home console without a version of SuperMarioBros.”

Это соответствует вашему заявлению: Super Mario Bros. действительно переиздавалась (или портировалась) практически на каждую новую консоль Nintendo, за исключением именно Nintendo 64.

User

Есть информация:

Саундтрек из шести композиций и все звуковые эффекты создал саунд-дизайнер Кодзи Кондо.

Есть текст-источник:

<сюда скопировал текст из веб-архива>

Проверь, есть ли информация в тексте-источнике.

ChatGPT 5

В приведённом тексте действительно есть утверждение, что Кодзи Кондо написал шесть композиций для Super Mario Bros.:

"Then Kondo found himself tasked with writing the six entire songs of Super Mario Bros."

Однако про «все звуковые эффекты» в этом источнике ничего не говорится — текст упоминает, что он подгонял музыку под звуковые эффекты, но не утверждает, что сам их создавал:

"...didn't harmonize with the different sound effects, he'd scrap it and start over."

Это значит, что ваша фраза полностью не подтверждается данным источником — из него следует только первая часть («саундтрек из шести композиций»), а вторая («и все звуковые эффекты») в нём отсутствует.

Вместе с тем, ИИ намудрил с PDF-кой:

User

Есть текст:

Super Mario Bros. — игра в жанре платформера, в которой игрок, управляя протагонистом по имени Марио, должен пройти через всё Грибное королевство, чтобы победить Боузера и спасти принцессу Тоудстул. В режиме многопользовательской игры второй игрок управляет Луиджи, братом Марио, играющим в сюжете аналогичную роль.

Есть ссылка: https://www.nintendo.co.jp/clv/manuals/en/pdf/CLV-P-NAAAE.pdf

Проверь, есть ли указанная информация по указанному адресу.

ChatGPT 5

Проверил руководство пользователя, доступное по ссылке (CLVPNAAAE — SuperMarioBros.) на официальном сайте Nintendo. Вот что удалось уточнить:

В разделе с описанием управления указано, что «Controller2– for second player in 2player game», то есть второй игрок действительно управляет своей фигурой с другого контроллера nintendo.co.jp+4nintendo.co.jp+4nintendo.co.jp+4.
Однако утверждение о том, что второй игрок именно «Luigi» (брат Марио), в этом документе не указано. Там лишь говорится о контроллере, без указания имени персонажа (Luigi).
Что касается сюжета: в мануале не упоминается, что игрок проходит через Грибное королевство, чтобы победить Боузера и спасти принцессу Тоадстул. Также непосредственно имя «Princess Toadstool» не упомянуто в описании сюжета этого руководства — основной акцент сделан на управление и игровые действия, без изложенного сюжетного контекста thegameisafootarcade.com+5legendsoflocalization.com+5reddit.com+5.

Таким образом:

Утверждение о режиме 2-плеера с контроллером 2 — подтверждается.
Но привязка второго игрока именно к Луиджи, а также сюжет про спасение принцессы — в данном документе не представлены.

Если хотите, могу посмотреть и другие источники или мануалы, где эти элементы уточнены.

SkorP²⁴ 12:06, 10 августа 2025 (UTC)[ответить]

Уже сделано (в части отправки ИИ, в текстовые файлы источники и текст статьи надо сохранять пока что ручками). [1]. Для использования GPT-5 вписать соответствующее имя модели в параметр model. Только убедитесь, что у вас денег на это хватит. Котик полосатый (обс.) 12:20, 10 августа 2025 (UTC)[ответить]
- Ух ты, супер! Полезный инструмент, надо будет попробовать. Тем не менее, уже по описанию, есть куда улучшаться по направлению к полноценному помощнику по сверке статей (включая, например, проверку, что сноски правильно расставлены). SkorP²⁴ 12:42, 10 августа 2025 (UTC)[ответить]
  - Конечно. Но ключевой проблемой является не написание UI-кода, а то, что использование LLM стоит денег. Участников Википедии, готовых платить за сверку из своего кармана, не так много. Суммы при использовании продвинутых моделей довольно быстро набегают заметные. И даже с дешёвыми моделями (например, GPT-5 nano) сколько-нибудь массовое использование (за пределами проверки 1-2 статей) будет требовать вложений. Можно локально запускать (например, gemma-3n или какой-нибудь deepseek не очень большой), но для приемлемой производительности придётся купить видеокарту за 250+ тысяч рублей. И платить уже за электроэнергию. Котик полосатый (обс.) 13:04, 10 августа 2025 (UTC)[ответить]
  - Есть одна проблема — книги. Неоцифрованные книги не смогут проверить ИИ, а с оцифрованными тоже может быть проблема, ибо считывать с картинки текст трудновато. Хотя, может уже и это умеют. С уважением, Dan Watcher 32, 14:26, 21 августа 2025 (UTC)[ответить]
    - ИИ прекрасно умеют как распознавать текст с картинки, так и приводить в удобный для использования вид результат распознавания сторонней OCR-программой. Так что это просто ещё один шаг обработки. Всё упирается в то, что сколько-нибудь массовое внедрение подобных инструментов требует наличия богатенького буратины, который проспонсирует всю вечеринку. А таких нет и, скорее всего, не будет. Котик полосатый (обс.) 15:11, 21 августа 2025 (UTC)[ответить]
      - Я не вникал в детали, поэтому прошу прощения, если задаю глупый вопрос. Как я понял, если статья разбита на сто фрагментов и в ней сто источников, то инструмент отправит 100^2 = 10 000 запросов к ИИ? Если так, то может быть было бы логичнее и дешевле проверять каждый фрагмент на соответствие только тем источникам, сноски на которые содержатся в нем самом и сразу после него (до конца абзаца)? Ведь если в большой статье сноски расставлены случайным образом, то проверяемость в ней все равно нарушена, даже если информация в целом соответствует источникам (живой участник, решивший выверить статью, тоже не стал бы проверять каждый фрагмент, заглядывая во все сто источников) Алексей Ладынин (обс.) 19:25, 24 августа 2025 (UTC)[ответить]
        Ну если кто-то решит сверить сразу целиком ИС на 70к знаков видимого текста со 100 источниками — то да, 10 тысяч запросов и я буду удивлён, если оно в середине не крашнется. Но так делать совершенно незачем. Никто не мешает проверять по частям, например, по разделам. Хотя сверить целиком статью по всем источникам может быть полезно: 1) выявятся фрагменты, не подтверждающиеся никакими источниками; 2) можно смотреть по отдельным источникам, что именно они подтверждают, и исходя из этого расставлять сноски. Котик полосатый (обс.) 22:29, 24 августа 2025 (UTC)[ответить]

Оценка тона статей с помощью нейросетей

Википедия:Форум/Общий#Оценка тона статей с помощью нейросетей и я заодно создала подстраничку и закинула ссылку туда, чтобы потом не искать инструмент — Проект:Искусственный интеллект/Оценка. Может ещё какие ссылочки туда покидаем, если есть что-то тоже для оценки. -- Megitsune-chan () 06:34, 19 сентября 2025 (UTC)[ответить]