Меню
Главная
Случайная статья
Настройки
|
Пожалуйста, добавляйте новые темы внизу страницы.
Добавить
Инструменты для чекинга
Было бы неплохо поискать инструменты для проверки на ИИ-генерацию. У меня есть несколько в сохраненках, но они очень простые и, в идеале, нужен какой-нибудь аля Turnitin. Потом их потестить на предполагаемых статьях и добавить в список инструментов. Kylain Aixter (СО) 17:38, 7 мая 2025 (UTC)[ответить]
- Все «ИИ-детекторы», которые я видел, либо мошеннические (и определяют много процентов ИИ в текстах, написанных задолго до нейросетей), либо определяют только очевидный копипаст результата работы самых дешёвых моделей. Фундаментальная проблема с ИИ-детекторами состоит в том, что в процесс обучения нейросети входит проверка результата генерации на дискриминаторе — как раз таком детекторе, который отличает сгенерированные тексты от обучающей выборки. Когда он перестаёт отличать — нейросеть обучена. Если мы придумали какой-то продвинутый дискриминатор, который будет чётко отличать ответы предыдущей версии нейросети - следующая версия уже это учтёт. Котик полосатый (обс.) 18:07, 7 мая 2025 (UTC)[ответить]
- О, спасибо большое за ликбез!
Тогда получается что проверить мы не сможем (только если не более ранние тексты), а предполагать, что кто-то использует старые нейросети - вероятно, ошибочно. Kylain Aixter (СО) 18:31, 7 мая 2025 (UTC)[ответить]
Проект:Искусственный интеллект/Красные ссылки
Создал страницу Проект:Искусственный интеллект/Красные ссылки. Oleg4280 (обс.) 12:19, 8 мая 2025 (UTC)[ответить]
Юзербокс DeepSeek
Коллеги, я создал юзербокс для авторов, использующих DeepSeek при работе над статьями {{Userbox/DeepSeek}}. Считаю, что лучше сразу предупредить коллег, что я пользуюсь ИИ для работы над статьями.
Если сочтёте нужным, я могу сделать юзербоксы и для других LLM. VladimirPF 11:16, 20 июля 2025 (UTC)[ответить]
GPT-5 для сверки статей
Коллеги, думаю, GPT-5 уже показывает достаточно приемлемый уровень правильных ответов в качестве ассистента по сверке статей с источниками, что может пригодиться для рецензирования статусных статей. Есть идея сделать автоматизированный инструмент, который берёт утверждения, подтверждённые в статье сносками, и отправляет их ИИ вместе со ссылками на источники или с текстами, извлечёнными из этих источников. Результатом работы инструмента будет отчёт, в котором будет список проанализированных фактов и сносок, их подтверждающих, и вердикт ИИ относительно подтверждённости информации в источниках. Если по какому-то факту ИИ даёт отрицательный вердикт — лезем проверять источник сами.
Есть идея сделать подобное самому, но я могу сделать десктоп или веб, в то время как в идеале хорошо бы этому быть у нас на тулсервере. С другой стороны, видя то, как «оперативно» у нас с тулсервера всё грузится — может, лучше и десктоп.
В качестве подопытной взята КХС Super Mario Bros..
User
Есть информация:
Super Mario Bros. разрабатывалась для картриджей, вмещавших 256 килобайт памяти, 64 из которых занимали спрайты и графика задних фонов.
Есть ссылка:
https://www.nintendo.com/en-gb/Iwata-Asks/Super-Mario-Bros-25th-Anniversary/Vol-5-Original-Super-Mario-Developers/3-The-Grand-Culmination/3-The-Grand-Culmination-212856.html
Проверь, есть ли указанная информация по указанной ссылке.
ChatGPT 5
Да, информация подтверждена: на странице серии интервью Iwata Asks – Volume 5: Original Super Mario Developers говорится:
«When you first made Super MarioBros., you used 256kilobit memory at first. … The characters stayed at 64kilobits, though.» (iwataasks.nintendo.com)
В этом контексте:
- 256-килобит (kilobit) эквивалентно 32 КиБайтам (килобайтам) — это общий объём памяти картриджа, отведённой под игру.
- 64-килобит — это 8 КиБайт, которые использовались для спрайтов и графики заднего фона.
Таким образом, ваше утверждение полностью соответствует информации из оригинального источника.
Стоит отметить, что интерпретация "characters" как "спрайты и графика задних фонов" может быть неочевидной, но в целом, учитывая контекст, она подходит (хотя, может быть, и можно сделать текст в статье более точным).
User
Есть информация:
Будучи одной из самых популярных игр Nintendo, Super Mario Bros. переиздавалась множество раз, и каждая новая консоль компании (за исключением Nintendo 64) имела свой собственный порт или ремейк игры.
Есть ссылка: https://arstechnica.com/gaming/2015/09/30-years-30-memorable-facts-about-super-mario-bros/
Проверь, есть ли указанная информация по указанной ссылке.
ChatGPT 5
Да, указанная вами информация подтверждена — и именно на странице статьи Ars Technica: “30 years, 30 memorable facts about Super Mario Bros.” содержится утверждение, что:
“The Nintendo 64 is Nintendo’s only home console without a version of SuperMarioBros.”
Это соответствует вашему заявлению: Super Mario Bros. действительно переиздавалась (или портировалась) практически на каждую новую консоль Nintendo, за исключением именно Nintendo 64.
User
Есть информация:
Саундтрек из шести композиций и все звуковые эффекты создал саунд-дизайнер Кодзи Кондо.
Есть текст-источник:
<сюда скопировал текст из веб-архива>
Проверь, есть ли информация в тексте-источнике.
ChatGPT 5
В приведённом тексте действительно есть утверждение, что Кодзи Кондо написал шесть композиций для Super Mario Bros.:
"Then Kondo found himself tasked with writing the six entire songs of Super Mario Bros."
Однако про «все звуковые эффекты» в этом источнике ничего не говорится — текст упоминает, что он подгонял музыку под звуковые эффекты, но не утверждает, что сам их создавал:
"...didn't harmonize with the different sound effects, he'd scrap it and start over."
Это значит, что ваша фраза полностью не подтверждается данным источником — из него следует только первая часть («саундтрек из шести композиций»), а вторая («и все звуковые эффекты») в нём отсутствует.
Вместе с тем, ИИ намудрил с PDF-кой:
User
Есть текст:
Super Mario Bros. — игра в жанре платформера, в которой игрок, управляя протагонистом по имени Марио, должен пройти через всё Грибное королевство, чтобы победить Боузера и спасти принцессу Тоудстул. В режиме многопользовательской игры второй игрок управляет Луиджи, братом Марио, играющим в сюжете аналогичную роль.
Есть ссылка: https://www.nintendo.co.jp/clv/manuals/en/pdf/CLV-P-NAAAE.pdf
Проверь, есть ли указанная информация по указанному адресу.
ChatGPT 5
Проверил руководство пользователя, доступное по ссылке (CLVPNAAAE — SuperMarioBros.) на официальном сайте Nintendo. Вот что удалось уточнить:
- В разделе с описанием управления указано, что «Controller2– for second player in 2player game», то есть второй игрок действительно управляет своей фигурой с другого контроллера nintendo.co.jp+4nintendo.co.jp+4nintendo.co.jp+4.
- Однако утверждение о том, что второй игрок именно «Luigi» (брат Марио), в этом документе не указано. Там лишь говорится о контроллере, без указания имени персонажа (Luigi).
- Что касается сюжета: в мануале не упоминается, что игрок проходит через Грибное королевство, чтобы победить Боузера и спасти принцессу Тоадстул. Также непосредственно имя «Princess Toadstool» не упомянуто в описании сюжета этого руководства — основной акцент сделан на управление и игровые действия, без изложенного сюжетного контекста thegameisafootarcade.com+5legendsoflocalization.com+5reddit.com+5.
Таким образом:
- Утверждение о режиме 2-плеера с контроллером 2 — подтверждается.
- Но привязка второго игрока именно к Луиджи, а также сюжет про спасение принцессы — в данном документе не представлены.
Если хотите, могу посмотреть и другие источники или мануалы, где эти элементы уточнены.
SkorP24 12:06, 10 августа 2025 (UTC)[ответить]
- Уже сделано (в части отправки ИИ, в текстовые файлы источники и текст статьи надо сохранять пока что ручками). [1]. Для использования GPT-5 вписать соответствующее имя модели в параметр model. Только убедитесь, что у вас денег на это хватит. Котик полосатый (обс.) 12:20, 10 августа 2025 (UTC)[ответить]
- Ух ты, супер! Полезный инструмент, надо будет попробовать. Тем не менее, уже по описанию, есть куда улучшаться по направлению к полноценному помощнику по сверке статей (включая, например, проверку, что сноски правильно расставлены). SkorP24 12:42, 10 августа 2025 (UTC)[ответить]
- Конечно. Но ключевой проблемой является не написание UI-кода, а то, что использование LLM стоит денег. Участников Википедии, готовых платить за сверку из своего кармана, не так много. Суммы при использовании продвинутых моделей довольно быстро набегают заметные. И даже с дешёвыми моделями (например, GPT-5 nano) сколько-нибудь массовое использование (за пределами проверки 1-2 статей) будет требовать вложений. Можно локально запускать (например, gemma-3n или какой-нибудь deepseek не очень большой), но для приемлемой производительности придётся купить видеокарту за 250+ тысяч рублей. И платить уже за электроэнергию. Котик полосатый (обс.) 13:04, 10 августа 2025 (UTC)[ответить]
- Есть одна проблема — книги. Неоцифрованные книги не смогут проверить ИИ, а с оцифрованными тоже может быть проблема, ибо считывать с картинки текст трудновато. Хотя, может уже и это умеют. С уважением, Dan Watcher 32, 14:26, 21 августа 2025 (UTC)[ответить]
- ИИ прекрасно умеют как распознавать текст с картинки, так и приводить в удобный для использования вид результат распознавания сторонней OCR-программой. Так что это просто ещё один шаг обработки. Всё упирается в то, что сколько-нибудь массовое внедрение подобных инструментов требует наличия богатенького буратины, который проспонсирует всю вечеринку. А таких нет и, скорее всего, не будет. Котик полосатый (обс.) 15:11, 21 августа 2025 (UTC)[ответить]
- Я не вникал в детали, поэтому прошу прощения, если задаю глупый вопрос. Как я понял, если статья разбита на сто фрагментов и в ней сто источников, то инструмент отправит 100^2 = 10 000 запросов к ИИ? Если так, то может быть было бы логичнее и дешевле проверять каждый фрагмент на соответствие только тем источникам, сноски на которые содержатся в нем самом и сразу после него (до конца абзаца)? Ведь если в большой статье сноски расставлены случайным образом, то проверяемость в ней все равно нарушена, даже если информация в целом соответствует источникам (живой участник, решивший выверить статью, тоже не стал бы проверять каждый фрагмент, заглядывая во все сто источников) Алексей Ладынин (обс.) 19:25, 24 августа 2025 (UTC)[ответить]
- Ну если кто-то решит сверить сразу целиком ИС на 70к знаков видимого текста со 100 источниками — то да, 10 тысяч запросов и я буду удивлён, если оно в середине не крашнется. Но так делать совершенно незачем. Никто не мешает проверять по частям, например, по разделам. Хотя сверить целиком статью по всем источникам может быть полезно: 1) выявятся фрагменты, не подтверждающиеся никакими источниками; 2) можно смотреть по отдельным источникам, что именно они подтверждают, и исходя из этого расставлять сноски. Котик полосатый (обс.) 22:29, 24 августа 2025 (UTC)[ответить]
Оценка тона статей с помощью нейросетей
Википедия:Форум/Общий#Оценка тона статей с помощью нейросетей и я заодно создала подстраничку и закинула ссылку туда, чтобы потом не искать инструмент — Проект:Искусственный интеллект/Оценка. Может ещё какие ссылочки туда покидаем, если есть что-то тоже для оценки. -- Megitsune-chan () 06:34, 19 сентября 2025 (UTC)[ответить]
|
|