Меню
Главная
Случайная статья
Настройки
|
Qwen (также называемая Tongyi Qianwen, кит. упр. ) — семейство больших языковых моделей, разработанных Alibaba. В июле 2024 года модель была признана лучшей китайскоязычной моделью по некоторым тестам и заняла третье место в мире после топ-моделей Anthropic и OpenAI. Qwen является частью семейства моделей, которые конкурируют с другими крупными языковыми моделями, такими как GPT от OpenAI и PaLM от Google.
Последняя версия Qwen — Qwen 3 — это передовая языковая модель, разработанная для решения широкого спектра задач в области искусственного интеллекта. Она выделяется способностью к генерации кода, многозадачностью и поддержкой более 29 языков, что делает её универсальным инструментом для различных отраслей, включая разработку ПО, анализ данных и образование[1].
Содержание
История модели
Alibaba впервые представила бета-версию Qwen в апреле 2023 года под названием Tongyi Qianwen[2]. Модель была основана на LLM LLaMA, разработанной Meta AI, с различными модификациями. Она была публично выпущена в сентябре 2023 года после получения одобрения со стороны китайского правительства. В декабре 2023 года компания выпустила в открытый доступ модели 72B и 1.8B, а Qwen 7B была открыта в августе[3].
В июне 2024 года Alibaba запустила Qwen 2, а в сентябре выпустила некоторые её модели в открытый код, сохранив при этом самые передовые версии закрытыми[4]. Qwen 2 использует модель Смешение экспертов[5].
В ноябре 2024 года была выпущена QwQ-32B-Preview — модель, ориентированная на логические рассуждения, аналогичная o1 от OpenAI. Она была выпущена под лицензией Apache 2.0, но при этом были обнародованы только веса, без датасета и метода обучения.[6][7] QwQ имеет контекстную длину в 32 000 токенов и превосходит o1 по некоторым тестам[8].
Серия Qwen-VL представляет собой линейку визуально-языковых моделей, которые объединяют трансформер визуального восприятия с LLM[9]. Alibaba выпустила Qwen-VL2 с вариантами на 2 и 7 миллиардов параметров. Флагманской моделью компании в области компьютерного зрения является Qwen-vl-max, которая продаётся через Alibaba Cloud по цене 0,00041 доллара США за тысячу входных токенов[10].
Alibaba также выпустила несколько других типов моделей, таких как Qwen-Audio и Qwen2-Math[11]. Всего компания открыла исходный код более 100 моделей, а их модели были загружены более 40 миллионов раз[12]. Энтузиастами были разработаны дообученные версии Qwen, такие как «Liberated Qwen», созданная компанией Abacus AI из Сан-Франциско. Эта версия позволяет отвечать на любые запросы без ограничений на содержание[13].
В апреле 2025 года Alibaba запустила Qwen 3.
В июне 2025 года была представлена модель Qwen VLo, которая, помимо создания новых, также может редактировать уже существующие изображения. А благодаря технологии прогрессивной генерации пользователь может наблюдать за созданием изображения в режиме реального времени[14].
В августе 2025 года была представлена модель генератор изображений Qwen Image[15] с полностью открытым исходным кодом.
Возможности- Обширная база знаний — модель обучена на 18 триллионах токенов, что обеспечивает глубокое понимание контекста и позволяет интерпретировать сложные запросы[16].
- Расширенные окна контекста — обработка данных до 128 000 токенов позволяет работать с большими документами и сложными задачами[17].
- Продвинутая генерация кода — вариант модели Qwen2.5-Coder предназначен для написания, анализа и оптимизации программного кода[18].
- Многоязычная поддержка — более 29 языков, включая русский, английский, китайский, французский, испанский и другие[19].
- Улучшенные математические способности — специализированная версия Qwen2.5-Math справляется с многошаговыми вычислениями и аналитическими задачами[20].
- Высокая производительность: модель оптимизирована для работы в облачной среде, что позволяет ей быстро обрабатывать запросы даже при больших нагрузках.
- Интеграция с облачными сервисами: Qwen легко интегрируется с другими продуктами Alibaba Cloud, что делает её удобным инструментом для разработчиков.
- В чат-бот Qwen добавили голосовой режим и возможность просматривать камеру[21].
- Alibaba выпустила новую версию открытой модели искусственного интеллекта Qwen2.5-Omni-7B, которая предназначена для создания доступных по цене «умных агентов». Эта мультимодальная модель умеет обрабатывать текст, изображения, аудио и видео, а затем отвечать письменным текстом или естественной речью. Использовать её можно без значительных вычислительных ресурсов — на смартфоне или планшете[22].
Применение- Разработка программного обеспечения — автоматическая генерация кода, отладка, документация.
- Анализ данных — обработка больших наборов данных, математические вычисления, отчёты.
- Образование — создание учебных материалов, помощь в исследовательских работах.
- Бизнес — оптимизация процессов, взаимодействие с клиентами, бизнес-аналитика[23].
- Маркетинг: генерация текстов для рекламных кампаний.
См. также
Ссылки
Примечания
- Qwen 2.5 Overview (неопр.). Alibaba Cloud. Дата обращения: 29 января 2025.
- Chiang, Sheila. Alibaba to roll out its rival to ChatGPT across all its products (англ.). CNBC (11 апреля 2023).
- Jiang, Ben. Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI (англ.). South China Morning Post (13 сентября 2023).
- Jiang, Ben. Alibaba says new AI model Qwen2 bests Meta's Llama 3 in tasks like maths and coding (англ.). South China Morning Post (7 июня 2024).
- Yang, An; et al. (10 сентября 2024). Qwen2 Technical Report. arXiv:2407.10671 [cs.CL].
- Franzen, Carl. Alibaba claims no. 1 spot in AI math models with Qwen2-Math (неопр.). VentureBeat (8 августа 2024).
- . QwQ AI MATH OpenAI o1 - IT (неопр.). www.ithome.com (28 ноября 2024).
- Wiggers, Kyle. Alibaba releases an 'open' challenger to OpenAI's o1 reasoning model (неопр.). TechCrunch (27 ноября 2024).
-
- Jiang, Ben. Alibaba's open-source AI model tops Chinese rivals, ranks 3rd globally (англ.). South China Morning Post (11 июля 2024).
- Dickson, Ben. Alibaba releases Qwen with Questions, an open reasoning model that beats o1-preview (неопр.). VentureBeat (29 ноября 2024).
- Kharpal, Arjun. China's Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool (англ.). CNBC (19 сентября 2024).
- Mims, Christopher. Here Come the Anti-Woke AIs (неопр.). WSJ (19 апреля 2024).
- Alibaba представила ИИ-модель Qwen VLo, которая умеет редактировать картинки (неопр.). 3dnews.ru (28 июня 2025). Дата обращения: 30 июня 2025.
- Qwen Image (рус.). Qwen Image. Дата обращения: 6 августа 2025.
- Qwen 2.5 Training Data (неопр.). Alibaba Cloud. Дата обращения: 29 января 2025.
- Qwen 2.5 Context Length (неопр.). Alibaba Cloud. Дата обращения: 29 января 2025.
- Qwen 2.5 Coding Capabilities (неопр.). Alibaba Cloud. Дата обращения: 29 января 2025.
- Qwen 2.5 Multilingual Support (неопр.). Alibaba Cloud. Дата обращения: 29 января 2025.
- Qwen 2.5 Math Capabilities (неопр.). Alibaba Cloud. Дата обращения: 29 января 2025.
- Карпова, Ася. В китайский чат-бот Qwen добавили голосовой режим и возможность просматривать камеру — AI на vc.ru (англ.). vc.ru (28 марта 2025). Дата обращения: 31 марта 2025.
- Alibaba представила новую модель искусственного интеллекта серии Qwen (рус.). Хайтек+. Дата обращения: 31 марта 2025.
- Qwen 2.5 Use Cases (неопр.). Alibaba Cloud. Дата обращения: 29 января 2025.
|
|