ПЕКИН, 29 января (Рейтер) - Китайская технологическая компания Alibaba (9988.ХК)
в среду выпустила новую его версию Модель искусственного интеллекта Qwen 2.5 утверждалось, что он превзошел широко известный DeepSeek-V3.
Необычное время выхода Qwen 2.5-Max в первый день Лунного Нового года, когда большинство китайцев не работают и живут со своими семьями, указывает на давление китайского стартапа в области искусственного интеллекта Стремительный взлет DeepSeek за последние три недели он столкнулся не только с зарубежными соперниками, но и со своими внутренними конкурентами.
"Qwen 2.5-Max превосходит... почти по всем направлениям GPT-4o, DeepSeek-V3 и Llama-3.1-405B", - говорится в объявлении, опубликованном в официальном аккаунте WeChat, облачного подразделения Alibaba, имея в виду самые передовые модели искусственного интеллекта OpenAI и Meta с открытым исходным кодом.
Выпуск 10 января ИИ-помощника DeepSeek, работающего на модели DeepSeek-V3, а также выпуск 20 января его модели R1 шокировали Кремниевую долину и привели к падению доли технологий среди китайского стартапа предположительно низкие затраты на разработку и использование побуждая инвесторов подвергать сомнению планы огромных расходов ведущих фирм, занимающихся искусственным интеллектом в Соединенных Штатах.
Но успех DeepSeek также привел к борьбе среди ее отечественных конкурентов за модернизацию собственных моделей искусственного интеллекта.
Через два дня после выхода DeepSeek-R1 владелец TikTok ByteDance выпустила обновление своей флагманской модели AI, который, по его утверждению, превзошел o1 OpenAI, поддерживаемый Microsoft, в AIME, эталонном тесте, который измеряет, насколько хорошо модели искусственного интеллекта понимают сложные инструкции и реагируют на них.
Это перекликалось с утверждением DeepSeek о том, что ее модель R1 конкурирует с o1 OpenAI в нескольких тестах производительности.
DEEPSEEK ПРОТИВ ВНУТРЕННИХ КОНКУРЕНТОВ

Знак Alibaba Group можно увидеть на Всемирной конференции по искусственному интеллекту (WAIC) в Шанхае, Китай, 6 июля 2023 года. REUTERS/Aly Song/Фото из архива Лицензирование покупки Права
Предшественник модели DeepSeek V3, DeepSeek-V2, запустил Ценовая война моделей ИИ в Китае после того, как он был выпущен в мае прошлого года.
Тот факт, что DeepSeek-V2 был с открытым исходным кодом и беспрецедентно дешев, всего 1 юань ($0.14) за 1 миллион токенов - или единиц данных, обрабатываемых моделью ИИ - привел к появлению облачного устройства Alibaba объявление о снижении цен до 97% на ряде моделей.
Другие китайские технологические компании последовали этому примеру, в том числе Baidu (9888.ХК), который выпустил Первый в Китае эквивалент ChatGPT в марте 2023 года и самая дорогая интернет-компания страны Tencent (0700.ХК).
Лян Вэньфэн, Загадочный основатель DeepSeek, заявил в редком интервью китайскому СМИ Waves в июле, что стартап "не заботился" о ценовых войнах и что достижение AGI (искусственного общего интеллекта) было его главной целью.
OpenAI определяет AGI как автономные системы, превосходящие людей в большинстве экономически ценных задач.
В то время как крупные китайские технологические компании, такие как Alibaba, имеют сотни тысяч сотрудников, DeepSeek работает как исследовательская лаборатория, в которой работают в основном молодые выпускники и докторанты ведущих китайских университетов.
Лян сказал в своем июльском интервью, что, по его мнению, крупнейшие технологические компании Китая могут не очень подходить для будущего индустрии искусственного интеллекта, противопоставляя их высокие затраты и нисходящие структуры бережливой работе DeepSeek и свободному стилю управления.
"Большие основополагающие модели требуют постоянных инноваций, возможности технологических гигантов имеют свои пределы", - сказал он.
Информационный бюллетень Reuters Daily Briefing предоставляет все новости, необходимые для начала дня. Зарегистрироваться здесь.
Комментариев нет:
Отправить комментарий