Гигант электронной коммерции Alibaba спешно выпустил Qwen 2.5-Max, пытаясь сохранить актуальность в быстро меняющейся индустрии. Компания утверждает, что эта обновленная модель превосходит ChatGPT, DeepSeek и Meta's Llama «практически по всем параметрам».
DeepSeek, созданный на более дешевых чипах и менее чем за 6 миллионов долларов, продолжает влиять на рынок. После его выхода на первое место в App Store Apple, рыночная капитализация Nvidia сократилась почти на 600 миллиардов долларов — крупнейшее однодневное падение в истории Уолл-стрит.
По заявлению Alibaba, модель получила высший балл 89,4 в бенчмарке Arena-Hard, оценивающем реакцию ИИ на человеческие подсказки. В тесте MMLU-Pro, проверяющем способность решать задачи уровня колледжа, Qwen 2.5-Max превзошел DeepSeek и сравнялся с ChatGPT.
DeepSeek также выпустил новое семейство мультимодальных моделей ИИ с открытым исходным кодом, которые, как сообщается, превосходят DALL-E 3 от OpenAI по ключевым показателям. Запуск Qwen 2.5-Max во время празднования Нового года по лунному календарю подчеркивает растущее напряжение среди китайских технологических компаний.