本周焦点:Grok 4 & Grok 4 Heavy, Devstral Small 1.1 & Medium 2507, 月之暗面Kimi K2, Perplexity Comet浏览器, LFM2, Reka Flash 3.1, Reka Vision, SmolLM3, Reachy Mini, LTX-Video LoRAs, Moonvalley Marey。
一、重磅工具Grok 4——的“王炸与豪赌”
新闻:在一场直播发布会中,xAI团队与埃隆·马斯克(Elon Mus)重磅推出了Grok 4,宣称其是“全球最智能模型”,并展示了该模型在各项基准测试中的顶尖(SOTA)表现。他们还发布了多智能体变体Grok 4 Heavy,该变体能让多个智能体协作运行Grok 4,并从各自独立运行的结果中筛选出最优解。Grok 4的发布堪称重磅新闻,重新定义了AI模型性能与规模化的标杆。
· “人类终极测试” (Humanity's Last Exam):Grok 4在无工具辅助的情况下得分率为26.9%,使用工具