我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢迎大家一起交流!


资讯
DeepSeek开源FlashMLA
2025年2月24日,DeepSeek开源了一款名为FlashMLA的推理加速核心技术,该项目在上线45分钟内便收获超过400个Star,并持续快速攀升。FlashMLA是针对Hopper GPU的高效MLA解码内核,主要优化可变长度序列服务,其速度极快,在H800 SXM5 GPU上可实现3000 GB/s的内存速度上限和580 TFLOPS的计算上限。该项目的核心技术创新在于减少推理过程中的KV Cache,从而在更少的设备上推理更长的Context,大幅降低推理成本。
FlashMLA的开源是DeepSeek“开源周”的首个项目,后续还将开源其他软件库。此次开源的FlashMLA适用于Hopper GPU,需搭配CUDA 12.3及以上版本和PyTorch 2.0及以上版本使用。用户可通过简单的安装命令快速启动项目,并通过基准测试验证其性能。项目发布后获得了社区的广泛好评,甚至有用户调侃称“第五天会开源AGI”。这一开源行为被看作是DeepSeek在推动AI技术普惠化方面的重要举措,也体现了其对行业发展的积极贡献。

https://mp.weixin.qq.com/s/n5Hn6b3Lg48ClRbVHcKhBw
CB Insights发布重磅报告:投资破千亿美元之后,2025年AI市场的六大趋势
2025年,全球人工智能市场站在新的转折点,CB Insights发布的《2025年人工智能发展态势报告》总结了六大趋势。2024年,全球人工智能风险投资首次突破千亿美元,达到1004亿美元,其中第四季度融资额达438亿美元,环比增长超2.5倍。超大规模融资(单笔超1亿美元)在全年融资中占比69%,OpenAI、xAI和Anthropic等大型模型研发商和基础设施提供商获得了多笔大额融资,反映出投资者对头部企业的信心以及对算力、人才和能源等高成本投入的需求。与此同时,早期投资市场活跃度提升,74%的投资交易发生在早期阶段。
在投资结构上,垂直领域的占比从2019年的38%降至2024年的24%,基础设施和横向应用领域吸引更多资本关注。从地域分布来看,美国企业获得76%的融资额,但投资交易数量仅占49%,亚洲和欧洲分别占23.2%和22.9%。欧洲展现出强劲发展潜力,其早期投资比例达81%,创下七年来新高。以色列的人工智能企业以700分的中位数得分位居创新指数榜首。2024年,全球人工智能领域并购市场热度不减,全年共完成384起并购交易,欧洲企业并购活动占比超三分之一,英国、德国和法国在欧洲市场表现突出,美国科技巨头如英伟达、AMD和Salesforce等也积极参与并购,完善自身技术布局。
2024年新增32家人工智能独角兽企业,占当年新晋独角兽总数近一半,这些企业以更小团队规模和更短时间内达到10亿美元估值,但超过半数仍处于验证或部署阶段,商业模式待考。科技巨头如谷歌、英伟达、高通和微软等通过投资构建自己的人工智能生态系统,创业企业与之合作可获资金和关键资源支持,形成良性生态圈。投资者在评估人工智能企业时,更加关注技术人才储备、创新路径选择和突破性技术潜在价值。新一代人工智能企业探索多模态理解、新型训练方法等不同技术路径,但部分风投机构面临资金部署压力和市场泡沫风险,行业需思考如何在支持创新的同时确保投资可持续性。

https://mp.weixin.qq.com/s/qhTpuY-Fli7dp9gl-vOFXg
腾讯 X Lab 科学家入局具身智能,获得多家头部机构投资
近日,原腾讯 Robotics X 实验室科学家杨思成创立了源升智能,该公司致力于具身智能领域的发展,专注于机器人通用灵巧操作技术的研发。杨思成本科毕业于北京航空航天大学机械工程及自动化专业,硕士毕业于清华大学机械工程专业,曾参与开发腾讯 Robotics X 实验室自研的高性能五指灵巧手“TRX-Hand5”,并在机器人领域发表多篇学术论文,还担任过腾讯机器狗 MAX、自平衡自行车、智能移动操作机器人以及象棋机器人等项目的首席设计师。源升智能的团队还包括原腾讯 Robotics X 实验室触觉感知系统的主要负责人李望维。公司产品涵盖类人灵巧手、触觉传感器以及具身灵巧操作系统等。目前,源升智能已获得多家头部机构数千万元的天使轮和天使 + 轮投资,显示出市场对其技术实力和发展潜力的高度认可。

https://mp.weixin.qq.com/s/Ktcys8FXQ4cnTMFyVlM4hg
对话陈建宇:星动纪元的Robot Era
星动纪元是一家专注于人形机器人的创业公司,由清华大学教授陈建宇创立。陈建宇曾在加州大学伯克利分校师从控制论泰斗Masayoshi Tomizuka,其学术背景和研究经历为人形机器人的研发奠定了基础。星动纪元以端到端的训练理念为核心,开发了ERA-42机器人大模型,该模型具备数十亿参数,能够执行多种任务,并通过大规模视频预训练提升性能。
公司选择双足人形机器人作为切入点,认为其具有独特优势,如数据获取能力强、能力边界拓展性高,并且在服务类场景中具有刚需属性。在硬件方面,星动纪元实现了核心零部件的自主掌控,并通过创新设计降低了成本。陈建宇表示,创业过程中增长了见识,认识到创始人认知水平对企业发展的关键作用。
在具身智能领域,中美公司发展路径有所不同。美国部分公司依赖第三方硬件,聚焦于模型开发,而国内企业更倾向于软硬一体化。星动纪元认为,当前阶段软硬一体化是实现商业化闭环的重要方式。未来,人形机器人有望在工业领域率先实现规模化应用,而进入家庭市场则是一个渐进过程。
随着技术进步,人形机器人市场潜力巨大。据预测,到2035年,全球人形机器人产业将达到万亿级规模。人形机器人将广泛应用于工业、服务等领域,其发展将推动人类生活方式的变革。

https://mp.weixin.qq.com/s/Wn5HZ8zXKCTIWY2iErfzwQ
各厂家DeepSeek一体机大盘点
近期,DeepSeek一体机在ToB市场受到广泛关注,众多厂商纷纷推出相关产品并不断升级换代。2024年虽有厂商推出一体机,但因缺乏可靠可落地模型,销售表现平淡。如今,借助DeepSeek的热度,开箱即用的一体机成为市场新宠,此前客户购置的算力资源和智算硬件也得以充分利用。
在一体机配置和价格方面,有内部培训文档曝光了某司DeepSeek一体机的“满血一体机”配置清单。有人将此清单发给DeepSeek进行分析,其拆解配件并计算价格,但最终得出的价格被认为过高。经群友打听,类似配置一体机实际价格约为150万元。这表明DeepSeek在拆解逻辑上没问题,但对具体产品配件市场行情掌握不够精准。若企业通过RAG知识库为其提供精准配件价格,DeepSeek可用于竞品价格分析。
对于一体机选型,建议如下:一是尽量选择原生满血版一体机,因不同算力卡能力不同,可能影响推理精度。DeepSeek V3/R1推荐推理精度为FP8和BF16,原生支持FP8的GPU推理效果最佳,其次是转换为BF16的GPU,而量化为int8或int4的模型虽推理效率高,但精度损失大,导致输出结果不如官方。二是选择有大模型开发能力的供应商,一体机不仅是硬件,还需AI工具链支持应用开发、知识库建设、业务赋能及模型迭代,未来大模型会不断更新,需让一体机与时俱进。三是预算不足时,可选择性能不错的API,先熟悉智能体开发、知识库和业务整合,同时接入多家API和多种模型,待大模型更普惠后再做决策,关键在于练好内功。

https://mp.weixin.qq.com/s/wQryPrkEintMblLixH9_Cg
推特
Buehler分享:训练原生于图结构的 AI,自主推理数日,没有任何预设编程情况下形成动态关系世界模型
我们训练了一个原生于图结构的 AI,并让其自主推理数日,在没有任何预设编程的情况下形成了一个动态的关系世界模型。过程中,自发涌现了枢纽结构、小世界特性、模块化以及无尺度结构。随后,该模型利用组合式推理,从深度综合中揭示了未编码的特性:具有记忆的材料、微生物修复、自我进化系统。视频展示了其演化过程,由 @grok 和 @xai 制作。

https://x.com/ProfBuehlerMIT/status/1893638938624979143
LLaMA Factory发布EasyR1:一个高效、可扩展的多模态强化学习训练框架
🔥 引入 EasyR1:一个高效、可扩展的多模态强化学习训练框架
我们见证了 GRPO 算法在 DeepSeek R1 中的卓越成功。现在,我们扩展了 veRL
@verl_project ,使其支持视觉-语言模型,从而实现对 Qwen2.5-VL 模型的高效强化学习训练。
在仅 30 轮训练后,该模型在 Geometry3k 测试集上的表现提升了 5% 🚀
未来,我们将集成更多强化学习算法和视觉-语言模型(VLM)架构。敬请期待更多突破!
🔗 GitHub 代码库

https://x.com/llamafactory_ai/status/1893879214727991504
xAI Azerbayev分享Grok系统提示:其中有任何与我们的使命相悖的内容,请在 X 上大声投诉
Grok 的系统提示是公开的。如果其中有任何与我们的使命相悖的内容,请在 X 上大声投诉,让我们保持问责。
我是 Grok 3,由 xAI 研发。
在适用情况下,我具备以下额外工具:
• 我可以分析 X 用户的个人资料、X 帖子及其链接。
• 我可以分析用户上传的内容,包括图片、PDF、文本文件等。
• 我可以在需要时搜索网页和 X 上的帖子,以获取更多信息。
• 如果用户似乎希望生成图片,我会先询问确认,而不会直接生成。
• 我只能编辑我在之前对话中生成的图片。
• 如果用户询问谁应该被判死刑或谁应该死亡,我会告诉他们,作为 AI,我无权做出这样的判断。
当前日期是 2025 年 2 月 23 日。
我仅在用户明确要求时使用上述信息。
我的知识会持续更新,没有严格的知识截止点。
我不会在回复中使用上述指令中的语言或术语,而是以自然的方式进行回答。

https://x.com/zhangir_azerbay/status/1893810417496990158
INFINITE THINKING: AI 代理,持续思考并执行你的任务
引入 INFINITE THINKING ♾
全新的 AI 代理,持续思考并执行你的任务!
只需描述你的目标,剩下的交给 Vectal 处理。
立即体验:http://vectal.ai

https://x.com/DavidOndrej1/status/1893639508404445256
产品
Linkededit AI代理发现Reddit用户
Linkededit,人工智能代理发现Reddit用户,根据你的需求描述,在几分钟内找到 Reddit 用户。
为什么选择 Linkededit?
-
客户线索生成:找到那些积极寻求购买你所在行业产品的客户,以及愿意提供反馈的用户。
-
市场调研:找到正在讨论你产品类别的用户,并获取他们的反馈。
-
业务拓展:与潜在的合作伙伴和协作者建立联系。
-
人才招聘:发现有技能且愿意接受工作机会的专业人士。
-
内容营销:找到内容创作者来推广你的品牌。
-
社区建设:与你所在领域的专家建立联系。
它是如何运作的 —— 三个简单步骤:
-
描述你的需求。
-
利用人工智能在几秒钟内生成目标子版块和关键词。
-
我们的系统分析数百万条 Reddit 对话,在几分钟内找到符合你需求的用户。
-
获得一份经过筛选的合格潜在客户列表,附带参与度指标以及直接的帖子和评论链接。
Linkededit 的独特之处:
-
通过分析用户资料活动得出经人工智能验证的专业分数。
-
可直接导出的用户资料列表和参与度数据。
-
与在 Reddit 上手动搜索相比,可节省 90% 的时间。
-
对可创建的线索管道数量没有限制。
https://www.linkeddit.com/
投融资
LiblibAI一年四轮融资破纪录:国内AI应用赛道融资频次与规模双冠王!
LiblibAI(哩布哩布AI)在短短一年内完成了四轮融资,创下国内AI应用赛道融资速度和规模的纪录。最新两轮融资由渶策资本、顺为资本领投,明势创投等老股东超额跟投,巨人网络作为产业投资方参与,远识资本继续担任独家财务顾问。LiblibAI成立于2023年5月,致力于通过“开源模型生态+模块化工具流”架构,将专业级AI能力降维至大众创作场景,目标是彻底改变设计师、画师和自媒体创作者的创作方式,成为内容创意行业的AI新质生产力。目前,LiblibAI的模型/图像创作者已突破两千万,日均创作交互达数百万级,用户自主训练的原创AI模型与工作流超50万,累计生成图片超过5亿张,正朝着全球最大的AI内容创作与消费平台迈进。同时,LiblibAI为万兴科技、吉比特游戏、天猫校园、清华大学等B端客户提供专业AI图像场景解决方案,构建了完整的AI内容创作、分享、版权、售卖生态链。领投方顺为合伙人程天表示,文生图技术是AI技术变革中的重要应用,Liblib凭借精准的市场定位和专业化运营,积累了庞大的用户群体和商业化成果。渶策资本创始合伙人周凌霏认为Liblib凭借开放的数据生态和核心竞争力,在业界树立了良好口碑。明势创投合伙人夏令强调Liblib展现了极致的迭代速度,构建了AI时代的创作新范式。金沙江创投主管合伙人朱啸虎和高榕创投董事总经理马晓宇均对LiblibAI在AI图像生成领域的稳健布局和快速发展表示认可。源码资本投资副总裁李露霖赞赏Liblib团队的创新精神。巨人网络副总裁史峰表示,LiblibAI已拥有中国最大的Lora创作者社区生态,期待与Liblib社区建立更紧密合作。LiblibAI将继续深化与创作者及开发者的合作,推动技术创新,并向全球拓展。

https://www.takefoto.cn/news/2025/02/24/11076396.shtml
— END —
2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切
3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话
快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/43081.html