大模型日报(1月21日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

欢迎大家一起交流!

大模型日报(1月21日 资讯篇)

资讯

01

2025 AI 展望:Scaling Law新叙事加速 AI 变革

当前,我们正处于一场由AI驱动的技术革命的开端,ChatGPT代表了这波科技浪潮的标志,推动着第四次工业革命的到来。其核心在于基础模型的持续发展,而Scaling Law(规模法则)是推动这一变革的底层逻辑。然而,进入2025年,单纯堆算力和扩展模型规模的路径已经不再是唯一的选择,基础模型的迭代趋向阶段性收敛,Transformer架构逐渐成为统一的底层架构,生成模型的潜力仍未完全释放,预计将深刻影响科学研究等多个领域。
AI的发展路径主要围绕四种可能的实现通用人工智能(AGI)的途径展开:大模型、智能机器人、脑机接口和数字生命。大模型通过自学习和自我迭代逼近人类智能,而智能机器人则模拟生物智能体在开放环境中的自我学习,成为实现AGI的重要方式。脑机接口通过直接读取大脑信号实现人机协作,数字生命则通过算法仿真生命过程,从微观到宏观解锁智能本质。2024年AI技术取得了诸多关键进展,尤其是在视频生成、智能体应用、编程助手和具身智能等领域。视频生成模型,如Sora的出现,标志着这一技术从学术研究进入工业应用,推动内容生产和仿真技术的变革。智能体的发展通过Agent实现了更高效的系统控制和多模态交互,预计将带来人机交互和操作系统的革命。编程助手则通过自然语言输入,使编程更加普及化,成为AI时代不可或缺的基础工具。
在硬件和机器人领域,具身智能正在迎来新的爆发周期,尤其是人形机器人将成为AI时代的重要智能体,改变社会生产模式和人机协作方式。然而,机器人商业化的路径仍有不确定性,未来可能会随着技术成熟而加速发展。AI的发展将促使硬件成本下降,推动机器人产业的成熟。
AI发展的三大底层逻辑——Scaling Law、Transformer架构和生成模型,互为依托,逐步深入。Scaling Law将引领基础模型的发展,但其路径已不再单纯依赖算力的堆积,而是进入更加注重数据使用效率、架构设计和思维推理的阶段。Transformer架构因其对Scaling Law的良好适应性,已成为多种算法的统一基础架构,预计将在未来一段时间内继续主导AI技术的设计和应用。
随着AI技术的不断突破和基础设施的逐步完善,AI产业将在多个领域迎来百花齐放的局面。智能硬件、教育、医疗和数字仿真等领域将深受其益,尤其是在AI驱动的智能硬件和多模态交互技术的进步下,人机协作和AI在各行业的应用将迎来革命性的变化。
大模型日报(1月21日 资讯篇)
https://mp.weixin.qq.com/s/wxG6IXL-p9sGjMfY2zxUJQ
02

《2024 中国开源开发者报告》正式发布

在开发者生态方面,Gitee平台数据显示,2024年用户数达1350万,新增用户150万,总仓库数达3600万,新增500万。开源组织数量达40万,社区活跃度显著提升。编程语言方面,Java、JavaScript和Python仍占据主导地位,但TypeScript连续两年成为增长最快语言。开源许可证中,MIT和Apache-2.0最受欢迎,而木兰宽松许可证(MulanPSL-2.0)也逐渐成为主流。
报告指出,2024年中国开源模型在全球崛起,从学术到产业均取得显著成就。例如,智谱的GLM系列、阿里巴巴的Qwen系列和深度求索的DeepSeek系列在国际评测中表现卓越。中国开源社区的活跃度和协作能力显著提升,形成了国际化开源生态。同时,中国在监管层面建立了完善、透明的治理机制,为开源模型的发展提供了稳定的政策环境。
在开源大模型观点方面,报告探讨了开源模型的持久性、大模型面临的“算力墙”挑战、AI编程技术的发展、RAG技术的理性回归以及大模型训练中的开源数据和算法等关键议题。文章指出,开源策略是大模型的重要竞争策略,能够降低开发者生态的构建成本。同时,大模型的发展正面临算力、能耗和幻觉等问题,智能体(Agent)技术成为未来AI产品的重要发展方向。
在GenAI生态方面,报告总结了2024年中国GenAI消费应用人气榜Top10,涵盖AI通用会话、多媒体创作、编程、智能体工坊和文字内容效率等多个领域。同时,Gitee AI与天数智芯联合举办的创新应用大赛也展示了国内开发者在GenAI领域的技术实力和创新能力,推动了AI技术在更多领域的实际应用。
大模型日报(1月21日 资讯篇)https://mp.weixin.qq.com/s/0bgb1v_FzHOTVqgg0CNhKA

03
元资助

对话李昀烛:通用操作新解法——基于学习的动力学模型

基于学习的动力学模型(Learning-Based Dynamics Models)是机器人领域的一条创新路线,尤其是在解决通用操作问题时展现出潜力。这个方法与人类的直觉物理学相似,人类通过与环境的交互来学习并预测行为对环境的影响,例如捏面团或推咖啡豆等。通过学习预测模型,机器人也能模拟这一能力,从感官观测中学习如何预测物体的运动和形变,并据此制定行动计划。
这种学习方式的核心是通过直觉式物理学(intuitive physics)来建立对环境的预测能力,而不依赖复杂的物理公式。这种方法在复杂的操作任务中尤为重要,尤其是处理如刚体、可变形物体等多种物质的交互时。基于学习的模型通过神经网络代替传统的物理公式,可以在缺乏完整物理信息的情况下,依然有效预测和控制机器人行为。
与传统物理模拟器相比,学习模型能更灵活地应对环境中未完全理解的部分。例如,学习模型能够通过与世界的多次交互,逐步积累经验并调整预测能力。尽管这种方法的泛化能力可能较物理模型稍弱,但它的优势在于不依赖所有环境数据,能够从感官数据直接学习。这使得基于学习的动力学模型在实际应用中比传统模拟器更为高效和可扩展。
在具体实现上,模型结构可能涉及图神经网络(GNN)或Transformer等,这些方法能够处理复杂的物体交互关系。比如,粒子作为物体的表示方式在处理可变形物体时效果尤为突出。此外,学习模型与强化学习(RL)、模仿学习等技术相结合,能够通过优化行为预测来提升机器人操作的精度和效率。
大模型日报(1月21日 资讯篇)
https://mp.weixin.qq.com/s/rQ_SiqzxlOvu22X8AAYjiw

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格

DeepSeek-R1:性能媲美OpenAI-o1,完全开源的模型和技术报

DeepSeek-R1来了!
性能媲美OpenAI-o1
完全开源的模型和技术报告
MIT许可:自由提取和商业化!
官网和API现已上线!立即访问 DeepThink 体验吧!
大模型日报(1月21日 资讯篇)
https://x.com/deepseek_ai/status/1881318130334814301

02 

Jim Fan评DeepSeek R1:真正开放的前沿研究,赋能所有人;是自我反思和探索行为的涌现


我们正生活在一个令人难以置信的时间线上:一家非美国公司正在延续 OpenAI 最初的使命——真正开放的前沿研究,赋能所有人。这几乎不可思议,但最有趣的结果往往最可能发生。

DeepSeek-R1 不仅开源了一系列模型,还公开了所有训练的秘密。他们可能是第一个展示 RL 飞轮显著且持续增长的开源项目。
影响力可以通过“内部实现的ASI(人工超级智能)”或类似“Project Strawberry”这样的神秘项目实现。
影响力也可以通过简单地共享原始算法和 matplotlib 绘制的学习曲线来实现。
我正在阅读这篇论文:
完全由 RL 驱动,没有任何 SFT(监督微调)过程(“冷启动”)。这让我想起 AlphaZero——从零开始掌握围棋、将棋和国际象棋,而不是先模仿人类棋圣的动作。这是论文中最重要的亮点。
使用由硬编码规则计算的真实奖励,避免任何 RL 容易“作弊”的学习型奖励模型。
随着训练的进行,模型的思考时间稳步增加——这并非预先编程的,而是一种涌现特性!
自我反思和探索行为的涌现。
使用 GRPO 替代 PPO:GRPO 移除了 PPO 的价值网络,改用多个样本的平均奖励。这是一种简单的方法,可以减少内存使用。值得注意的是,GRPO 也是 DeepSeek 团队在 2024 年 2 月发明的……这支团队真是太强了。
大模型日报(1月21日 资讯篇)
https://x.com/drjimfan/status/1881353126210687089

 投融资

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

Metropolis以1.25亿美元收购Oosto(前AnyVision)加强AI视觉技术


AI停车平台Metropolis已收购计算机视觉公司Oosto(前身为AnyVision),交易价值1.25亿美元,约为Oosto曾筹集的3.8亿美元投资的三分之一,且远低于其巅峰估值。这笔全股交易将帮助Metropolis增强其计算机视觉技术,尤其在停车领域的应用。Oosto的核心技术和团队将被整合,Oosto的CEO Avi Golan和CTO Dieter Joecker也将加入Metropolis,担任高级职务。Oosto的投资者,包括软银、Lightspeed、DFJ和Eldridge Industries等,将收到Series D优先股。

Metropolis成立于2018年,主要为停车场提供无接触支付系统,现已在4000个地点使用其技术,每年处理约50亿美元的支付。Metropolis正在以接近50亿美元的估值进行融资,并计划将Oosto的技术整合进现有业务,增强其安全与监控系统。此次收购标志着Oosto在经历数年争议后走向终结,特别是在以色列政府的监控技术丑闻曝光后,Oosto失去了微软等战略投资者。尽管如此,Oosto曾在2021年通过软银和Eldridge领投的一轮融资筹得2.35亿美元,并进行品牌重塑,但依然未能克服经营困境,最终年度营收约为2000万美元。
Metropolis的2019年融资为1.7亿美元,部分用于收购停车技术公司SP Plus。此次收购Oosto后,Metropolis将把Oosto的技术专注于其核心停车业务,未来可能扩展到更多应用场景,如汽车自取服务等。这一收购符合两家公司在AI驱动的计算机视觉和安全解决方案领域的技术互补,预计将推动智能城市管理和公共安全领域的进一步发展。

大模型日报(1月21日 资讯篇)

https://techcrunch.com/2025/01/20/sources-ai-vision-startup-metropolis-is-buying-oosto-formerly-known-as-anyvision-for-just-125m/



推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/01/36491.html

Like (0)
Previous 2025-01-21 15:53
Next 2025-01-22 18:32

相关推荐