大模型日报(12月19日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(12月19日 资讯篇)

行云季宇:谁困住了 AI 产业——大型机化的计算机形态与变革的可能性 | 奇绩潜空间活动报名

【奇绩潜空间】是 GenAI 时代冲得最快的一批科研学者/从业者/创业者聚集的 AI 人才社区,潜空间定期邀请大模型前沿创业者分享产品实践探索,邀请前沿科研学者分享最新技术进展。

第五季第二期潜空间邀请到的嘉宾是行云创始人兼 CEO ——季宇,在本次活动中季宇将在北京现场与大家面对面交流,他分享的主题是《谁困住了 AI 产业——大型机化的计算机形态与变革的可能性》。

大模型日报(12月19日 资讯篇)

资讯

01

开源生成式物理引擎Genesis,可模拟世界万物


生成式大模型的新时代,技术的发展正在跨越多个领域,包括文本、图像、音频、视频和3D对象的生成。最近,由CMU和其他20多个研究实验室联合开源发布的Genesis生成式物理引擎,标志着这一进程的一个重要突破。Genesis不仅能生成4D动态世界,还具备极快的并行模拟速度,比现有的GPU加速机器人模拟器快10到80倍,同时保持高精度的模拟效果。其核心特性包括超快的模拟速度、支持各种物理求解器、可微分的设计以及照片级真实感的渲染效果,极大地推动了机器人技术、物理AI以及生成式模拟的进步。
Genesis的生成式引擎能够根据用户的自然语言提示生成物理准确的多模态数据,如视频、相机运动、机器人任务和策略等,进而自动生成适用于机器人、物理AI等应用的海量数据。这使得机器人策略生成、复杂动作演示及其迁移到真实世界成为可能。其显著优势体现在GPU加速的物理引擎上,可以在短时间内生成高度复杂的机器人动作策略,并快速迁移到实际操作中。Genesis的模拟速度也非常惊人,单台RTX4090 GPU下模拟速度比实时快43万倍,可以训练出可迁移到实际机器人的运动策略。
此外,Genesis支持模拟各种材料和物理现象,包括刚体、铰接体、布料、液体、烟雾等,还能生成各种复杂的交互式3D场景。它可以模拟软体机器人与刚性机器人之间的交互,并提供了一个软机器人配置系统。通过生成式框架,Genesis能够快速生成不同环境中的机器人动作,包括处理真实世界中的物体交互,如机器狗的倒立、后空翻等高难度动作,甚至可以自动生成包括面部表情和情绪的音频和视觉数据。
作为一个全面的生成式物理模拟平台,Genesis不仅对机器人领域产生深远影响,还在游戏、动画制作等行业具有巨大的应用潜力。其开源发布不仅为研究人员提供了强大的工具,也吸引了大量社区的关注和参与。随着Genesis的不断发展,它有望成为通用数据引擎,为机器人技术和具身AI的未来奠定基础。
大模型日报(12月19日 资讯篇)
https://mp.weixin.qq.co‍m/s/b0yqPre6wMlP59cH6Qrbdw
02

深圳重磅AI利好!5亿元训力券,1亿元模型券,重奖爆款智能硬件产品

深圳市工业和信息化局于2024年12月19日发布的《深圳市打造人工智能先锋城市的若干措施》强调了通过资金支持和政策激励促进人工智能产业的发展。这些措施自发布之日起生效,有效期为两年,涵盖多个领域,旨在推动算力基础设施建设、人工智能技术应用、源头创新、产业环境优化以及人才培养。
首先,政策强调算力资源的供给,深圳将推进鹏城云脑III等先进算力设施建设,并为企业提供优惠价格的算力服务。每年还将发放最多5亿元的“训力券”支持大模型训练,资助比例可达50%,初创企业可享受更高的资助比例。此外,政策还提出发放5000万元的“语料券”,鼓励语料的开放共享和交易,企业可获得最高200万元的资助。
在人工智能行业应用方面,政策每年投入最多1亿元,用于支持人工智能模型应用,资助比例最高30%。此外,还计划推动人工智能在先进制造业、现代服务业等领域的应用,示范项目可获最高200万元资助,标杆项目可获高达1000万元资助。同时,政策还支持开发政务、教育、医疗等领域的人工智能应用,每年最高投入5000万元,并对相关企业提供最高500万元的资助。
源头创新方面,深圳将加大基础研究和技术攻关的支持,每年最高投入3亿元,用于人工智能核心技术的突破。重大项目最高可获1000万元资助,重点项目300万元,面上项目最高资助60万元。为了促进国产生态建设,还将支持人工智能生态创新中心,并对开源人工智能平台和工具给予奖励。
在产业发展环境优化方面,政策通过产业集聚、创新创业支持、人才培养等措施推动人工智能行业的发展。例如,人工智能中小微企业可享受免租优惠,初创企业可获得100万元至50万元不等的一次性创业资助。此外,还设立了人工智能产业基金,提供贷款贴息和担保费资助,降低企业融资成本。
大模型日报(12月19日 资讯篇)https://mp.weixin.qq.com/s/T_NAbrPVT6B0p0jbSLpP_g
03
元资助

全球GPU订单曝光,TOP 1微软一年买爆近50万块!xAI晒首批GB200提前过年

今年,微软成为全球最大英伟达GPU买家,购买了约48.5万块Hopper芯片,远超排名第二的Meta(22.4万块)。此外,xAI、亚马逊和谷歌也分别位列第三至第五。微软在全球GPU采购中占据主导地位,并大幅扩充其数据中心基础设施,投资OpenAI 130亿美元,以支持像Copilot这样的AI服务和Azure云平台。由于这些购买,英伟达的市值今年飙升至3万亿美元。
然而,尽管英伟达仍占据市场主导地位,其竞争对手也在加紧布局。AMD在AI芯片领域已有突破,Meta和微软分别采购了17.3万和9.6万块AMD MI300芯片。同时,科技巨头们纷纷加快自研AI芯片的步伐。谷歌的TPU、Meta的推理加速器芯片以及亚马逊的Trainium和Inferentia芯片正在挑战英伟达的市场地位。亚马逊已部署约130万块Trainium芯片,而微软则在自研加速器领域落后,已部署20万块Maia芯片。
在定制AI芯片领域,谷歌的TPU和亚马逊等公司自研的AI加速器正在快速增长。TPU的出货量甚至有可能首次从英伟达手中抢占市场份额,进一步加剧AI芯片市场的竞争。摩根士丹利预测,定制AI芯片市场将以超过GPU市场的速度增长,预计2027年市场规模将达到3000亿美元。
大模型日报(12月19日 资讯篇)
https://mp.weixin.qq.com/s/0CMoSyiTAkHuxpJhPFeQIQ
04
元资助

OpenAI新近离职首席研究官麦克格鲁大爆料:模型进展慢缘于数据中心建设慢、训练O1算力比GPT4高百倍

关于模型能力和发展瓶颈:
外界感知AI发展迅速,但GPT-4早已训练完成,导致外界误以为发展停滞。实际内部进展受限于算力增长,需要新的数据中心。
算力提升需要巨大的资源投入,算法改进带来的收益有限。
预训练模型的进展是持续的,O1(尽管未命名为GPT-5)代表着比GPT-4高百倍的算力。
未来进展的关键在于测试时间计算的改进,它能更高效地利用算力。
关于模型应用和产品形态:
现有聊天机器人已能满足日常对话需求,O1等更强模型需要新的应用场景才能体现价值。
编程和撰写长篇文档是O1的合适用例,因为它需要长而连贯的思维链。
模型作为代理执行长期行动,与现实世界互动,是未来重要发展方向,但仍需探索合适的应用场景。
关于智能体和企业应用的挑战:
智能体应用的最大障碍是可靠性,可靠性的提升需要数量级增长的算力。
企业应用需要模型访问企业内部的上下文信息,这需要构建连接器或使用计算机使用模型。
计算机使用模型面临与程序化API集成不同的挑战,需要更长的思维链和更多的token。
不同集成方式将在未来一段时间内共存。
关于多模态,特别是视频模型:
视频模型是多模态领域的重要突破,Sora是高质量视频生成的代表。
视频生成比图像生成更复杂,需要专门的用户界面和故事板等功能。
视频模型的训练和运行成本高,但未来成本会大幅下降,质量会进一步提升。
预计两年后会出现由AI生成的、值得观看的完整电影。
关于机器人技术:
基础模型的进步显著推动了机器人技术的发展,使得机器人能够更好地理解指令并泛化。
模拟器训练难以模拟软物体,现实世界的演示数据对于通用机器人至关重要。
对机器人技术的大规模消费者应用持谨慎态度,因为安全性是主要问题,但在特定领域(如仓库)的应用前景广阔。
关于AI进展和AGI:
AI的实际进展比预期的慢,因为人类工作的复杂性高于预期,很多任务难以自动化。
AI的价值在于自动化枯燥的任务,释放人类的精力去做更有创造性的工作。
AGI的到来可能是一个渐进的过程,不会有明显的突变,日常生活可能会在不知不觉中被AI改变。
推理能力的提升是通往AGI的关键挑战。
关于AI研究和OpenAI文化:
优秀AI研究人员的关键特质是毅力。
OpenAI的文化鼓励探索和合作,给予研究人员充分的自由。
OpenAI经历了多次转型,从非营利到营利,与微软合作,以及发布ChatGPT,这些都是关键的决策点。
加倍投入语言模型是OpenAI的一个重要战略决策。
关于AI的社会影响和未来:
AI将使智能成为免费资源,能动性将成为新的稀缺生产要素。
人类需要思考如何培养和利用能动性,与AI协同工作。
AI的进步将持续,并改变我们生活的方式,但核心技能的培养仍然重要。
大模型日报(12月19日 资讯篇)https://mp.weixin.qq.com/s/ore0_DywmwGunMq1rYRJmQ
05
元资助

AI改变数学的一年!黎曼假说、朗兰兹猜想,盘点2024年数学里程碑

2024年,数学界迎来了一系列重大突破,尤其是在几何、数论和人工智能领域。最为突出的成就之一是几何朗兰兹猜想的证明。这一猜想自20世纪80年代提出以来一直未解,直到今年5月,由9位数学家组成的团队最终提供了证明。几何朗兰兹猜想的解决不仅填补了数学中的一个巨大空白,还可能引领未来几十年的研究方向,促进不同数学领域之间的深刻联系。
此外,人工智能在数学领域的崭露头角也为2024年的研究注入了新的活力。谷歌DeepMind发布的AlphaGeometry模型及其升级版AlphaProof,在国际数学奥林匹克竞赛中取得了接近银牌的成绩,显示出AI在数学证明中的潜力。数学家们对AI作为“副驾驶”在原创研究中的应用寄予厚望,认为它将改变数学研究的方式。
在几何问题方面,2024年也取得了显著进展。关于“球堆积”问题,数学家们给出了新的解法,突破了75年来的瓶颈,虽然这并非最优解,但为高维空间中球体密集排列问题提供了新的思路。
另外,米尔诺猜想的反例也成为今年数学界的重大突破。该猜想涉及流形的曲率与形状之间的关系,经过50年的验证,三位数学家成功构造了反例,证明了该猜想是错误的。这一成果揭示了流形结构的复杂性,拓宽了数学家对宇宙形状的认知。
在数论领域,黎曼假说的研究迎来重要进展。MIT的Larry Guth与牛津大学的James Maynard在理解黎曼假说上取得突破,打破了80多年的纪录,为最终证明黎曼假说铺平了道路。同时,组合数学领域的Szemeredi问题也取得了久违的进展,标志着数学家们在理解无序与秩序的关系上迈出了关键一步。
大模型日报(12月19日 资讯篇)
https://mp.weixin.qq.com/s/UL75lq4HtnY79tzZtBRv9g
06
元资助

机器人与通信网络,织就智能脉络

内部通信系统是具身智能的“神经网络”,Ethernet有望成为内部通信传输标准化的最终方案。具身智能内部通信网络将传感器、控制器、执行器等元件连接在一起,实现传感器采集信息的回传、本地化信息处理后控制指令的传递。具身智能端到端的通信方式、复杂的本体构造、以及与所处环境实时高频的交互需求,对内部通信能力提出高实时性、高可靠性、抗干扰性、低功耗、支持多元数据传输等要求。现阶段,不同类型传感器以及运动控制系统对通信的需求不同,内部通信架构未统一,呈现多种通信传输协议如USB、CAN、Ethernet、EtherCAT等并存局面;展望远期,我们认为若具身智能内部需建立起标准化通信系统,朝着车载以太网演进的Ethernet有望成为内部通信一体化的最终解决方案:1)可持续迭代支持长期需求演进;2)具备产业链复用优势,产业规模扩大促进成本下降;3)轻量化部署利于减轻机器人负载和能耗,缓解供电问题;4)更利于OTA的实现。
外部通信能力是具身智能系统运行迭代的基石,蜂窝通信与WiFi、星闪有望长期共存。外部通信对具身智能而言不可或缺,端侧的数据需要上传至云端进行模型训练,而持续迭代的软件算法也有赖于通信网络实现OTA升级,此外,云-边-端算力协同、实时状态监控、接收指令及智能体间的协同也需要对外通信能力。其中,蜂窝网络低延时、高带宽、无线漫游的优势难以替代,长期会在各类场景需求中持续演进落地;Wi-Fi凭借低部署成本、自组网优势集中发力于无漫游需求的具身智能落地场景。我们认为,蜂窝网络与Wi-Fi有望长期共存,而星闪在技术层面与具身智能的需求高度契合,但当前的产业链成熟度较低,未来有望在国产替代诉求下,在部分场景或下游客户实现对WiFi的替代。
大模型日报(12月19日 资讯篇)https:‍//mp.wei‍‍xin‍.qq.com/s/DzAviLp9nPcOZTFk3YWHQg

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

1-800-ChatGPT 使用ChatGPT

1-800-ChatGPT

大模型日报(12月19日 资讯篇)

https://x.com/OpenAI/status/1869452381563527645
02 

tldraw推出 tldraw 电脑:无需编码,只需自然语言、无限的知识和“随心所欲”的体验

我们刚刚推出了 tldraw 电脑。
这是一个有趣的想法:想象一台依靠 AI 驱动的电脑。无需编码,只需自然语言、无限的知识和“随心所欲”的体验。
在 tldraw 电脑中,你可以创建由相互连接的组件组成的工作流,这些组件可以生成并传播数据。每个组件都可以将其他组件作为输入。所有的指令都以自然语言编写,让你能够以松散、奇特且出乎意料的方式处理数据。

大模型日报(12月19日 资讯篇)

https://x.com/XRarchitect/status/1869074516770714024
03

Copilot在VSCode中免费开放,为庆祝Github突破1.5亿开发者

GitHub 已突破 1.5 亿开发者 🎉 为此,我们将 GitHub Copilot 在 VS Code 上免费开放!包括聊天与代码补全、多文件编辑、多模型选择以及扩展支持,如 @perplexity_ai、@StackOverflow 等。
GitHub Copilot 与 VS Code 完美结合,免费使用!节日快乐,尽情编码吧。
GitHub Copilot 免费版现已登陆 VS Code

大模型日报(12月19日 资讯篇)

https://x.com/ashtom/status/1869456453410627838
04

KLING AI 1.6 模型推出:更新大幅提升了对提示的响应能力、视觉美感以及物理动作表现

🎉我们很高兴推出 KLING AI 1.6 模型!此次更新大幅提升了对提示的响应能力、视觉美感以及物理动作表现,希望为您带来更一致、更生动的效果!🔥
💡更新内容:
  1. 全新 KLING AI 1.6 模型:
• 提高了提示的适应性,结果更一致、更具动态表现力
• 支持标准模式和专业模式,相较于 KLING 1.5 模型整体性能提升 195%
  1. 升级版 KLING AI 1.5 模型:
• 支持标准模式以及 720p 文本转视频功能

大模型日报(12月19日 资讯篇)

https://x.com/Kling_ai/status/1869599147046871488
05

Odyssey正式发布 Explorer:首个生成式世界模型

今天是 @odysseyml 的大日子!
我们正式发布了 Explorer,这是我们的首个生成式世界模型。我们相信,世界模型是 AI 的下一个前沿领域,将开启令人惊叹的新可能。
为推动这一愿景,Pixar 的传奇创始人埃德·卡特姆尔(Ed Catmull)将加入我们的董事会并进行投资。

大模型日报(12月19日 资讯篇)

https://x.com/odysseyml/status/1869417873938219360

产品

01

Impakt AI 应用程序 能看、能说话、能指导的人工智能教练

Tempo 是一款专为 React 开发设计的可视化编辑器,为产品经理、设计师和工程师提供了一个能够在代码上进行可视化协作的平台。它融合了设计工具熟悉的用户体验,同时具备与 IDE 同等的底层功能,完美平衡了设计与开发的需求。Tempo 专门针对 Vite 和 Tailwind 进行了优化,为团队提供高效、流畅的工作流体验,让从设计到代码的转换更加直观和无缝。通过 Tempo,跨职能团队能够在同一个环境中快速迭代产品,真正实现协作效率的最大化。
大模型日报(12月19日 资讯篇)https://www.tempolabs.ai
02

Tempo 实验室 由 AI 提供支持的 React 可视化编辑器

Impakt 是一款智能 AI 健身教练,为用户提供个性化的锻炼指导和支持。通过先进的技术,Impakt 能够实时查看您的锻炼数据,全面跟踪和记录您的运动表现,深入分析关键指标,并为您提供科学的改进建议。无论是力量训练、耐力提升,还是减脂塑形,Impakt 都能根据您的个人目标和进度,定制出最适合的健身计划。它不仅是一款工具,更是日常生活中的贴心教练,让每一位用户都能像英雄一样,朝着更健康、更强壮的自己迈进。
大模型日报(12月19日 资讯篇)
https://www.impakt.com

投融资

01

AI初创公司Odyssey推出新工具:可生成逼真的3D世界

Odyssey是一家由自动驾驶领域的先驱Oliver Cameron和Jeff Hawke创立的AI初创公司,最近推出了一款名为Explorer的AI工具,能够将文本或图像转化为3D渲染效果。这款工具与DeepMind、World Labs和以色列初创公司Decart展示的世界模型相似,用户只需输入如“日本花园,绿意盎然的植被”等文字,Explorer就能生成互动式、实时的3D场景。
Explorer的特色在于其极为逼真的画面,这得益于Odyssey采用的技术路径。该工具的AI模型经过专门训练,使用了公司自制的360度背包摄像系统拍摄的真实世界景观图像。生成的场景不仅可以在Unreal Engine、Blender和Adobe After Effects等创意工具中进行后期编辑,还能够使用Gaussian splats这一传统的体积渲染技术进行精确的场景重建,兼容大多数计算机图形工具。
尽管Explorer目前仍处于早期阶段,且生成场景时需要大约10分钟,且画质较低,可能出现一些视觉瑕疵,但Odyssey已经将这一工具交给了包括英国Garden Studios在内的制作公司,并且吸引了越来越多的独立艺术家试用。
值得注意的是,Odyssey表示,尽管AI工具的应用可能会在视频游戏和电影行业引发争议(尤其是对于AI取代岗位的担忧),但公司致力于与创意专业人士合作,而非取而代之。为了加强这一承诺,Odyssey宣布,皮克斯联合创始人、前迪士尼动画总裁Ed Catmull已加入公司董事会,并投资Odyssey。
目前,Odyssey已经获得了来自EQT Ventures、GV和Air Street Capital等投资者的2700万美元融资。
公司官网:https://odyssey.systems/
大模型日报(12月19日 资讯篇)
https://techcrunch.com/2024/12/18/ai-startup-odyssees-new-tool-can-generate-photorealistic-3d-worlds/
02

Perplexity收购Carbon,连接AI搜索与工作文件

Perplexity宣布收购总部位于西雅图的初创公司Carbon,Carbon专注于将AI系统与外部数据源连接。Perplexity的CEO Aravind Srinivasan表示,这一收购将使Perplexity能够在2025年初通过AI搜索工具访问用户在Notion、Google Docs、Slack等企业应用中的文件和工作消息。
Carbon擅长“增强检索生成”(RAG)技术,允许大型语言模型在生成答案之前,访问外部数据库中的信息。通过整合Carbon的技术和团队,Perplexity不仅能够改进其AI答疑引擎,还可能为企业推出搜索产品,帮助员工快速检索公司多年来积累的大量非结构化数据。
Perplexity在声明中表示:“Carbon将使Perplexity的答疑引擎更容易从多种信息源获取数据,无论这些数据存在于内部数据库、云存储还是文档库中。”随着企业AI搜索市场的竞争日益激烈,Perplexity此举被认为是针对企业搜索需求的一次重要战略布局。
企业AI搜索正在成为AI领域的竞争焦点。根据报道,OpenAI在最新的66亿美元融资中明确要求投资者不能同时投资于现阶段领先的企业搜索公司Glean。Glean的成功吸引了包括OpenAI、谷歌等多家AI巨头的关注,并可能激发了Perplexity的收购计划。
这也是Perplexity的第二次收购,继2023年收购Spellwise后,后者的CEO被引入以开发Perplexity的移动应用。
大模型日报(12月19日 资讯篇)
https://techcrunch.com/2024/12/18/perplexity-acquires-carbon-to-connect-ai-search-to-your-work-files/
03

去中心化 AI 数据链项目 Masa 完成新一轮战略融资,DCG 领投

去中心化 AI 数据链项目 Masa 宣布完成新一轮战略融资,由灰度母公司数字货币集团 DCG 领投,FBG Capital 参投。本轮融资将用于扩展 Masa 的公平 AI 技术栈,包括:扩大实时数据网络规模、基于实时数据扩展 AI 代理生态系统、发展 Agent Arena SN59 作为 AI 代理竞技平台,以及建设开放社区让任何人都能构建智能自优化 AI 代理。DCG 曾在两年前参与了 Masa 的种子轮融资。
公司官网:https://www.masa.ai/
大模型日报(12月19日 资讯篇)
https://medium.com/masa-finance/masas-next-bold-move-introducing-the-fair-ai-universe-bd1867a979a1


推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/12/28986.html

Like (0)
Previous 2024-12-18 21:56
Next 2024-12-20 21:19

相关推荐