大模型日报(11月16-17日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(11月16-17日 资讯篇)

资讯

01

MIT在虚拟环境中训练出机器狗

机器人学习的核心瓶颈在于数据不足。相比于图片和文本数据,机器人学习所需的高质量、真实场景数据收集成本高昂且过程繁琐。现有方法依赖物理仿真环境,但要实现与真实世界接近的多样性仍面临诸多挑战:
  1. 渲染成本高:生成逼真场景需要细致的手工制作。
  2. 迁移脆弱性:模拟训练的机器人在现实中表现有限。
  3. 场景多样性不足:缺乏高质量多样化内容限制了性能提升。
LucidSim解决方案:MIT团队提出的LucidSim框架创新性地使用生成模型为机器人学习提供虚拟训练数据,并通过以下关键技术提升机器人学习的效率与泛化能力:
  1. 生成数据作为训练源:利用生成模型生成多样化的场景,替代传统手动收集的物理数据。
  2. 物理与几何一致性:通过增强的ControlNet模型引导生成场景,与物理引擎MuJoCo保持几何一致性,从而实现精准的sim-to-real(模拟到现实)迁移。
  3. 视觉策略训练:分两个阶段优化策略:
    1. 预训练:使用特权教师策略引导初始模型。
    2. 后训练:通过on-policy数据增强闭环训练,提高策略稳健性。
  4. 视频生成与动态一致性:引入Dreams In Motion(DIM)技术,以计算光流扭曲生成的帧,快速生成时间一致的视觉序列,支持机器人运动规划。
实验与结果:团队在机器人视觉跑酷场景中测试LucidSim,通过以下指标验证其效果:
  1. 模拟性能:LucidSim优于传统域随机化方法,特别是在复杂场景(如障碍攀爬)中表现显著。
  2. 现实迁移:在现实场景中,LucidSim能识别多种目标物体,表现出色。
  3. 训练效率:DIM加速生成速度,显著减少数据准备时间,性能仍保持一致。
  4. 数据多样性权衡:优化了生成图像的几何准确性和细节丰富度,在动态一致性和多样性之间取得平衡。
技术潜力与展望:LucidSim展示了生成模型在机器人学习领域的巨大潜力,解决了传统物理仿真方法的多样性和迁移挑战。未来,该方法有望拓展至更多应用场景,如复杂的具身智能任务和现实世界的操作控制,为通用机器人学习奠定基础。
大模型日报(11月16-17日 资讯篇)
htt‍ps://mp.weixin.qq.com/s/0SXPOvFPFo4f7rphxbUuwA
02

首个自主机器学习AI工程师,刚问世就秒了OpenAI o1

近日,一家名为NEO的创业公司发布了首个完全自动化的机器学习工程师AI系统,震撼了AI社区。NEO以26%的奖牌率在50场Kaggle竞赛中表现卓越,超越了OpenAI最新的o1模型,展现了其在机器学习工程中的卓越能力。
技术亮点与突破:
  1. 多智能体架构:NEO采用多智能体系统,将机器学习工程复杂流程拆解为多个独立部分,由专门优化的子模型分别处理。这种模块化设计显著提高了流程效率。
  2. 自动化全流程:从数据准备到模型选择,再到部署和监控,NEO可实现全自动化。通过结构化的计划、编码、执行和调试循环,它持续优化每一步骤,显著减少开发人员的手动工作。
  3. 高效数据处理:NEO在数据预处理阶段表现突出,自动完成缺失值处理、异常值修复和格式标准化,为模型训练提供高质量数据输入。
  4. 强大任务适应性:NEO展示了其在多任务场景中的适应能力,如自动构建信用卡欺诈检测系统和优化协同过滤书籍推荐模型的数据管道。
  5. 卓越竞赛表现:在MLE-bench基准测试中,NEO通过在50场实际Kaggle竞赛中测试,26%的奖牌率大幅领先o1的16.9%,达到了堪比Kaggle特级大师的水平。
  6. 与人类协作:NEO并非取代人类工程师,而是作为辅助工具简化繁琐任务。通过自动化,开发者可以将数周的工作浓缩到数小时完成。
实际意义与影响:
  • 对行业的改变:NEO的多智能体架构为AI辅助的机器学习工程开创了新标准,为企业节省大量时间和人力成本。
  • 模型性能提升:NEO不仅快速交付模型,还保持了较高的准确性和鲁棒性,适用于真实世界任务。
  • 潜在争议:尽管NEO的表现引发期待,但业内对其实际效果仍存疑,需通过用户测试验证其全面能力。
大模型日报(11月16-17日 资讯篇)https://mp.weixin.q‍q.com/s/p9yjJcgvN9yfEAynU-JE3g
03

基于预训练视觉特征,看一眼任务就能零样本规划

Yann LeCun团队近日发布了基于预训练视觉特征的世界模型DINO-WM,展示了该模型在零样本规划任务中的潜力。这一研究提出了一种无需专家演示、奖励建模或逆向模型的新方法,通过动态建模隐藏空间中的世界状态,实现了高效视觉规划。
DINO-WM的核心技术亮点包括:
  1. 基于DINOv2的嵌入特征:该模型采用预训练视觉特征,将环境动态建模为隐藏空间中的紧凑嵌入。这种方法避免了直接处理高维像素空间,提高了模型的稳健性和一致性。
  2. 高效轨迹预测:通过ViT架构,DINO-WM能够预测未来隐藏状态,并在测试时通过模型预测控制(MPC)优化动作序列,直接实现目标状态,无需额外信息。
  3. 零样本规划能力:实验表明,DINO-WM在Wall和PointMaze等简单任务中表现与最先进的DreamerV3模型相当,而在需要复杂接触信息和物体动态的操纵任务中显著优于传统方法。
  4. 优异的泛化能力:DINO-WM在从未见过的环境配置中表现出色。例如,在墙壁随机布局任务中,模型有效学习了墙壁和门的通用概念,并成功将粒子聚集到目标位置。
  5. 对比生成式模型的优势:与基于扩散的视频生成模型相比,DINO-WM预测物理合理性更高,能够准确实现目标状态,表现出更优的任务执行能力。
DINO-WM为任务无关的世界建模和控制提供了新的方向,其通过预训练表征和隐藏空间建模,有效填补了推理与控制之间的空白。该研究为通用智能体的世界建模和实际应用铺平了道路。
大模型日报(11月16-17日 资讯篇)
https://mp.weixin.q‍q.com/s/RLCy2FnJ0J7UFSNa-foiuQ
04

杨植麟发布Kimi新模型:数学对标o1

在Kimi开放一周年之际,其创始人杨植麟推出了新模型k0-math,专注数学领域,瞄准OpenAI o1系列并主打深入思考能力。在数学领域的四项基准测试(MATH、中考、高考、考研)中,k0-math均超越o1-mini和o1-preview,展现了卓越的能力。模型的特色在于全面展示解题过程,无论简单还是复杂的题目,它都会进行深入探索和验证。这种反复尝试的方式虽然提高了推理准确性,但也引发了思考效率的挑战。
k0-math的核心创新点包括深入思考能力的培养以及强化学习在Scaling Law上的应用。例如,在回答简单的“1+1”等问题时,k0-math会先进行可视化、验证和多次确认,以确保答案的可靠性。在强化学习技术的支持下,模型优化了意图增强、信源分析和链式思考等推理能力。其中,意图增强可以将抽象问题具体化,信源分析提升答案的权威性与溯源能力,链式思考则通过分解复杂问题来逐步推导高质量答案。
在未来发展方向上,k0-math的优化重点包括提升模型的自我判断能力,使其能动态调整思考深度,从而避免在简单问题上浪费算力。同时,通过强化学习范式的引入,模型将突破静态数据的限制,利用少量标注数据杠杆化AI的自主学习能力,以实现更大规模的性能提升。此外,Kimi团队还在多模态领域推进研发,内测了多模态交互能力,旨在扩展模型的适用场景。
杨植麟表示,AI未来的核心在于“思考决定上限,交互为必要条件”,强调高质量数据与优化算法的结合。k0-math的发布不仅展示了Kimi团队在AI研发中的实力,也为深入思考与强化学习领域的结合开辟了新路径。未来几周,k0-math将逐步上线Kimi的网页版和智能助手APP,用户可期待更智能的搜索与解题体验。
大模型日报(11月16-17日 资讯篇)https://mp.weixi‍n.qq.c‍om/s/FsfLWAy1vWNHE3z2V9ei5Q
05
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

基建狂魔马斯克122天交付10万卡超算,对手大恐慌派间谍飞机侦查

马斯克以122天建成全球领先的超算集群Colossus,其速度和规模震撼了行业。Colossus整合了10万块英伟达H100 GPU,是Meta等科技巨头超算规模的数倍,而传统流程通常需3-4年完成。马斯克采用了一系列激进策略,包括省略传统电力供应审批、引入移动式燃气涡轮机作为临时电源、在未完成合规测试前直接投入使用。这种颠覆传统的工程思路与其在特斯拉和SpaceX的成功实践如出一辙。
马斯克的项目迅速推进得益于他对资源调配和工程效率的独特理解。孟菲斯数据中心的改造由一座旧工厂完成,过程跳过了诸多标准流程,专注于快速安装高耗能GPU服务器和液冷系统。当地官员全力配合,也为项目提供了行政便利。此外,英伟达CEO黄仁勋对其盛赞,称其在工程和系统设计上的能力无可比拟。
这场超算竞赛加剧了OpenAI、微软等对手的焦虑。OpenAI因对微软建造数据中心速度的不满,已转向初创公司合作,并计划在德州建设自己的10万GPU集群。竞争态势使得整个行业都在缩短建设周期,Meta、谷歌等也在加速扩展数据中心。然而,这种速度带来的挑战包括电力供应瓶颈和工程可靠性问题。
马斯克的“马斯克速度”不仅让对手倍感压力,也推动了行业对超算建设效率和方法的反思。正如业内所言,“超算领域,谁能先建成,谁就掌握主动权。”
大模型日报(11月16-17日 资讯篇)
https://mp.‍weixin.qq.co‍m/s/TA3fIo6hYEkCAqzBu‍AjL5Q

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

Karpathy分享:如今课本主要为大型语言模型编写,压缩成模型权重,产生的解决方案可以服务于人类或自动化

还记得课本里的练习页面吗?如今,在各个知识领域对这些内容的大规模收集已经推动了数十亿美元的市场。课本主要为大型语言模型(LLM)编写,压缩成模型权重,产生的解决方案可以服务于人类,或者(随着时间的推移)直接用于实现自动化。
大模型日报(11月16-17日 资讯篇)
https://x.com/karpathy/status/1857584163140030710
02

Anthropic文档功能更新:现在可以所有文档以单个纯文本文件的形式访问,并直接输入大语言模型中

周五文档功能更新:
您现在可以将我们的所有文档以单个纯文本文件的形式访问,并直接输入到任何大型语言模型(LLM)中。
以下是网址路径:
http://docs.anthropic.com/llms-full.txt
大模型日报(11月16-17日 资讯篇)
https://x.com/alexalbert__/status/1857457290917589509
03

Gemini-exp-1114 现已通过 Gemini API 提供

Gemini-exp-1114 现已通过 Gemini API 提供,祝您构建/测试愉快!周一将带来更多更新 🚢
大模型日报(11月16-17日 资讯篇)https://x.com/OfficialLoganK/status/1857535825895993366
04

Physical Intelligence分享demo:物理智能

@Astribot_Inc 🤝 物理智能 (π)

大模型日报(11月16-17日 资讯篇)

https://x.com/physical_int/status/1857441249378410611
05

ExtendHQ分享:处理91页的扫描PDF文档,提取了10,400个数据点,准确率达到100%

我们刚刚在文档处理方面达到了一个里程碑 —— 处理了一份91页的扫描PDF文档,包含嵌套表格、手写内容和复杂布局。
提取了10,400个数据点,准确率达到100%。
大模型日报(11月16-17日 资讯篇)
https://x.com/kushalbyatnal/status/1857501330438344933
06

OmniVision-968M:面向边缘设备的新型本地视觉语言模型

OmniVision-968M:一款面向边缘设备的新型本地视觉语言模型(VLM),快速、小巧且性能卓越 👏
基于 SigLIP-so-400M 和 Qwen-2.5-0.5B
💨 图像标记数量减少 9 倍,超级高效
📖 与 SFT 和 DPO 对齐,以减少幻觉生成
🔥 使用 Apache 2.0 许可证
大模型日报(11月16-17日 资讯篇)
https://x.com/mervenoyann/status/1857930538381881353

产品

01

Quantera.ai

Quantera.ai 是一个市场智能平台,通过利用官方财务数据,提供快速、准确的公司研究和股权洞察。其核心功能包括AI驱动的洞察、关键数据连接、收益分析和股票筛选,可以简化用户获取和理解复杂财务信息的过程。
大模型日报(11月16-17日 资讯篇)
https://www.quantera.ai/
02

SideSpace

Side Space 是一款 AI 驱动的垂直标签管理器,希望可以提升目前的浏览体验。它提供一个优雅的侧边面板,将标签以垂直方式排列,配有智能分组功能,根据内容自动整理标签。此外,用户可以通过云同步功能在多个设备间无缝访问已保存的标签空间,支持拖放管理和个性化定制。整体设计简洁,灵活性高,可以帮助用户更高效地管理浏览工作区。
大模型日报(11月16-17日 资讯篇)
https://www.sidespace.app/

投融资

01

2024年筹资超1亿美元的美国AI初创公司完整名单

根据TechCrunch报道,2024年第三季度AI初创企业在风险投资市场表现强劲,共筹集了189亿美元,占全部风险投资的28%。以下是2024年筹资超1亿美元的44家美国AI初创公司及其关键动态:
  1. OpenAI创历史筹资记录:10月,OpenAI完成66亿美元的融资,创下历史最大单笔风险投资,估值达1570亿美元。
  2. 重点领域多元化:这些公司涵盖AI芯片、自动化、法律科技、药物研发等领域。例如,物理计算公司Lightmatter筹资4亿美元,法律科技公司EvenUp完成1.35亿美元融资。
  3. 多轮投资持续:部分企业如Magic、Glean等多次获得融资,展现了AI技术领域的持续吸引力。
  4. 挑战与机遇并存:尽管资金充裕,但一些公司面临单一客户依赖等潜在风险。
部分代表性公司:
  • Sierra(企业AI聊天机器人):10月筹资1.75亿美元,估值达45亿美元。
  • Nimble Robotics(自动化仓储):筹资1.06亿美元,迈入独角兽行列。
  • KoBold Metals(金属勘探AI):筹资4.91亿美元,用于AI金属开采技术。
大模型日报(11月16-17日 资讯篇)
https://techcrunch.com/2024/11/15/heres-the-full-list-of-44-us-ai-startups-that-have-raised-100m-or-more-in-2024/
02

Agility Robotics宣布与舍弗勒集团达成战略合作

Agility Robotics近期在全球科技大会Web Summit上宣布,舍弗勒集团(Schaeffler)对其进行了少量股权投资,并签署战略协议。根据协议,舍弗勒计划从Agility Robotics采购双足移动操作机器人(MMR)DigitⓇ,用于其全球工厂网络。这标志着舍弗勒在制造和物流领域的机器人应用将迈向新阶段。
  1. 重大投资与采购协议:舍弗勒的投资不仅强化了双方合作,还展示了对机器人技术在工业领域应用的信心。
  2. 行业首创商业化部署:Agility Robotics此前已与全球最大合同物流供应商GXO签署多年协议,成为首个商业化部署人形机器人的公司,并开创了“机器人即服务”(RaaS)的新模式。
  3. 技术与未来展望:Agility Robotics致力于开发能够安全与人类协作的人形机器人,预计在未来24个月内推出新一代产品,进一步推动制造和物流行业的智能化升级。
公司官网:https://agilityrobotics.com/
大模型日报(11月16-17日 资讯篇)https://agilityrobotics.com/content/agility-robotics-announces-strategic-investment-and-agreement-with-motiontechnology-company-schaeffler-group
03

OpenAI曾考虑收购AI芯片公司Cerebras

根据最新的法律文件显示,OpenAI曾在2017年考虑收购AI芯片公司Cerebras。这一潜在收购计划始于Cerebras成立一年后,当时Elon Musk在OpenAI有财务投入并对其发展方向具有一定影响。文件显示,OpenAI联合创始人Ilya Sutskever提出通过Tesla收购Cerebras的想法,但同时担心Tesla的股东利益与OpenAI的使命可能不一致。尽管OpenAI与Cerebras进行了包括谈判和尽职调查在内的初步接触,但最终交易未能达成。
Cerebras专注于开发用于AI模型训练和运行的定制硬件,声称其芯片性能优于Nvidia的旗舰产品。尽管其已获得7.15亿美元的风投资金并寻求通过IPO将估值翻倍至80亿美元,但面临诸多挑战,包括过于依赖单一客户阿布扎比公司G42(贡献87%的收入)以及该公司的历史性中资关联问题。
如果收购成功,OpenAI可能会减少对Nvidia芯片的依赖,同时获得成本控制上的优势。然而,该计划被搁置后,OpenAI选择与Broadcom和台积电合作开发定制AI芯片,预计最快于2026年推出。
这一事件凸显了AI领域对硬件自主权的竞争激烈,以及企业间战略合作可能对技术创新和市场布局的深远影响。
公司官网:https://cerebras.ai/
大模型日报(11月16-17日 资讯篇)
https://techcrunch.com/2024/11/15/openai-at-one-point-considered-acquiring-ai-chip-startup-cerebras/


推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/11/21702.html

Like (0)
Previous 2024-11-17 15:15
Next 2024-11-18 20:19

相关推荐