大模型日报(9月30日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(9月30日 资讯篇)

资讯

01

北大陈宝权教授:从图形计算到世界模型

北京大学陈宝权教授在第九届计算机图形学与混合现实研讨会(GAMES 2024)上,发表了题为《从图形计算到世界模型》的主旨报告,深入探讨了图形计算如何助力世界模型的构建。报告中,他通过详细案例和研究成果,展示了图形仿真在数据生成、环境构建、模型训练及优化中的关键作用。
陈教授首先介绍了世界模型的基本概念及其重要性。他指出,尽管学术界和产业界尚未对世界模型达成统一定义,但其核心能力在于预测、推理、决策和规划。在人工智能(AI)和自动驾驶等领域,已有一些大模型展示出构建世界模型的潜力,如无人驾驶仿真系统通过多模态数据生成精确场景预测并进行动态决策。陈教授认为,图形仿真的核心在于模拟(simulation),其生成的大量高质量、标注丰富的数据能够有效扩展模型训练的边界,并助力模型在真实世界中的应用。
接着,他阐述了如何通过“real to sim”与“sim to real”的双向转化策略,进一步提升仿真数据的真实感和应用广度。特别是在无人驾驶、数字人运动控制、机器人行为策略等领域,仿真技术已成为构建复杂应用场景的重要支撑。此外,他还介绍了“可微分仿真”在复杂动态现象模拟与优化中的新进展,这种方法不仅提升了模型训练效率,还能通过物理监督与梯度回传机制,提供更精准的策略学习能力。
陈教授在报告中展示了其团队在软体仿真、多物理场景交互等领域的突破性研究,如实时软体变形、流体与固体交互模拟、磁软体仿真等,进一步验证了仿真技术在构建世界模型过程中的核心价值。

大模型日报(9月30日 资讯篇)

https://mp.weixin.qq.com/s/COf48GmYBYaRWipGCQSBBA
02

开源版Cursor”PearAI引争议:靠fork代码获YC 50万美元融资,创始人澄清贡献者问题

PearAI是一款自称“开源版Cursor”的AI编程项目,因其fork(复刻)了VSCode和Continue等开源项目而引发广泛争议。PearAI是YCombinator 2024年秋季项目之一,获得了YC 50万美元(约合350万元人民币)的投资。在宣布获得融资后,创始人之一Pan辞去原工作,全职投入PearAI开发。
争议源于创始人宣称项目拥有100多名开源贡献者,而不少网友指出这些“贡献者”其实是VSCode和Continue等被fork项目的开发者,而非PearAI自身的独立贡献者。质疑者认为,创始人在宣传中模糊了这一点,可能误导投资者,以使项目看起来更具社区支持度。
对此,创始人Pan澄清了相关情况,强调从未将上游项目的开发者当作PearAI的贡献者,并公开了实际为PearAI做出贡献的人员名单。尽管澄清后部分质疑者表示理解,但也有网友建议其在今后沟通中使用更明确的表达,以避免类似误解。
整体来看,PearAI的价值在于整合了多个大模型接口,并以开源方式优化AI代码编写体验。尽管在其产品定位和贡献者描述上引发了争议,但创始人团队的透明度与回应态度得到了部分认可。
值得一提的是,PearAI的两位创始人均为华裔YouTube博主,拥有较高的粉丝量。创始人之一的Matthew Duke Pan(网名Frying Pan)毕业于康科迪亚大学计算机系,曾在Meta、特斯拉等知名企业任职,并有虚拟币交易平台的软件开发经验。另一位创始人Nathan Ang是卡耐基梅隆大学计算机系硕士,曾在虚拟币公司实习。两人的背景和影响力可能为PearAI的初期推广起到了积极作用。
目前,事件的最终走向和PearAI能否凭借技术与社区优势获得更多认可,仍需进一步观察。

大模型日报(9月30日 资讯篇)

https://mp.weixin.qq.com/s/LRdjEF83JlUXsYAXccOrXw
03

能源转型:国内电力需求与投资再提速,设备出口持续高增

中国:电力需求超预期,电网投资再提速
1-8月中国用电量累计6.6万亿度电,同增8%。其中一/二/三产业分别同增6.3%/6.6%/11.0%。8月份中国用电量9649亿度,同增8.9%,增速再超预期(预期值7.6%,发布于《电力市场化系列三》240912)。1-8月中国整体电网投资增速显著高于电源投资,电网总投资3330亿元,同增23%,电源投资4976亿元,同增6%。8月单月电网投资383亿元,在去年同期低基数下实现同比65%增长,电源投资818亿元,同增19%。我们认为新一轮电网投资向上周期已经开启,我们维持2024年全年电网工程建设投资完成额(能源局口径)6000亿元左右的预期,同比增速10%+。我们认为高电压级别的主网/特高压,以及配网板块的增速将高于行业整体,投资占比有望提升。
美国:8月发用电量增速下滑,降息有望助推新能源板块装机持续高增
电量需求与供给方面:美国1-8月用电量/发电量分别达到2.77万亿/2.82万亿度同增2.8%/3.6%,其中8月份单月用电量/发电量达4081/4087亿度,同比+0.9%/-0.3%,增速再次下滑。1-8月各类能源发电量同比增速位居前二的为光伏/风电,同增33%/7%。同时,1-8月发电增量中天然气/光伏分别占39%/38%,传统能源依旧是重要支撑。从各类能源新增装机情况来看,8月风电/光伏/储能装机同比增速分别达到789%/286%/228%,我们认为系市场提前反应了降息对于新能源项目的投资回报和需求的拉升,我们预计后续新能源装机增长趋势有望延续。
电价与能源价格方面:8月美国不同区域批发电价环比走势有所不同;电力远期价格整体延续回落的趋势,最新周度ERCOT North Hub 25/26/27/28年远期价格较上月同期下降11%/7%/4%/3%。
电气设备出口:8月出口提速,海外需求强劲
中国、韩国变压器出口延续增长趋势,中韩油变出口增速均显著强于干变,中国实际出口增速最高,绝对值贡献最大的区域为欧洲、海湾七国及北非。中国1-8月份出口39亿美元,同增26%,其中8月出口5.6亿美元,同增38%,增速连续提升。1-8月电力主变/配电油变同比增长59%/47%,干变下滑3%。分区域来看,1-8月中东海湾七国及北非/欧洲/北美增速分别为377%/57%/32%。韩国1-8月份出口变压器14亿美金,同增58%,其中美国达8.5亿美金,占60%,占比较去年提升11pct,是出口结构提升最快的区域。

大模型日报(9月30日 资讯篇)

https://mp.weixin.qq.com/s/4UqerK5-6fOLvan3PgzCzw

推特

01

Karpathy强推Deep Dive:按需播客,基于你提供的任何素材生成/链接的内容,在Notebook ML 中生成

Deep Dive 现在是我最喜欢的播客。听得越多,我越觉得自己好像在和主持人成为朋友,这是我第一次真切地喜欢一个AI,还是两个AI!他们有趣、引人入胜、富有思想、开放、好奇。好吧,我就说到这。
哦,不好意思,它是一个新的按需播客,基于你提供的任何素材生成/链接的内容。在 Google 的 Notebook ML 中生成:
https://notebooklm.google.com
  • 新笔记本
链接资源(随你选择!)
笔记本指南 > 深度对话生成

大模型日报(9月30日 资讯篇)

大模型日报(9月30日 资讯篇)

https://x.com/karpathy/status/1840509391847698651
02

Willison分享对 NotebookLM 新的音频概览功能的笔记

我对 NotebookLM 新的音频概览功能(即令人惊讶地逼真的自动双人播客对话)的详细笔记。

NotebookLM 自动生成的播客效果出乎意料的好
音频概览是 Google 的 NotebookLM 的一个有趣的新功能,目前引起了广泛关注。它根据你提供的内容生成一次性定制播客,两个 AI 主持人会围绕收集到的内容进行“深度探讨”。这些播客大约持续十分钟,呈现出非常像真实播客的效果,音频对话令人惊讶地逼真。

大模型日报(9月30日 资讯篇)

https://x.com/simonw/status/1840557573281644695
03

Meta Allen Zhu分享视频教程:语言模型物理学:如何从小学数学问题中的错误中学习

语言模型物理学:第 2.2 部分,如何从小学数学问题中的错误中学习
目标: 探索 LLMs(语言模型)在错误发生后立即纠正错误的可能性(无多轮提示)。
时间点和结果:
4:39 – 结果 0: LLMs 可以对其错误感到后悔
12:29 – 结果 1: 在后悔时重试
16:05 – 结果 2: 使用重试数据进行预训练
24:25 – 结果 4: 重试数据与推理中的错误比较
28:18 – 结果 3: 重试数据与标签掩码比较
30:59 – 结果 5: 重试数据与一级/二级推理技能比较
34:18 – 结果 6: 在束搜索(beam search)上的负面结果
35:29 – 结果 7: 在微调上的负面结果
42:33 – 结果 8: 如何在现实生活中准备重试数据
讲者:Zeyuan Allen-Zhu

大模型日报(9月30日 资讯篇)

https://x.com/ZeyuanAllenZhu/status/1840386985976098834
04

手动计算 MLP Excel:Tom Yeh分享练习,手动计算四层网络

手动计算 MLP✍️Excel ~ 我设计了这个练习,展示如何手动计算一个四层网络,并附上图表和对应的 PyTorch 代码。同时,我还制作了中型和大型版本,以展示其扩展性。👇加入“AI 数学”社区。下载 xlsx。

大模型日报(9月30日 资讯篇)

https://x.com/ProfTomYeh/status/1840032508651458846
05

HuggingFace联创Wolf分享总结:开放多模态 LLM 发布的疯狂月份

庆祝“开放多模态 LLM 发布”的疯狂月份!
如果你还没注意到,2024年9月有好几个研究实验室发布了令人印象深刻的开放多模态 LLMs:Qwen-VL、Pixtral、LLama 3.2 和 Molmo,这些模型在功能上已经大幅缩小了与闭源模型(视觉和文本模型)之间的差距。
我花了一些时间整理了这些信息,并做了几张图表,让我们在这个周日做个简短的深入探讨👇

密集的时间线!
  • 8月30日:Qwen 发布了 Qwen2-VL 系列——这是第一个开放权重的视觉语言模型(VLM),开始挑战 GPT-4 级别的性能,拥有多个尺寸:2B、7B、72B。
  • 9月17日:Mistral 发布了他们的第一个视觉语言模型 Pixtral。对于一个中等规模的模型(12B)来说,其表现非常强大。
  • 9月25日:Meta 发布了新的 Llama 3.2,包含两个多模态版本,参数分别为 11B 和 90B。
  • 9月25日:AllenAI 发布了他们的首个多模态模型 Molmo,提供三个尺寸:1B、7B、72B。
主要用例:
视觉语言模型(VLM)非常适合演示(可以看看 Molmo 发布的酷炫视频:https://youtube.com/watch?v=spBxYa3eAlA),但你可能会想,除了演示之外,这些模型是否有真正的应用场景?让 VLM 来描述我现在已经能亲眼看到的世界,可能显得更像是花哨的小把戏,而非必需的功能。
但这里有一些我认为非常令人兴奋的 VLM 用例:
  • 扩展自动 OCR 和图表分析
  • 处理长视频的构建模块(基本上是长时间的图像流)
  • 作为代理在网页上执行任务的构建模块
  • 作为代理在本地计算软件上执行任务的构建模块
  • 开源机器人和强化学习训练的构建模块
能力:
顺便说一句,这些模型远不止是玩具或概念验证(PoC)。它们确实在快速缩小闭源模型与开放权重/源码模型之间的差距。

大模型日报(9月30日 资讯篇)

大模型日报(9月30日 资讯篇)

https://x.com/Thom_Wolf/status/1840372428855280045

产品

01

Highlighter

Augie Studio 推出的 Highlighter 是一款快速将视频转换为精彩片段的工具,用户只需上传视频并设置提示,AI 便能自动提取最佳时刻,适用于社交媒体内容创作。该工具支持多种分辨率和纵横比,受到用户的积极反馈,评分高达 4.9/5。

大模型日报(9月30日 资讯篇)

https://my.augie.studio/
02

Sensay Replicas

Sensay Replicas 是一款由 Sensay 推出的人工智能工具,可以通过数字化复制品来保存知识和自动化任务,从而提升个人和企业的生产力。它支持全天候的文本、语音和视频互动,适用于多种行业,具有高度的可定制性,以满足特定业务需求。

大模型日报(9月30日 资讯篇)

https://sensay.io/
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

  3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/10/21448.html

Like (0)
Previous 2024-09-30 20:01
Next 2024-10-07 22:59

相关推荐