我们希望能够搭建一个AI学习社群，让大家能够学习到最前沿的知识，大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区：

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」，即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告：ResearchFlow — 奇绩F23校友的开发的深度研究产品，PC端进入RFlow的分析报告，可直接点击节点右侧的小数字展开节点，登录后可在节点上直接“询问AI”，进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流，欢迎扫码。

欢迎大家一起交流！

资讯

2025 IEEE Fellow名单出炉：戴琼海、姜大昕、尹首一、翟广涛、褚晓文等人入选

IEEE近日发布新一届Fellow名单，授予约300位学者此项最高荣誉，表彰其在工程科学与技术领域的卓越贡献。IEEE成立于1963年，现有全球超过40万会员，Fellow当选者不超过会员总数的0.1%，体现了其学术与职业成就的权威性。

本届名单中，多位华人学者上榜，包括清华大学戴琼海院士（因对3D内容理解与计算成像的贡献）、苹果公司的曹亮亮（对计算机视觉和语音识别的贡献）、阶跃星辰创始人姜大昕（因上下文感知搜索与语言扩展方法的贡献）等。其他代表性成果涵盖射频系统、云计算、统计机器学习、分布式机器学习、图像与视频处理等领域，展现了学术界和工业界的多样性。

值得一提的是，香港中文大学陈苑茵因在特殊教育技术领域的贡献入选，清华大学李懋坤因对地下成像非线性反演算法的突破获认可，影像与通信、节能电力设备等方向也有显著成果上榜。此外，部分研究者的成果已在智能工厂、医疗诊断、无人机通信等实际应用中发挥关键作用。

本届当选者的研究范围不仅涵盖前沿学术理论，还注重实际应用，彰显IEEE推动全球工程技术进步的重要使命。

https://mp.weixin.qq.com/s/NVLks0QMN8X1b5cu_cM3-A

SIGGRAPH Asia 2024：传统与创新并存，3D 生成与具身智能热度上升

第十七届SIGGRAPH Asia大会以「Curious Minds」为主题在东京圆满落幕，本届大会注册人数和论文投稿数均创新高。华人学者表现突出，大量论文和研究成果背后都有华人团队的身影。计算机视觉领域的新兴派与传统派研究方向各有侧重，新兴派聚焦具身智能和3D生成，传统派则关注几何建模和细节处理，AI浪潮下，传统研究依然占据一席之地。

大会技术亮点包括影眸科技荣誉提名的3D生成大模型CLAY和进阶版本Rodin Gen-1，以及VAST团队以高质量3D私有数据集支撑的生成技术。此外，港大团队提出的TEXGen模型首次实现基于原生3D数据训练的生成式扩散模型，突破了2D升3D路径的局限性。

产业应用方面，3D生成技术在游戏、美术设计、电商等领域初步落地，但尚处于早期阶段，技术迭代与数据质量是关键挑战。VAST和影眸等团队致力于打造高质量内容生成工具，为未来UGC场景奠定基础。Animation技术在骨骼建模和动态表现上的突破仍待提升，MotionGen等模型逐步完善，但数据和算法优化仍是瓶颈。

https://mp.weixin.qq.com/s/cstNgredsFrMq9r-J7EIqA

元资助

ROSCon China 2024

12月7日，ROSCon China 2024大会在上海宝山伊敦康得思酒店开幕，这是全球机器人操作系统（ROS）领域的顶级盛会首次在中国内地举办。大会吸引了全球的机器人技术精英、开发者和爱好者，共同探讨ROS的最新发展与应用。张新宇主席在开幕仪式上表示，ROSCon China的召开是中国机器人产业发展的重要里程碑，将推动全球机器人技术与产业升级。

本次大会持续两天，围绕四大主题展开：AI与机器人技术的深度融合与应用、ROS技术前沿、基于ROS的产业化生态构建，以及全球与国产自研ROS系统的对比。众多国内外专家、学者与企业代表（如NVIDIA、光轮智能、百度Apollo等）分享了ROS技术的最新进展和应用案例，激发了热烈的讨论。

大会主会场的演讲精彩纷呈，多位行业大佬发表了令人印象深刻的言论。张新宇表示，ROS不仅是技术平台，更是全球机器人开发者的生态系统，推动着机器人技术的全球进步。赖晓铮教授谈到程序员在未来技术发展中的重要性，丁琰研究员则强调了数据质量对机器人学习的关键性。英伟达的Lia Liang展示了生成式AI对机器人训练数据的赋能潜力，谢晨光则分享了特斯拉在自动驾驶领域的创新如何影响传统汽车制造商。

https://huggingface.co/blog/Pclanglais/common-models

元资助

电子2025年度策略：聚焦AI终端及自主可控

看好果链及智能眼镜为代表的AI终端长期趋势，补贴有望刺激手机需求全面回暖：1）果链AI创新：6月苹果发布AppleIntelligence，Canalys预测2024年全球AI智能手机市场份额为16%，2023至2028年间，AI手机市场CAGR预计为63%，AI手机中SoC及存储是算力提升关键，散热配套升级，果链AI创新有望带动新一轮换机周期。2)智能眼镜终端：Ray-BanMeta的成功证明了智能眼镜类产品成为AI终端落地场景的可行性，光学方案与显示器件占AR设备成本约50%，是产业链降本增效的核心环节，未来随着产业巨头加速布局与供应链降本增效的推进，AI+AR眼镜有望快速发展。3）补贴刺激：自今年10月多地推出纳入手机等3C产品的消费券后，国内手机消费需求得到显著刺激。随着11月乃至未来各地持续推出针对手机等3C产品的消费券和将手机纳入以旧换新的扩容政策，有望刺激手机需求全面回暖。

半导体自主可控势在必行，看好四大国产化方向。1）国产算力及配套：美国对中国半导体限制逐步收紧，国产算力芯片供不应求，国内OSAT封装厂积极布局先进封装，国产化加速推进。2）晶圆厂：国内高端芯片厂商寒武纪、华为等流片受限，中芯国际作为国内大陆半导体代工厂龙头，凭借先进制程的研发与扩产将成为国产算力芯片生产的重要依托。3）半导体设备及光刻机配套：先进制程需求攀升推动晶圆厂在高精度工艺、良率提升和产能扩张方面投入，对设备自主可控的要求，拉动国产半导体设备以及光刻机配套景气度提升。4）国产化EDA：当前中美摩擦倒逼国产EDA工具快速发展，2022年我国EDA行业市场规模达到116亿元（同比+12%），超过全球行业发展速率，景气度持续向上。

政策+技术+龙头多元发力，智驾车型加速放量上游硬件厂商进入业绩兑现期：比亚迪为代表的传统车企开始发力智驾车型在10-20万价格带车型渗透，有望推动智驾车型于2025年进入出货量高速增长期，相较辅助驾驶方案，支持高速/城区NOA的智驾方案在车载摄像头、激光雷达、智驾芯片、高速连接器等产品上均有产品技术、装载量及价值量提升，叠加国内车企加速推进更具产品性价比的国产供应链替代，有望带动国内智驾产业链相关公司迎来业绩高增机遇。

相关标的梳理：1）消费电子：果链AI创新有望带动新一轮换机周期，利好以果链为代表的订单需求复苏预期，注重业绩确定性和估值性价比（歌尔股份、东山精密、蓝思科技、立讯精密、中石科技、统联精密、鹏鼎控股、信维通信、领益制造等），同时安卓链有望迎边际改善（电连技术、飞荣达、龙旗科技等），AI眼镜产品发布不断，注重明年产业确定性趋势和潜在弹性（歌尔股份、宇瞳光学、福立旺、亿道信息、康耐特光学等）；2）半导体：AI算力(寒武纪，沪电股份、深南电路、兴森科技、源杰科技、长光华芯等)，封测（通富微电、长电科技、甬矽电子、佰维存储等），服务器配套（鸿日达、泰嘉股份、兴森科技等）、晶圆厂（中芯国际），光刻机配套（茂莱光学、晶方科技等）、EDA（华大九天、概伦电子等），周期复苏（圣邦股份、纳芯微、思瑞浦、卓胜微、唯捷创芯、康希通信、东芯股份、兆易创新、普冉股份、聚辰股份等）；3）汽车电子：车载摄像头及激光雷达(联创电子、舜宇光学科技、欧菲光、宇瞳光学、蓝特光学、韦尔股份、思特威，速腾聚创、禾赛科技，永新光学、长光华芯、高伟电子);车载高频高速连接器(电连技术、瑞可达、维峰电子)，智驾芯片及解决方案（地平线、黑芝麻智能等），嵌塑集成件（兴瑞科技）；4）新兴产业领域：高温超导（联创光电等）。

风险提示：下游需求复苏不及预期、晶圆厂扩产不及预期、国产替代进度不及预期、新产品、应用发布或销售不及预期。

https://mp.weixin.qq.com/s/rVDPUB3nXFFLSg2QwfcAhw

055

元资助

Meta Llama 3.3 发布

Llama 3.3 多语言大型语言模型 (LLM) 是一个经过预训练和指令调整的生成模型，大小为 70B（文本输入/文本输出）。Llama 3.3 指令调整纯文本模型针对多语言对话用例进行了优化，在常见行业基准上的表现优于许多可用的开源和封闭聊天模型。

模型开发者：Meta

模型架构： Llama 3.3 是一种自回归语言模型，采用优化的 Transformer 架构。调整后的版本使用监督式微调 (SFT) 和带人工反馈的强化学习 (RLHF)，以符合人类对有用性和安全性的偏好。

https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct

推特

00Arxiver开源：包含 138,830 篇 arXiv 论文的多Markdown格式

ElewenLabs：现支持网页版、手机收听播客

现在你可以在网页版的 GenFM 上创建和编辑播客，并在 Android 和 iOS 上的 ElevenReader 收听 AI 播客。

https://x.com/elevenlabsio/status/1865085918543028434

Ollama0.5发布，带来结构化输出功能

Ollama 0.5 发布了，带来了结构化输出功能！

这使得可以将模型的输出限制为由 JSON 模式定义的特定格式。

一些示例包括：

• 从文档中解析数据

• 从图像中提取数据

• 对所有语言模型的响应进行结构化

• 提供比 JSON 模式更高的可靠性和一致性

https://x.com/ollama/status/1865113729437962384

Act-One 现已支持将您的表演直接转移到现有视频中的角色上

Act-One 现已支持将您的表演直接转移到现有视频中的角色上。此更新为专业视频制作流程中的真人和动画内容带来了新的表现力和控制力，解锁了新的应用场景。

https://x.com/runwayml/status/1865062457418371080

Qwen2-VL 的基础模型发布

😓 差点忘了我们今晚发布了点东西……嗯，其实就是 Qwen2-VL 的基础模型啦，没啥大不了的。

🔗 链接如下：

https://huggingface.co/Qwen/Qwen2-VL-2B

https://huggingface.co/Qwen/Qwen2-VL-7B

https://huggingface.co/Qwen/Qwen2-VL-72B

所有的基础模型都已经分享给你了。我觉得这些模型会对你构建更好的视觉语言模型有帮助，因为它们在微调方面表现更好。

干杯！🍺

https://x.com/JustinLin610/status/1865101457109995657

产品

Reforged Labs 为移动游戏工作室提供轻松的 AI 广告

Reforged Labs 正在推出业内首创的 AI 视频创作服务，为广告行业带来革命性的变革。我们致力于颠覆传统的视频制作流程，将过去昂贵且耗时的创作过程全面自动化，用高效、快速、且经济实惠的解决方案取而代之。通过我们的服务，每个视频广告都将根据工作室的品牌需求量身定制，确保不仅传递精准的信息，还能以更高的成本效益触达目标受众。从概念到成品交付，AI 驱动平台能够大幅缩短制作周期，同时保持卓越的创意品质，让用户在市场竞争中始终快人一步。无论是初创品牌还是大型企业，Reforged Labs 都是实现视频广告创意突破的理想合作伙伴。

https://reforgedlabs.com

Countless.dev

Countless.dev 是一个专为开发者和决策者打造的创新平台，旨在让您轻松探索、比较和计算每个 AI 模型的成本，无论是LLM、视觉模型还是其他类型的人工智能模型。通过 Countless.dev，您可以按照价格、代币限额、功能特点等关键指标对模型进行排序，从而快速筛选出最适合您特定用例的解决方案。无论是需要支持复杂文本生成的高性能模型，还是满足图像处理需求的视觉算法，该平台都能在几秒钟内为您呈现清晰的对比结果，大幅提升您的选择效率。借助 Countless.dev，您可以轻松掌控模型选择的全流程，从而最大化投资回报率，专注于实现您的技术和业务目标。

https://countless.dev

投融资

YC秋季批次的四家值得关注的初创企业

在最新的YC（Y Combinator）秋季批次中，95家初创企业亮相，其中87%为AI相关公司，重点集中在客户服务和AI代理领域。然而，四家初创企业因其致力于为企业提供AI监控和防护工具而引人关注。以下是这些企业及其融资亮点：

HumanLayer

业务描述：提供API使AI代理能够在需要时联系人工进行帮助和审批。
特点：通过精确引入人工反馈，平衡AI效率与可靠性，吸引企业关注。

Raycaster

业务描述：面向企业销售的研究型AI代理。
亮点：通过深入挖掘目标客户的详细信息（如实验室设备使用情况等），在合适的时间以精准方式进行推销，与传统的线索生成工具形成鲜明对比。

Galini

业务描述：为AI应用程序提供合规防护。
优势：帮助企业根据公司政策和法规为AI建立防护机制，增强企业对AI控制的自由度和评估能力。

CTGT

业务描述：提供工具集帮助企业管理AI模型的“幻觉”问题。
融资动向：正在与多家财富10强企业测试其技术，表明市场对这种工具的强烈需求。

https://techcrunch.com/2024/12/07/the-four-startups-from-ycs-fall-batch-that-enterprises-should-pay-attention-to/

AMP Robotics融资9100万美元，加速部署AI回收系统

AMP Robotics宣布完成9100万美元的D轮融资，此轮融资由Congruent Ventures领投，Sequoia Capital、Blue Earth Capital、Liberty Mutual Investments等多家现有和新晋投资者参与。公司计划利用本轮资金加速其AMP ONE系统的部署，该系统结合人工智能和机器人技术，用于高效分类市政固体废弃物（MSW）。

AMP Robotics自2014年成立以来，其AI平台已识别1500亿件物品，指导完成超过250万吨可回收物的分类，拥有三个全规模设施及400多个AI系统，遍布北美、亚洲和欧洲。AMP ONE系统通过深度学习技术实时识别废弃物中的可回收物和污染物，大幅提高资源回收的经济性和效率。

近期，AMP Robotics与Waste Connections Inc.达成合作，将在科罗拉多州的单流回收设施中安装并运营系统。同时，公司宣布新CEO Tim Stuart上任，创始人Matanya Horowitz转任首席技术官，以进一步推动技术和市场拓展。

投融资亮点：