Tim Brooks,曾在OpenAI领导Sora研究并是DALL-E 3的作者之一,近日宣布加入谷歌DeepMind,成立一个新的世界模型团队。这一团队将致力于创建多个世界模型,推动谷歌在视频生成与模拟等领域的研究,合作对象包括DeepMind旗下的Gemini、Veo和Genie等团队。Brooks将在此团队中构建“实时交互生成”工具,并将其与现有多模态模型整合,以推动AGI的实现。DeepMind认为,通过对视频和多模态数据进行预训练,世界模型将对视觉推理、具身智能体规划以及交互娱乐等多个领域产生深远影响。
Brooks于2023年从UC伯克利博士毕业,并在同年开始领导Sora团队的研究。他的转职和此次团队建设得到谷歌DeepMind CEO Demis Hassabis的支持,后者认为Brooks将帮助实现长期以来的“世界模拟器”梦想。团队招聘的职位包括研究科学家和工程师,要求硕士或博士学位,并提供竞争力薪资。在深度模拟领域,谷歌早期的成果如Genie 2展示了其模拟和训练具身智能体的潜力,尽管这一技术仍在发展中。Genie 2能够生成响应玩家操作的3D世界,并可用于评估具身智能体的任务表现。谷歌希望利用世界模型为具身智能体提供多样的训练环境,以实现更安全、广泛的智能体训练。此外,世界模型的潜力不仅在于交互式媒体的生成(如视频游戏和电影),还在于模拟现实环境,帮助机器人和具身智能体进行训练。谷歌在这一领域的优势,尤其在数据方面,源自其庞大的YouTube数据资源,这为其团队提供了独特的竞争力。世界模型的研发前景引发了广泛关注,包括初创公司如李飞飞的World Labs和Decart等也在积极探索该领域。尽管面临技术和版权等挑战,世界模型被视为实现AGI的关键路径之一,特别是在扩展预训练和多模态数据的领域。谷歌DeepMind对这一技术的投资显示出其在智能体和多模态模型开发中的战略雄心。
Google AI Studio发布为渐进式网络应用,现在支持在桌面、iOS 和 Android 设备上本地安装
我们刚刚将 Google AI Studio 发布为渐进式网络应用(PWA),现在您可以在桌面、iOS 和 Android 设备上本地安装它。🚢非常感激,现在我终于不用每天输入 20 次 AI Studio 的网址了 :)https://x.com/OfficialLoganK/status/187637889403678361402
AnyParser Pro 是一款功能强大的多语言解析工具,专为满足现代企业需求而设计。它能够高效处理各类文档和图像,包括 PDF、Word、PPT 和复杂的图片文件,精准提取文本、表格和图表等关键信息。借助先进的 AI 技术,AnyParser Pro 提供卓越的解析精度,无论是复杂格式还是多语言内容,都能轻松应对。产品在设计过程中始终将客户隐私置于首位,采用严格的数据保护措施,确保敏感信息的安全性。此外,AnyParser Pro 支持无缝企业集成,兼容多种工作流和平台,为用户提供高效、便捷的文档处理体验,帮助企业显著提升工作效率和数据利用能力。https://www.cambioml.com/anyparser?ref=producthunt02
Sitelifter AI 驱动的工具 优化网页设计工具
Sitelifter 是一款由 AI 驱动的工具,专注于帮助用户优化网站页面的设计、内容信息传递、用户流畅度以及转化率表现。通过深入分析目标受众需求,Sitelifter 提供定制化的可操作建议,帮助用户在网站开发和运营的早期阶段减少错误,避免反复试验所带来的浪费。同时,它通过精准的数据分析和优化方案,使网站性能得到显著提升,帮助企业实现更高效的数字化运营,无需依赖经验或猜测即可获得专业结果。https://sitelifter.com/?ref=producthunt