大模型日报(12月11日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(12月11日 资讯篇)


资讯

01

谷歌启动 200 亿美元可再生能源项目,支持 AI 数据中心


2024年12月10日,谷歌宣布与可再生能源开发公司 Intersect Power 及投资基金 TPG Rise Climate 签订协议,计划投资 200 亿美元建设可再生能源、储能设施和电网升级项目,以支持其 AI 数据中心的需求。此次合作将推动多个千兆瓦级数据中心的运行,而首个项目已经由 Intersect Power 融资启动。
此项目还包括向 Intersect Power 投资 8 亿美元股权,TPG 主导此轮融资,谷歌及其他合作方也参与其中。随着谷歌等科技公司加速扩展 AI 能力,它们迫切需要更多能源,这促使它们投资于新的能源来源。
具体而言,谷歌将为每个千兆瓦规模的数据中心配备同等容量的风能、太阳能和储能设施,确保这些数据中心能获得足够的绿色能源支持。此外,谷歌还将承担电网所需的升级费用,以加速可再生能源与数据中心的连接。
该项目将分阶段进行,预计2026年启动首个阶段,2027年完成,展现了可再生能源项目的快速部署能力。这一进展预计将对核能开发商产生压力,因为大多数核电项目的建设时间较长。
大模型日报(12月11日 资讯篇)
https://techcrunch.com/2024/12/10/google-kicks-off-20b-renewable-energy-building-spree-to-power-ai/
02

Fine-Tuning Paligemma 2 

在这篇博客文章中,作者详细介绍了如何通过 Roboflow 平台对 Paligemma 2 模型进行微调。Paligemma 2 是一个用于图像分类和目标检测的深度学习模型,其优点是高效且易于集成。为了让 Paligemma 2 更好地适应特定任务,微调是提升模型性能的关键步骤。
  1. 数据准备与集成:微调的第一步是准备高质量的数据集。Roboflow 提供了数据标注工具,可以简化这一过程。用户可以上传原始数据,并使用 Roboflow 来标注和增强数据集。这对于训练高效且精准的模型至关重要。
  2. 配置与选择模型:Roboflow 允许用户选择 Paligemma 2 模型并进行配置。选择合适的预训练模型进行微调能够显著提升最终的效果,尤其是在数据集较小或具有特定需求时。用户可以通过 Roboflow 的界面选择图像分类或目标检测任务来微调模型。
  3. 微调流程:微调的过程中,模型会从一个已经训练好的版本开始,利用用户提供的标注数据进行进一步的训练。Roboflow 支持自动化的训练流程,用户只需选择数据集并指定训练参数,系统便会处理剩余的任务。为了避免过拟合,通常需要使用合适的正则化技术,保持训练的泛化能力。
  4. 模型评估与调整:在微调完成后,Roboflow 提供了详细的评估工具来检测模型在验证集上的表现。通过对比不同参数的效果,用户可以调整模型,优化其在特定任务上的准确性。Roboflow 还提供了评估指标,如精度、召回率等,帮助用户分析和选择最佳模型。
  5. 部署与应用:一旦微调过程完成,用户可以将优化后的模型部署到自己的应用中。Roboflow 支持多种导出格式,如 TensorFlow 和 PyTorch,确保与各种开发环境的兼容性。
大模型日报(12月11日 资讯篇)
https://blog.roboflow.com/fine-tune-paligemma-2/
03
元资助

使用Unsloth对Llama 3.3进行微调

本文讨论了如何通过Unsloth平台对Meta的Llama 3.3 (70B)模型进行微调,并介绍了与其他框架(如Hugging Face和Flash Attention 2)相比的显著性能优势。Llama 3.3(70B)在上下文长度和内存使用方面表现出色,能够提供比同类技术更快的微调速度和更低的内存消耗。
  1. 显著提升的上下文长度Unsloth优化后,Llama 3.3(70B)支持最高89,000的上下文长度,是Hugging Face与Flash Attention 2组合的13倍。相比于原版Llama 3.3,Unsloth还通过引入全新的苹果Cut Cross Entropy(CCE)算法进一步提升了长上下文支持,Llama 3.3的上下文长度比旧版本提高了1.85倍。
  2. 内存使用与性能优化使用Unsloth进行Llama 3.3(70B)微调时,在80GB GPU上需要41GB VRAM,这比使用Hugging Face和Flash Attention 2时显著减少了内存占用。Unsloth还采用了新的梯度检查点算法,这一技术使得内存的使用更加高效,能够将更多的计算负载转移到系统RAM,进一步减少了GPU内存的需求。
  3. Apple Cut Cross Entropy (CCE)算法的引入Apple的CCE算法通过优化交叉熵计算,减少了计算中的低数值处理,提高了性能,且不会影响准确性。该算法帮助提升了Llama 3.3(70B)在处理长上下文时的效率,使其相比传统方法支持更长的上下文长度。
  4. 4bit预量化与更快的下载速度Unsloth提供了Llama 3.3(70B)的4bit预量化版本,并通过优化的GGUF格式在Hugging Face页面上发布,使得模型下载速度比传统方法快了4倍。
大模型日报(12月11日 资讯篇)
https://unsloth.ai/blog/llama3-3
04
元资助

英伟达的机器人新魔咒:一句指令让双足机器人“自由”行动

加州大学和英伟达的研究人员联合提出的NaVILA模型,通过结合自然语言指令、视觉图像和激光雷达信息,突破了传统依赖预先绘制地图的局限,实现在复杂环境中的自主导航。NaVILA的核心创新是通过实时感知环境并听懂自然语言指令,来进行路径规划与执行。研究人员利用宇树Go2机器狗和G1人形机器人进行实测,发现NaVILA在家庭、户外和工作区等环境中的导航成功率高达88%,复杂任务中的成功率也达到75%。
NaVILA的技术核心包括高层的视觉-语言-行动(VLA)模型和低层的控制机制。VLA模型将视觉、语言和激光雷达数据结合,实现对环境的多模态感知,生成路径规划指令。这些指令通过“中间指令机制”进行拆解,让机器人不需要预设每个具体动作,而是根据高层指令自行进行拆解执行。低层控制则通过PPO强化学习算法,帮助机器人在不同地形中进行稳定行走,避免摔倒。
与传统的视觉语言导航系统(VLN)不同,NaVILA不依赖静态地图,而是通过实时感知动态环境进行导航。它特别适用于腿式机器人,能够处理复杂的地形和障碍物,如跨越门槛、绕过物体等。此外,NaVILA使机器人能够适应不同形态的机器人平台,四足和人形机器人都能通过NaVILA接受类似的控制指令。
在实测中,NaVILA成功实现了机器人在多种场景下的高效导航,展示了它在家庭、灾后救援等复杂环境中的广泛应用潜力。NaVILA的“无图导航”使得机器人能够在未知和动态变化的环境中灵活适应,进一步扩展了足式机器人的应用场景,如搜救、巡检等任务。这项技术让机器人摆脱了对地图的依赖,真正实现了智能化、灵活化的自主导航
大模型日报(12月11日 资讯篇)
https://mp.wei‍xin.qq.com‍/s/rVDPUB3nXFFLSg2QwfcAhw

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

Canvas在向所有用户开放:一种与 ChatGPT 合作的新方式,用于起草、编辑并获得有关写作和代码的反馈

Canvas——一种与 ChatGPT 合作的新方式,用于起草、编辑并获得有关写作和代码的反馈——现已在我们的 4.0 模型中向所有用户开放。
它已完全在网页版和 Windows 的 ChatGPT 桌面应用程序中上线。
通过新的复制粘贴体验,现在可以更轻松地将您的写作和代码带入 Canvas。
您现在可以直接在 Canvas 中运行 Python 代码,并让 ChatGPT 根据控制台错误修复任何 bug。
Canvas 现在也可以与 GPT 配合使用。

Altman:
Canvas 现已向所有 ChatGPT 用户开放,并且可以执行代码!
更重要的是,它仍然可以为您的写作添加表情符号。 😊

大模型日报(12月11日 资讯篇)

https://x.com/OpenAI/status/1866578914233159928
02 

Devin正式上线:只需标记 Devin,即可修复前端 bug、为待办任务创建初稿 PR、进行重构等操作

Devin 从今天起正式上线!
只需标记 Devin,即可修复前端 bug、为待办任务创建初稿 PR、进行重构等操作。
立即开始使用 Devin 吧:

大模型日报(12月11日 资讯篇)

https://x.com/cognition_labs/status/1866535303911182771
03

Nous Simulators 正式发布:NousResearch所有关于人类与 AI 在社会领域互动实验的基地

Nous Simulators 正式发布!
这是我们所有关于人类与 AI 在社会领域互动实验的基地。
访问链接: http://sims.nousresearch.com
大模型日报(12月11日 资讯篇)
https://x.com/NousResearch/status/1866584568548995538
04

Ambient:电脑上的情境感知 AI,可查看整个屏幕, 长上下文窗口,具备记忆功能

介绍Ambient:电脑上的情境感知 AI。
我刚用它爬取了整个 Discord 并总结了大家的痛点。
功能亮点:
• 可查看整个屏幕(包括需要滚动才能看到的部分)
• 长上下文窗口
• 具备记忆功能
链接:tryambient.com
                   大模型日报(12月11日 资讯篇)
https://x.com/Karmedge/status/1866506853896843266
05

Offner分享Sora视频效果引热议:“Sora 是一个数据驱动的物理引擎。”

Sora 是一个数据驱动的物理引擎。”

大模型日报(12月11日 资讯篇)

https://x.com/chrisoffner3d/status/1866454313502925109

产品

01

Remento 为家人撰写传记的人工智能

Remento 的独特之处在于将传统的记忆整理和家族故事书写,与先进的语音识别与自然语言生成技术有机融合。过去,人们往往需要花费大量时间去记录、整理和润色亲人们的生活经历、家庭轶事与人生智慧,而在 Remento 的平台上,这一过程则被大大简化。您只需在一周内进行数次简短的语音采访,通过对话的方式引导家人自然倾诉他们的人生故事:他们的童年回忆、成长历程、人生里程碑,以及平凡又珍贵的家庭片段。
在幕后,Remento 的 Speech-to-Story 技术会自动将原始录音转化为流畅、清晰、有条理的文字内容,并经过智能化的编辑和润色,将这些片段串联成有温度、有韵味的家庭回忆录。整本书籍不仅在排版和装帧上精美考究,更在每一页的故事段落旁附上二维码链接,当读者用手机扫描时,便能即时聆听到原汁原味的音频片段。如此一来,每当您翻开这本精装回忆录,纸张上的文字与声音记录便能交织出丰富而真实的情感体验,让那些稍纵即逝的口述记忆凝结成可持续传承的家族记忆资产。
大模型日报(12月11日 资讯篇)
https://www.remento.co
02

斑马猫 2.0 视频生成模型

只需轻轻点击几下,您便能将原本平淡乏味的文字内容或音频素材,轻松转化为适合在 TikTok、Instagram 和 YouTube 等热门社交平台上广泛传播的引人注目的视频作品。借助先进的 AI 技术,我们不仅为您提供细腻生动的视觉特效,更能为您打造高度逼真、个性鲜明的 AI 虚拟形象和动听悦耳的合成声音,让您的故事在镜头前焕发新生。
在这个过程中,您无需任何视频制作或剪辑经验,也无需掌握复杂的后期处理技巧。我们的智能系统会为您自动匹配最佳的画面风格与配色方案,为您的内容增添艺术化的表现力,让主题更具感染力。无论是品牌宣传、产品介绍、个人博客,还是教育短片、访谈摘要,只需几步操作,您的创意就能被快速包装成具有社交媒体爆款潜力的优质视频。
大模型日报(12月11日 资讯篇)
https://www.zebracat.ai/?ref=producthunt

投融资

01

OpenAI 支持的语言学习平台 Speak 获得 7800 万美元融资,估值达 10 亿美元

2024年12月10日,语言学习平台 Speak 宣布完成了 7800 万美元的 C 轮融资,此轮融资由 Accel 领投,OpenAI(通过其创业基金)、Khosla Ventures 和 Y Combinator 等老股东也参与其中。此次融资使 Speak 的估值跃升至 10 亿美元。仅六个月前,该公司刚刚完成了一轮 2000 万美元的 B 轮扩展融资,估值为 5 亿美元。
Speak 的平台通过 AI 技术帮助用户通过语音交流学习语言,而非传统的以阅读和写作为主的学习方法。其核心功能是通过生成音频对话并监听用户的语音回答,以帮助他们更好地掌握语言。OpenAI 是该公司的重要合作伙伴,利用其技术支持 Speak 的语音识别和自然语言处理功能。公司表示,未来的资金将主要用于扩展更多语言的学习课程,初步计划从西班牙语和法语开始扩展。
Speak 目前的主要目标群体是学习英语的用户,其平台已被下载超过 1000 万次,付费用户为每月 20 美元或每年 99 美元。公司还为企业客户提供 Speak for Business 服务,现已拥有 200 多个企业客户。公司表示,其将继续专注于提高学习效果,并探索如何量化语言流利度,以便为用户提供更有效的语言学习体验。
公司官网:https://www.speak.com/
大模型日报(12月11日 资讯篇)
https://techcrunch.com/2024/12/10/openai-backed-speak-raises-78m-at-1b-valuation-to-help-users-learn-languages-by-talking-out-loud/
02

LambdaTest 完成 3800 万美元融资,推动 AI 自动化测试

2024年12月10日,云端软件测试平台 LambdaTest 宣布完成了 3800 万美元的 D 轮融资,此轮融资由 Avataar Ventures 领投,Qualcomm Ventures 参投。此次融资使 LambdaTest 总融资额达到了 1.08 亿美元。公司计划利用这笔资金进一步拓展现有市场,并增强其 AI 技术能力。

LambdaTest 提供一个基于云的基础设施,帮助企业在超过5000种浏览器和操作系统组合上进行软件测试。通过 LambdaTest 的平台,企业无需搭建和维护昂贵的测试环境,就能轻松验证软件在不同环境下的运行效果。近期,LambdaTest 推出了 KaneAI 平台,旨在通过 AI 驱动的自动化减少繁琐的测试任务,提升测试效率。据称,KaneAI 能将手动编写测试脚本的工作量减少 40%-70%。
此外,LambdaTest 的 HyperExecute 平台允许团队比传统的云平台更快地执行测试,速度提升高达 70%。公司还推出了其他智能测试功能,如识别不稳定测试并自动重试失败的测试,提高了测试反馈速度。LambdaTest 的 AI 驱动的自动化测试平台被认为是提升软件质量保障和加速发布周期的关键工具。
此次融资也进一步巩固了 LambdaTest 在与竞争对手(如 BrowserStack 和 SauceLabs)竞争中的领先地位。公司表示,已经为超过 15,000 个客户提供服务,包括多个财富500强企业和全球2000强企业。
公司官网:https://www.lambdatest.com/

大模型日报(12月11日 资讯篇)

https://techcrunch.com/2024/12/10/software-testing-platform-lambdatest-secures-38-million-in-ai-push/

03

Automattic 收购 WPAI:推动 WordPress AI 解决方案

2024年12月9日,WordPress 主机公司 Automattic 宣布收购 WPAI,这是一家专注于为 WordPress 提供 AI 解决方案的初创公司。WPAI 的产品包括 CodeWP(AI 插件生成工具)、AgentWP(WordPress 网站构建助手)和 WP Chat(WordPress 问答聊天机器人)。Automattic 表示,WPAI 的核心产品 CodeWP 和 AgentWP 将停产,并会整合进 Automattic 的现有服务中。WPAI 的创始团队将加入 Automattic,专注于推进 WordPress AI 技术的发展。尽管交易的财务条款未披露,但 Automattic 明言将继续增强 WordPress 的 AI 能力,致力于创新和平台功能提升。

此外,Automattic 在不到两个月内完成了第二笔收购,上一笔是收购了开发者语法检查工具 Harper。WPAI 的加入预计将对 WordPress 的开发者和用户体验产生深远影响,特别是在创建和管理网站方面。
公司官网:https://wpai.co/
大模型日报(12月11日 资讯篇)
https://techcrunch.com/2024/12/09/automattic-acquires-wpai-a-startup-that-creates-ai-solutions-for-wordpress/


推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/12/25513.html

Like (0)
Previous 2024-12-11 18:17
Next 2024-12-12 18:15

相关推荐