大模型日报(1月23日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

欢迎大家一起交流!

大模型日报(1月23日 资讯篇)

资讯

01

三星AI史诗进化!首发安卓XR对标苹果,剧透三折叠和AI眼镜

三星在近日正式发布了其最新旗舰手机Galaxy S25系列,并推出了全新的AI操作系统One UI 7,其中包括了多个AI创新功能。One UI 7集成了强大的拟人智能助理、AI平台化和个性化AI,为用户提供更加智能化的手机体验。三星的AI系统能够预判用户的操作并给出个性化建议,还支持跨应用、跨模态的智能操作,能够在图像、文字、语音等多种形式的信息之间无缝切换。此外,三星还与谷歌紧密合作,将Gemini AI平台整合到Galaxy S25系列中,用户可通过侧键直接调用该平台进行各种操作。
大模型日报(1月23日 资讯篇)
https://mp.weixin.qq.com/s/pNieUf8yPUKpoeVvR1x4JA
02

Step-Video 开年升级

Step-Video V2版本正式发布,相较于V1,V2在语义理解、指令遵循、运动捕捉和视觉创作等方面大幅提升。新版本采用了高压缩比的VAE模型,提高了计算效率,生成视频的训练和生成速度更快。同时,V2在DiT架构与强化学习的融合方面进行了深度优化,提升了视频的生成质量和稳定性。结合自研的多模态大模型和结构化视频知识库,Step-Video V2能够更加精准地理解视频内容和镜头语言,生成的视频更符合语义,细节更加真实。
大模型日报(1月23日 资讯篇)
https://mp.weixin.qq.com/s/GXi7RjvdiQqjkUWGJrOVsA
03
元资助

XR终端,能否吃到AI落地的最佳红利?

2024年,AI在硬件领域的应用进入了一个新的阶段,特别是在XR(扩展现实)技术中,AI的深度融入成为了重要趋势。从眼镜形态的智能硬件到多模态AI的创新应用,AI功能正成为未来XR产品的核心。
去年,几款AI硬件终端受到了市场的广泛关注,尤其是Ray-Ban Meta眼镜,它已经突破了100万台销量,证明了眼镜形态的市场潜力。此外,Meta、谷歌和字节跳动等大厂纷纷布局AI眼镜,Meta的Orion AR眼镜展示了光学显示和AI助理的双重功能,而国内企业如百度、小米也在加速开发相关产品。
AI眼镜的优势在于它们具备全天候陪伴、实时洞察用户意图的能力,眼镜这一形态被认为是最具潜力的硬件平台。相比之下,虽然AR眼镜的光学显示屏可能增加功能,但无屏幕的AI眼镜因其更轻便和较低价格在市场上表现更好。2024年,预计将迎来一场“百镜大战”,特别是国内市场竞争激烈。
与此同时,AI在AR眼镜中的应用也逐渐成熟,AI助手、翻译、会议纪要等功能成为标配。创新应用不断涌现,比如针对盲人设计的无障碍模式,或是具备记忆系统的AI眼镜。AI技术的进步,尤其是大模型的应用,使得这些眼镜具备了更强的多模态能力,能够实现更复杂的功能,如实时视频理解、情境反馈等。
2024年,端到端的AI模型将成为AR眼镜的标准,解决响应速度慢、个性化不足等问题。AI的记忆能力也在不断提升,未来的AI眼镜可能具备“近乎无限”的记忆功能,提升用户体验。
大模型日报(1月23日 资讯篇)
https://mp.we‍ixin.‍qq.com/s/rQ_SiqzxlOvu22X8AAYjiw

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格

构建面向计算机操作的能力:如何构建一个基于大语言模型的智能代理,通过生成鼠标点击和键盘输入来操作计算机界面

我们的首个短期课程与 @AnthropicAI 合作推出!课程主题为 “构建面向计算机操作的能力”。该课程教你如何构建一个基于大语言模型(LLM)的智能代理,通过生成鼠标点击和键盘输入来操作计算机界面。计算机操作是LLM的一项重要新兴能力,它能让AI代理执行更多此前无法实现的任务,因为它能够与专为人类设计的界面交互,而不仅限于通过显式API访问工具。
希望你能喜欢这次学习体验!
该课程由 Anthropic 的课程负责人 @Colt_Steele 授课。你将学习如何将图像推理与工具使用结合起来,实现如下操作:一个模型处理屏幕截图,分析并理解当前的状态,然后通过鼠标点击和键盘输入来导航计算机。
本课程将带你逐步构建关键模块,最终完成一个AI助手的演示——该助手可以使用网络浏览器搜索研究论文,下载PDF文件,并为你总结论文内容。
课程内容包括:
• 了解 Anthropic 的模型家族,学会根据场景选择合适模型,并向 Claude 发送API请求
• 学习使用多模态提示(结合文本和图像内容块)以及处理流式响应
• 通过使用提示模板、利用XML结构化提示和提供示例来改进你的提示效果
• 实现提示缓存,降低成本和延迟
• 应用工具使用技术,构建一个能够调用不同工具以响应查询的聊天机器人
• 掌握所有这些构建模块,并最终完成计算机操作的综合演示
演示中,AI助手将:
1. 使用网络浏览器搜索研究论文
2.下载PDF文件
3. 总结论文内容
请通过以下链接报名:https://deeplearning.ai/short-courses/building-towards-computer-use-with-anthropic

大模型日报(1月23日 资讯篇)

https://x.com/AndrewYNg/status/1882125891821822398


02 

在iPhone16上运行精简为 Qwen 1.5B的DeepSeek R1


DeepSeek R1 精简为 Qwen 1.5B,可以轻松运行在我的 iPhone 16 上,通过 MLX Swift 实现。

以下是该 4-bit 模型完全在设备上运行的推理表现,速度接近每秒 60 个 token:

大模型日报(1月23日 资讯篇)

https://x.com/awnihannun/status/1882105560201617903

 投融资

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

Vertice融资5000万美元,推动AI驱动的SaaS支出平台发展


Vertice,这家总部位于伦敦的初创公司,专注于利用人工智能优化企业在软件和云支出管理中的效率,近日成功获得5000万美元的C轮融资。该公司成立三年间业务增长了13倍,已成为支出管理领域的重要参与者。Vertice的AI平台帮助企业在采购过程中节省资金和时间,尤其是通过加速采购周期和降低支出。其客户涵盖了ASML、Euronext、Grant Thornton以及桑坦德银行等知名企业。

本轮融资由Lakestar领投,Perpetual Growth、CF Private Equity以及此前的投资者Bessemer Venture Partners和83North参与。融资后,Vertice的累计融资总额已达到约1亿美元,估值接近5亿美元。CEO兼联合创始人Roy Tuvey表示,本轮融资是一次上调轮次,公司的估值已高于去年C轮时的“数亿”水平。
Vertice的创新之处在于其平台能够结合企业的数据,深度了解采购行为,并通过AI技术提供采购建议。该公司已经整合了价值34亿美元的SaaS和云支出数据,并对超过16000家软件供应商进行过基准分析,从而为客户提供精准的采购参考。与传统的采购平台不同,Vertice能够在帮助企业节省支出的同时,大幅度缩短采购周期,通常可减少20%到30%的支出。
通过自动化采购流程和引入AI辅助,Vertice使得财务团队能够更高效地完成工作,自动生成价格基准和分析报告,从而缩短决策时间并减少人工干预。Lakestar的投资合伙人Georgia Watson表示,当前企业在降本增效的压力下,Vertice的技术受到了高度关注,尤其是在资金紧张的初创公司中,该平台的反馈非常积极。
Vertice的创始人Tuvey兄弟曾成功创办并出售两家安全初创公司,分别是ScanSafe(被思科以2亿美元收购)和Wandera(被Jamf以4亿美元收购)。他们的创业经验以及Vertice在采购领域的创新,成为了投资者青睐的重要原因。随着云计算和AI技术的迅猛发展,预计未来几年全球在数据中心、软件和IT通信服务上的支出将超过5万亿美元,Vertice正处于这一快速增长的市场中。
公司官网:https://www.vertice.one/
大模型日报(1月23日 资讯篇)
https://techcrunch.com/2025/01/21/vertice-raises-50m-for-its-ai-powered-saas-spend-platform/




推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/01/36521.html

Like (0)
Previous 2025-01-22 22:09
Next 2025-01-24 19:50

相关推荐