大模型日报(2月19日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

欢迎大家一起交流!

大模型日报(2月19日 资讯篇)

资讯

01

前OpenAI首席技术官Mira Murati创立新AI初创公司Thinking Machines Lab

前OpenAI首席技术官Mira Murati于2025年2月18日宣布成立其新的初创公司——Thinking Machines Lab。该公司专注于开发AI技术,旨在构建能够满足用户独特需求和目标的工具,并打造更易于理解、可定制且功能更强大的AI系统。

Thinking Machines Lab的核心团队成员包括OpenAI联合创始人John Schulman担任首席科学家,以及前OpenAI首席研究官Barret Zoph担任首席技术官。公司计划专注于开发多模态系统,这些系统能够与人类协作,并适应不同领域的专业知识,从而推动更广泛的应用。

此外,该公司还强调AI安全的重要性,计划通过防止模型滥用、分享构建安全AI系统的最佳实践以及支持外部对齐研究来推动行业安全发展。

Murati于2023年10月离开OpenAI,此前她在OpenAI任职六年,领导了包括ChatGPT、DALL-E和Codex等多个重要项目。她在离开OpenAI时表示,希望进行“自己的探索”,而Thinking Machines Lab正是这一探索的成果。

目前,Thinking Machines Lab正在积极招聘机器学习科学家和工程师,并计划扩展其研究项目。尽管尚未确认,但有消息称该公司正在与风险投资公司洽谈,计划筹集超过1亿美元的资金。


大模型日报(2月19日 资讯篇)
https://techcrunch.com/2025/02/18/thinking-machines-lab-is-ex-openai-cto-mira-muratis-new-startup/

02

Meta宣布举办首个生成式AI开发者大会LlamaCon

2025年2月18日,Meta宣布将举办其首个生成式AI开发者大会——LlamaCon。此次大会定于4月29日举行,旨在分享Meta在开源AI领域的最新进展,帮助开发者构建创新的应用和产品。Meta计划在大会上展示其Llama系列生成式AI模型的最新成果,并探讨如何利用这些技术推动行业发展。

LlamaCon的举办正值生成式AI技术快速发展的时期。Meta近年来一直致力于通过开源方式推动AI技术的普及,其Llama模型已被广泛应用于多个领域,包括金融服务、通信和科技等。目前,Llama模型的下载量已达数亿次,并拥有超过25家合作伙伴,包括Nvidia、Databricks和Dell等。这些合作伙伴不仅部署了Llama模型,还开发了相关工具以提升模型的性能和效率。

然而,Meta在生成式AI领域的领先地位正面临挑战。据报道,中国AI公司DeepSeek的崛起对Meta构成了威胁,其新模型可能在性能上超越即将发布的Llama版本。为了应对这一挑战,Meta正在加速技术研发,并计划投入高达800亿美元用于AI项目,包括招聘AI专家和建设新的数据中心。

此外,Meta还面临法律和监管方面的挑战。公司目前正卷入一起诉讼,被指控未经授权使用版权书籍训练其AI模型。同时,由于数据隐私问题,一些欧盟国家已要求Meta推迟甚至取消其模型发布计划。

尽管面临诸多挑战,Meta对生成式AI的未来发展充满信心。公司CEO马克·扎克伯格在2024年第四季度财报电话会议中表示,Llama和开源AI有望在2025年成为最先进的AI模型。Meta计划在未来几个月内推出多个Llama模型版本,包括具备推理能力和多模态功能的模型。


大模型日报(2月19日 资讯篇)
https://techcrunch.com/2025/02/18/meta-announces-llamacon-its-first-generative-ai-dev-conference/


03

2025年斯隆研究奖公布,126位年轻科学家入选

2025年斯隆研究奖(Sloan Research Fellowships)名单已公布,共有来自美国和加拿大的126位年轻科学家入选。这些学者因其在各自领域的卓越成就和巨大潜力脱颖而出,被认为是下一代科学领军人物。每位获奖者将获得75,000美元的奖金,用于支持其未来两年的研究工作。

斯隆研究奖涵盖多个学科领域,包括化学、计算机科学、地球系统科学、经济学、数学、神经科学和物理学。以下是部分获奖者及其所在机构:

化学领域

  • Monther Abu-Remaileh(斯坦福大学)

  • Scott K. Cushing(加州理工学院)

  • Cesar de la Fuente(宾夕法尼亚大学)

  • Milan Delor(哥伦比亚大学)

计算机科学领域

  • David Bau III(东北大学)

  • Raul Castro Fernandez(芝加哥大学)

  • Lydia B. Chilton(哥伦比亚大学)

  • Natacha Crooks(加州大学伯克利分校)

地球系统科学领域

  • Rene Boiteau(明尼苏达大学)

  • Peter W. Crockford(卡尔顿大学)

  • Barnabas Daru(斯坦福大学)

  • Catherine V. Davis(北卡罗来纳州立大学)

经济学领域

  • Corina Boar(纽约大学)

  • Chen Lian(加州大学伯克利分校)

  • Matthew Rognlie(西北大学)

  • Jonathan Roth(布朗大学)

数学领域

  • Jason Altschuler(宾夕法尼亚大学)

  • Anton Bernshteyn(加州大学洛杉矶分校)

  • Pierrick Bousseau(乔治亚大学)

  • Michelle Delcourt(多伦多大都会大学)

神经科学领域

  • Victoria Eugenia Guadalupe Abraira(罗格斯大学)

  • Lauren V. Albrecht(加州大学欧文分校)

  • Lynne Chantranupong(波士顿大学)

  • Vikram Gadagkar(哥伦比亚大学)

物理学领域

  • Alexandra Amon(普林斯顿大学)

  • Daniel Anglés-Alcázar(康涅狄格大学)

  • Rana Ashkar(弗吉尼亚理工学院)

  • Edoardo Baldini(德克萨斯大学奥斯汀分校)。

斯隆研究奖自1955年设立以来,一直致力于支持早期职业科学家的发展,许多获奖者后来成为诺贝尔奖得主或在各自领域取得重大突破。


大模型日报(2月19日 资讯篇)
https://sloan.org/fellowships/2025-Fellows




推特

01
元资助

aisuite 新功能:轻松调用 LLM 进行函数调用

宣布全新 aisuite 功能:轻松调用 LLM 进行函数调用!

函数调用(工具使用)是代理型工作流和其他 LLM 应用的重要能力,但对开发者来说使用起来较为繁琐(图片左侧)。我们的开源 aisuite 包将其简化为仅需一条命令(图片右侧),并支持多个 LLM 提供商。

希望这能让开发者更轻松地实现代理功能!感谢 Rohit Prasad 及团队与我合作!

🔗 GitHub 代码库


大模型日报(2月19日 资讯篇)

https://x.com/AndrewYNg/status/1891885332058210787



02
元资助

OpenAI发布SWE-Lancer:一个更加真实的基准测试,用于评估 AI 模型的编码能力

今天,我们正式推出 SWE-Lancer——一个更加真实的基准测试,用于评估 AI 模型的编码能力。SWE-Lancer 包含来自 Upwork 的 1,400 多个自由软件工程任务,这些任务在实际中共计支付了 100 万美元

大模型日报(2月19日 资讯篇)

https://x.com/OpenAI/status/1891911123517018521



03
元资助

Mistral AI Saba:区域性语言模型, 支持阿拉伯语以及多种印度起源语言,尤其擅长南印度语言

🏟️ 重磅发布

Mistral AI Saba——我们的首个区域性语言模型!

• Mistral Saba 是一个 240 亿参数 的模型,基于来自中东和南亚的精心筛选数据集训练而成。

• Mistral Saba 支持阿拉伯语以及多种印度起源语言,尤其擅长南印度语言,如 泰米尔语(Tamil)和马拉雅拉姆语(Malayalam)

大模型日报(2月19日 资讯篇)

https://x.com/sophiamyang/status/1891487141718376580



04
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格

Dohmke分享:全新代码补全模型 GPT-4o Copilot 今日正式开启公测

我们的全新代码补全模型 GPT-4o Copilot 今日正式开启 公测

基于 GPT-4o mini,在 1 万亿以上代码相关 token 语料 进行中期训练,并结合 代码执行反馈强化学习(RLEF)。随后,我们使用真实的编程工作流进行微调,覆盖 32 种主流编程语言,实现 低延迟、更高质量 的代码补全体验。

首批公测 今日已在 VS Code 上线,JetBrains IDEs 版本将在几天内推出,更多更新即将发布!

🔗 详情

大模型日报(2月19日 资讯篇)
https://x.com/ashtom/status/1891925306430337110



产品

01

Graphiti :构建能从动态数据中学习的个性化人工智能代理

Graphiti 用于人工智能代理的基于知识图谱的记忆系统

从不断变化的业务数据和聊天记录中自动构建丰富的图谱。即使数据随时间演变,也能让你的 Python 代理快速访问相关、准确的数据。访问我们的 GitHub 代码库。

  1. 数据图谱构建:从变化的业务数据与聊天记录中自动生成丰富知识图谱。

  2. 快速数据访问:助力 Python 代理快速获取相关、准确数据。

  3. 数据演变理解:明白新摄入数据对现有数据的影响。

  4. 推理与交互支持:为 AI 代理基于演变数据推理及实现个性化、情境感知交互提供基础。


大模型日报(2月19日 资讯篇)


https://github.com/getzep/graphiti?ref=producthunt


 投融资

01

Hightouch完成8000万美元C轮融资,估值达12亿美元,聚焦AI驱动的营销工具

Hightouch是一家由Segment前工程经理联合创立的初创公司,专注于开发基于AI的营销工具。该公司近日宣布完成8000万美元的C轮融资,估值达到12亿美元。本轮融资由Sapphire Ventures领投,NVC、Amplify Ventures、ICONIQ Growth、Bain Capital Ventures和Y Combinator等机构参投。此次融资将用于继续开发Hightouch的技术,拓展业务以及招聘人才。

Hightouch的核心产品是客户数据平台(CDP),该平台结合机器学习技术,帮助非技术用户和数据科学家更高效地利用数据仓库中的数据进行营销、销售和客户服务。此外,公司还推出了AI Decisioning产品,通过机器学习和自动化技术,为企业提供最优的营销活动建议。AI Decisioning自2024年8月推出以来,受到客户的广泛关注,并推动了Hightouch的新业务增长。

Hightouch的联合创始人兼联合CEO Tejas Manohar表示,AI技术的应用不再仅仅是追求速度,而是帮助企业通过AI提升客户体验和客户生命周期价值。公司此前已完成多轮融资,包括2020年的种子轮、2021年由ICONIQ Growth领投的4000万美元B轮融资,以及2023年的3800万美元C轮融资。


大模型日报(2月19日 资讯篇)
https://techcrunch.com/2025/02/18/hightouch-raises-80m-on-a-1-2b-valuation-for-marketing-tools-powered-by-ai/


02

Lingo.dev:为开发者提供AI驱动的应用本地化引擎

Lingo.dev 是一款专为开发者设计的AI驱动的应用本地化引擎,旨在帮助开发者实现应用前端的全面本地化。其目标是成为开发者技术栈中的基础设施层,类似于Stripe在支付领域的地位。该公司由CEO Max Prilutskiy和CPO Veronica Prilutskaya创立,两人曾在2023年开发出首个原型,并在康奈尔大学的黑客马拉松中获得关注。

Lingo.dev的核心是一个翻译API,支持通过命令行接口(CLI)本地调用或直接集成到CI/CD系统中。它通过结合多个大型语言模型(LLM),如Anthropic和OpenAI的模型,根据任务需求选择最优模型。此外,Lingo.dev还支持翻译记忆、品牌风格指南定制、上下文感知等功能,能够自动调整文本以适应UI设计。

在数据隐私方面,Lingo.dev专注于本地化前端界面,不涉及客户个人身份信息(PII),确保数据安全。公司还计划推出新功能,如通过应用UI截图提取更多上下文信息,以进一步优化本地化效果。

Lingo.dev的客户包括法国独角兽公司Mistral AI和开源日历应用Cal.com。为了推动下一阶段的增长,公司近期完成了420万美元的种子轮融资,由Initialized Capital领投,Y Combinator及其他天使投资人参与。此前,Lingo.dev的创始团队曾通过YC的孵化项目获得支持,并计划将公司总部迁至旧金山。

Lingo.dev的愿景是消除本地化的摩擦,使其成为开发者技术栈中的自然组成部分,从而实现高效、精准的全球应用部署。


大模型日报(2月19日 资讯篇)
https://techcrunch.com/2025/02/18/lingo-dev-is-an-app-localization-engine-for-developers/


推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话


快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/39030.html

Like (0)
Previous 2025-02-19 17:59
Next 2025-02-19 22:58

相关推荐