在国内,生成式 AI 引发的这场算力竞赛也变得愈发激烈。但除了疯狂堆卡,企业还有没有其他更加经济、有效的方法来提升算力,尤其是在 AI 芯片国产化进程加速的当下?对此,中科院计算所编译团队负责人、中科加禾创始人崔慧敏提到了一条鲜有人涉足的路径 —— 编译技术。编译的作用就像一位翻译,它能把高级编程语言翻译成芯片可以理解并执行的机器语言。同时编译器还要做优化,让生成的机器代码运行起来更高效。这种优化的力量有多大?崔慧敏提到,「我们能做到的是在不降低算法精度的情况下,把算力的利用效率给提上来,提供额外的 2~10 倍的性能提升。」这个数字可能超出了很多人的预料,就像崔慧敏所说,「在 AI 这样的负载里面,编译器的作用其实是被远远低估了的。」https://mp.weixin.qq.com/s/KUoC7lGAy8m8A_6Uz0WkUw03
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了
众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截?也许很多人开过这样的脑洞,现在有大佬实现了。今天凌晨,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy发布了一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」。GitHub 链接:https://github.com/karpathy/llm.c消息一出,立即引发了机器学习社区的热烈讨论,项目的 Star 量不到七个小时就冲上了 2000。有网友表示,大佬从零开始用 C 语言写大模型只为好玩,我等只能膜拜。https://mp.weixin.qq.com/s/YMuq9Jo9Nibl1QFbLNxazg044
Nat. Mach. Intell.|设计超高效疫苗,普林斯顿团队开发首个解码mRNA序列大模型
普林斯顿王梦迪团队迎来了一项具有划时代意义的突破,该团队开发了世界首个解码mRNA非翻译区域序列的大模型,用于准确预测从mRNA到蛋白质的转录功能,及设计新序列用于mRNA疫苗。该研究论文的题目是「A 5’ UTR Language Model for Decoding Untranslated Regions of mRNA and Function Predictions」,已被《Nature Machine Intelligence接收。这篇论文意味着大语言模型可以用于预测和设计mRNA疫苗,其中新设计的序列经过实验证实远高于传统疫苗的转录效率。AI和语言模型正在颠覆生物学和制药研究中的传统方法。https://mp.weixin.qq.com/s/OVRY-R7gROFsGd8krd6fMQ05
据联发科官方消息,在今日举行的生成式 AI 论坛期间,联发科生成式 AI 服务平台 MediaTek DaVinci 正式推出,亦称“联发科技达哥”,目前已有超过 40 家厂商加入其生态系统。据悉,该工具最初为集团内部生成式 AI 工具,被广泛应用于软件开发的需求分析和规格设计、人资的自动媒合、财务的报销流程、法务的专利翻译和合约诉讼等,集团渗透率达到 96%。同时,联发创新基地还发布了该平台最新的繁体中文大型语言模型 MediaTek Research BreeXe(IT之家下文简称 MR BreeXe)。MR BreeXe 以 Mixtral 8x7B 模型为基础开发,继承 Mixtral 多专家模型特有的节省运算资源、提升速度优势,号称在繁体中文测试项目(TMMLU+、MT Bench TW)超越 GPT-3.5,并对台湾地区常见的地端应用进行了“特别优化”。https://www.ithome.com/0/760/772.htm07
杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人
在人类的社交活动中,为了更有效地在工作和生活中与他人沟通,需要一定的社交技能,比如解决冲突。然而,社交技能的练习环境对于大多数人来说通常是遥不可及的。特别是由专家训练这些技能时,往往耗时、投入高且可用性有限。现有的练习和反馈机制很大程度上依赖专家监督,使训练难以扩展。此外,经过专业培训的教练也缺乏,而大多数可以提供定制化反馈的教练无法帮助大量有需要的人。近日,在由斯坦福助理教授杨笛一为共同一作的论文《Social Skill Training with Large Language Models》中,研究者认为,借助大语言模型可以使得社交技能训练变得更容易、更安全、更有吸引力,并在现实、虚拟练习空间中提供量身定制的反馈。https://mp.weixin.qq.com/s/gGZ3V3ZsMfT8klvuCw7L4g08
CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
大语言模型(LLMs)的成功激发了计算机视觉领域探索分割基础模型的兴趣。这些基础分割模型通常通过 Prompt Engineer 来进行 zero/few 图像分割。其中,Segment Anything Model(SAM)是最先进的图像分割基础模型。将预训练好的 SAM 适应到下游任务主要面临三个挑战:
UI Bakery 是一个自助低代码平台,允许快速构建定制的 Web 应用程序(内部工具、客户应用程序和管理面板)。最近推出了 UI Bakery AI 应用生成器,这个工具允许在现有数据(目前是 SQL 数据库)的基础上生成功能性的 Web 应用程序,只需指定一个提示。这个工具可以用于创建内部工具、CRUD 应用、管理面板、对数据进行对话式搜索以及原型设计和构思。生成应用程序后,用户可以通过后续提示进行调整或澄清,或者将其转换为 UI Bakery 应用程序,以在 UI Bakery 可视化编辑器中继续开发。https://uibakery.io/ai-app-generato02
Odaptos
Odaptos 提供了一种用于用户体验(UX)研究项目的人工智能工具。他们的人工智能分析可以捕捉传统分析所忽略的情感细微差别,帮助更好地理解用户。该工具的一些关键特性包括自动生成用户会话文本、轻松招募测试参与者、清晰展示用户旅程中的关键时刻、情感视频回放、可用性评分(SUS)、以及一个名为 Oda 的聊天机器人,它可以提供快速摘要和见解。https://odaptos.com/投融资01