DNA 语言仅包含四个核苷酸的词汇,它编码了协调细胞中从 DNA 到 RNA 和蛋白质的所有调控层所需的基本信息。这些指令指导每个细胞的功能并在世代之间传递信息。基因组序列的变化推动进化,使生物体能够通过有利 DNA 序列的自然选择来适应环境。因此,比较进化上多样化的基因组中的 DNA 序列可以使大型语言模型能够学习 DNA 语法,而这已经避开了在单一基因组上训练的模型 (1)。在本期第 746 页,Nguyen 等人。(2) 介绍 Evo,这是一个基于 2700 万个进化多样化的原核生物和噬菌体基因组进行训练的基础模型。学习了基因组逻辑后,Evo 可以解码自然基因组;支持 DNA、RNA 和蛋白质的预测和设计任务;并在全基因组规模上生成 DNA。https://x.com/ScienceMagazine/status/1857137706112864541HuggingFace&Github01
eliza
Eliza 是一个功能丰富的对话式聊天机器人,支持 Discord、Twitter 和 Telegram 等多种平台。它可以轻松地摄取和与文档进行交互,并提供可检索的内存和文档存储。Eliza 是高度可扩展的,用户可以创建自己的动作和客户端来扩展其功能。它支持多种模型,包括本地 Llama、OpenAI、Anthropic、Groq 等。https://github.com/ai16z/eliza02