大模型日报(8月26日 学术篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(8月26日 学术篇)

论文

01

扩散模型是如何学习进行因式分解和合成的

扩散模型能够生成照片级别的图像,结合训练集中可能不常见的元素,展示了组合泛化的能力。然而,复合性的精确机制以及通过训练如何获得仍然难以捉摸。受认知神经科学方法启发,我们考虑一个高度简化的设置,以研究扩散模型是否学习了语义上有意义且分解的可组合特征表示,并确定其学习时间。我们在训练生成各种形式的2D高斯数据的条件降噪扩散概率模型(DDPMs)进行了广泛的受控实验。我们发现,模型学习了分解但不完全连续的流形表示形式,用于对数据潜在变化的连续特征进行编码。通过这样的表示,模型展示了更优越的特征组合性,但在涉及未知特征值的插值方面表现出有限能力。我们的实验结果进一步表明,扩散模型可以在少量组合示例的情况下实现组合性,暗示了训练DDPMs的一种更有效的方法。最后,我们将扩散模型中的流形形成与物理学中的渗透理论相联系,为分解表示学习的突然发生提供了洞察力。因此,我们的彻底的玩具实验有助于更深入地理解扩散模型如何捕捉数据中的组合结构。
大模型日报(8月26日 学术篇)
大模型日报(8月26日 学术篇)http://arxiv.org/abs/2408.13256v1
02

LLM作为智能体在LLM对齐任务中的系统评估:可解释指标和多样化提示模板

摘要:最近,像GPT-4这样的商业大语言模型 (LLMs) 被用来评估和比较不同的LLM对齐方法,这些方法旨在使LLM与人类偏好对齐。然而,LLM评判者的偏见和不一致的决策被认为降低了LLM评判的可信度。我们在这项工作中系统评估了LLM评判者在对齐任务中的性能,并提出了改进理论可解释性的评估指标,以及解决LLM内部不一致性的可靠性指标。我们开发了一个框架,评估、比较和可视化LLM评判者的可靠性和对齐性,以提供有助于选择LLM评判者的信息观察。我们的结果表明,提示模板对LLM评判者表现有显著影响,同时测试的LLM评判者与人类评估者之间的对齐水平中等。
大模型日报(8月26日 学术篇)
大模型日报(8月26日 学术篇)http://arxiv.org/abs/2408.13006v1
03

多层Transformer的梯度可以在几乎线性时间内进行近似求解

摘要:流行的Transformer结构中自注意机制的二次计算复杂度给训练和推理带来了显著挑战,特别是在效率和内存需求方面。为了解决这些挑战,本文介绍了一种新颖的快速计算方法,用于多层Transformer模型中的梯度计算。我们的方法可以在几乎线性时间$n^{1+o(1)}$内计算整个多层Transformer模型的梯度,其中$n$是输入序列的长度。这一突破显著降低了与传统二次时间复杂度相关的计算瓶颈。我们的理论适用于任何损失函数,并在整个模型中保持有界的近似误差。此外,我们的分析可以适用于包含许多实用子模块的多层Transformer模型,如残差连接、因果掩码和多头注意力。通过提高大语言模型中梯度计算的效率,我们希望我们的工作能根据我们的理论结果促进更有效的长上下文语言模型的训练和部署。
大模型日报(8月26日 学术篇)
大模型日报(8月26日 学术篇)http://arxiv.org/abs/2408.13233v1
04

LLM是否能成为基于提示工程的良好路径规划器?缓解路径规划的虚幻感

摘要:大语言模型(LLMs)中的空间推理是具有实体智能基础。然而,即使在简单的迷宫环境中,LLMs仍然在长期路径规划中遇到挑战,主要受空间错觉和长期推理中的环境不一致错觉的影响。为了解决这一挑战,本研究提出了一种创新模型,即空间到关系转换和课程Q学习(S2RCQL)。为了解决LLMs的空间错觉,我们提出了空间到关系方法,将空间提示转化为实体关系和代表实体关系链的路径。这种方法充分发挥了LLMs在顺序思考方面的潜力。最终,我们提出了一种基于Q学习的路径规划算法,以减轻LLMs的环境不一致错觉,增强了LLMs的推理能力。通过将状态-动作的Q值作为提示的辅助信息,我们纠正了LLMs的错觉,从而引导LLMs学习最佳路径。最后,我们提出了一种基于LLMs的逆向课程学习技术,以进一步减轻环境不一致的错觉。通过降低任务难度并利用成功经验,LLMs可以迅速积累成功经验,并用于解决更复杂的任务。我们基于百度自主开发的LLM ERNIE-Bot 4.0进行了全面实验。结果显示,与先进的提示工程相比,我们的S2RCQL在成功率和最优率方面实现了23%到40%的改进。
大模型日报(8月26日 学术篇)
大模型日报(8月26日 学术篇)http://arxiv.org/abs/2408.13184v1
05

多模态对比上下文学习

快速增长的大语言模型(LLMs)的使用突显了无梯度上下文学习(ICL)的重要性。然而,解释它们的内部工作仍然具有挑战性。本文介绍了一种新型的多模态对比上下文学习框架,以增强我们对LLMs中ICL的理解。首先,我们提出了对比学习为基础的ICL在现实世界环境中的解释,将关键值表示的距离作为ICL的差异化因素。其次,我们开发了一个分析框架,以解决多模态输入格式化对现实世界数据集的偏见。我们展示了ICL示例的有效性,即使在未见格式中表示时,基线性能很差。最后,我们提出了一种即时的ICL方法(文本锚定ICL),在检测仇恨表情包等任务中展示了有效性,这是典型ICL由于资源限制而难以处理的任务。对多模态数据集进行的大量实验表明,我们的方法在各种情境下显著提升了ICL的性能,如挑战性任务和资源受限环境。此外,它为LLMs中上下文学习的机制提供了宝贵的见解。我们的发现对于开发更具可解释性、高效性和鲁棒性的多模态人工智能系统具有重要意义,尤其是在挑战性任务和资源受限环境中。
大模型日报(8月26日 学术篇)
大模型日报(8月26日 学术篇)http://arxiv.org/abs/2408.12959v1
HuggingFace&Github

01

DreamCinema

DreamCinema 是一个创新的电影转移框架,利用生成式人工智能简化电影制作,主要通过提取经典镜头中的人类和相机姿态、生成高质量的 3D 角色,并应用结构引导的运动转移策略来实现用户友好的电影创作。
大模型日报(8月26日 学术篇)https://liuff19.github.io/DreamCinema/
02

miniG

miniG 是一个基于超过 1.2 亿条数据合成数据集训练的模型,支持文本和图像输入,具有 1M 的上下文窗口和 9B 的模型参数。尽管未完全对齐人类偏好,但它在性能上具有一定优势。该模型建议使用标准化的推理实现,以避免性能下降,并提供具体的推理参数以减少幻觉结果。
https://huggingface.co/CausalLM/miniG
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

  3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/08/13370.html

Like (0)
Previous 2024-08-26 18:08
Next 2024-08-26 21:33

相关推荐

  • 让AI助手探索你的研究领域,只需七步!

    让AI助手探索你的研究领域,只需七步! 刚好在咖啡店拿着手机和AI助手侃侃而谈了一把,顺便对某个研究领域从外围往内核理一理思路,起初觉得AI的回答很体系化,有种滴水不漏的感觉,仔细…

    2023-06-27
    188
  • AI双子星ChatGPT+Midjourney完整安装指南!

    AI双子星ChatGPT+Midjourney完整安装指南,看这一篇就够了! 最近老是有些朋友不断地问我要安装指南,我想了想,干脆就一帮到底,于是我自己帮着朋友们把账号和密码注册配…

    2023-03-28
    144
  • 大模型日报(5月6-7日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 论文 0…

    2024-05-07
    179
  • 大模型日报(7月18日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-18
    185
  • 开源分享 | Python可视化开源工具,一口气统统拿下!

    Python可视化开源工具,在这里一口气统统拿下~ 无论是做数据分析,软件系统还是为文章或报告提供有说服力的可视化图形,都是很棒的选择! PyViz是一站式可视化开源工具聚集地,可…

    2023-10-19
    161
  • 投稿太贵了怎么办?来,这有可以免费投稿的期刊 (SCI,Scopus Indexed)!

    发文章是科研工作者的永恒不变的主题,应导师要求,我把计划投稿的期刊名称收集了一下,正当怀着满满成就感准备大干一场之时,被导师“人间清醒”了一把。 以下是我简单总结的研究领域里的主要…

    2022-12-29
    131
  • 大模型日报(10月1-7日国庆特刊 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-10-08
    294
  • 大模型日报(6月27日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-06-27
    190
  • 大模型日报(4月27~28日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 学习 0…

    2024-04-28
    136
  • AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

    AIgents提供了清晰可交互的学习路线图,在数据科学和机器学习领域的探索过程中,有了这张地图,你就不容易再迷路了! 接上一篇关于AIgents的文章《AI学术 | AIgents…

    2023-07-24
    192