我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢迎大家一起交流!
学习
大视觉模型 (LVM) 解读 (六):VIM:使用 ViT 改进的 VQGAN 进行矢量量化图像生成

蚂蚁集团在大模型推荐上的算法和应用

一周AI入门到设计一款NPU芯片系列一 给芯片设计爱好者的礼物

A Primer on Memory Consistency and Cache Coherence 翻译计划(一):引言
Ascend C 多核并行/流水计算/dobule buffer技术

重温SSM(四):有理生成函数的新视角
K_{<L}
。接着,详细介绍了 RFT 方法,即将 SSM 模型的训练、推理和参数化转移到生成函数空间中,这种方法不再依赖于 state size d
,能够降低计算复杂度至O(LlogL)
。作者进一步解释了有理函数与 SSM 模型的联系,并通过行列式恒等式确立了系数a
和b
与A, B, C
的对应关系。文章还探讨了如何求解A, B, C
,提出了使用 “友矩阵(Companion matrix)” 来构造实矩阵的方法。最后,作者讨论了初始化方式,指出在初始化时将a_1,a_2,...,a_d
设为零能够提高数值稳定性,并且通过实验效果展示了 RFT 模型的优势。文章最终总结了 RTF 的计算流程简化和表达能力提升,以及如何通过增大 state size 来改善模型效果,而不增加计算复杂度。浅谈寒武纪开源的Triton-Linalg编译器前端
https://zhuanlan.zhihu.com/p/706401510
Motion-I2V

Crawlee-python

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/07/14167.html