MolarData| AI领域资讯速递

MolarData| AI领域资讯速递
MOLAR FRESH   2021年第10期
人工智能新鲜趣闻    每周一更新

美团:精确的车道线检测新框架SGNet
本文是来自美团视觉智能中心在车道线检测领域的最新研究成果,目前已被 IJCAI 2021 接收。美团视觉技术团队对当前车道线检测存在的难点进行了重新思考,归纳为三个难点:缺乏对车道线统一且有效的表示方式、缺少对道路场景与车道线间结构关系的有效利用、难以扩展至车道线的其他属性。基于此,研究者提出了一种结构信息引导的车道线检测框架 SGNet,该方法在公开车道线检测数据集上性能明显优于现有方法,同时预测速度可以达到 117FPS。
本文实现了一种结构信息引导的车道线检测框架 SGNet,可以精准地描述车道线并对不确定条数的车道线进行分类与定位,具体架构如图 2 所示。
MolarData| AI领域资讯速递
SGNet 架构
针对目前车道线检测领域存在的三个难题,SGNet 首先构建了一种基于外接框 – 中心线 – 偏移量的车道线表示方法;接着,研究者提出消失点引导的自上而下的锚生成机制;然后,利用预测的车道线掩码添加像素级的结构约束,利用车道线之间的平行关系添加车道线级的结构约束,以及基于透视注意力图添加图像级的结构约束,从而实现车道线的精准分类、定位及细节恢复。
SGNet 在公开数据集 CULane 上进行实验验证,得出该研究提出的方法在大部分类别上都明显优于现有的先进方法,同时在总体的指标上更是显著优于现有方法。尤其是在拥堵 (Crowd)、箭头(Arrow) 和夜晚 (Night) 等类别上,这体现了提出的结构信息引导的车道线检测框架对于这种遮挡严重的场景具有优秀的结构信息建模和推理能力。
来源:机器之心


用于下游密集预测任务的自监督学习方法
来自阿德莱德大学、同济大学、字节跳动的研究者设计了一种简单且有效的密集自监督学习方法,不需要昂贵的密集人工标签,就能在下游密集预测任务上实现出色的性能。目前该论文已被 CVPR 2021 接收。
该研究提出的新方法 DenseCL(Dense Contrastive Learning)通过考虑局部特征之间的对应关系,直接在输入图像的两个视图之间的像素(或区域)特征上优化成对的对比(不相似)损失来实现密集自监督学习。
MolarData| AI领域资讯速递
两种用于表征学习的对比学习范式的概念描述图
现有的自监督框架将同一张图像的不同数据增强作为一对正样本,利用剩余图像的数据增强作为其负样本,构建正负样本对实现全局对比学习,这往往会忽略局部特征的联系性与差异性。该研究提出的方法在此基础上,将同一张图像中最为相似的两个像素(区域)特征作为一对正样本,而将余下所有的像素(区域)特征作为其负样本实现密集对比学习。

具体而言,该方法去掉了已有的自监督学习框架中的全局池化层,并将其全局映射层替换为密集映射层实现。在匹配策略的选择上,研究者发现最大相似匹配和随机相似匹配对最后的精度影响非常小。与基准方法 MoCo-v2[1] 相比,DenseCL 引入了可忽略的计算开销(仅慢了不到 1%),但在迁移至下游密集任务(如目标检测、语义分割)时,表现出了十分优异的性能。DenseCL 的总体损失函数如下:
MolarData| AI领域资讯速递
来源:机器之心

Nature:实现“基因转录”过程高精度解析
5月11日,一篇题为“Neural network aided approximation andparameter inference of non-Markovian models of gene expression”(人工神经网络辅助的非马尔可夫基因表达模型近似与参数推断)的论文登上Nature子刊《Nature Communications》。
该工作的主要内容是:针对细胞内复杂的大规模生化反应,通过将大量中间反应中间步骤等效成一个时滞反应,并采用机理数据深度融合的思想和微分机器学习方法,对时滞随机动态进行高效精确求解,实现对于基因表达实验数据的高通量、高精度解析。
MolarData| AI领域资讯速递
在论文中,作者展示了如何通过结合实验数据,采用神经网络将无法闭式求解的记忆性(非马尔可夫)方程转化成无记忆(马尔可夫)方程,从而实现闭式高效求解。通过测试发现,相较于传统的蒙特卡洛模拟算法,该方法在不牺牲建模精度的前提下,提高计算效率6倍,降低数据依存度至1/30。
来源:AI科技评论
联邦学习的危机:批量恢复加密图像
作为隐私保护重要方法之一的联邦学习,常基于差分隐私(DP),即为数据添加随机噪声,来对数据进行加密。而今天要介绍的这项研究,则意味着联邦学习保护下的用户隐私(如用于AI训练的医疗图像)可能会被击破。
研究者不仅能对48批量大小的图片做到224×224 像素的恢复,在细节重建上也做到了SOTA(见下图)。可以看到,即使对于像ResNet-50这样的深层网络,其从批平均梯度中完全恢复得到的个体图像,也能在视觉还原度和色彩效果上达到非常优秀的效果。
MolarData| AI领域资讯速递
该研究团队引入的模型GradInversion,对比以往从模型参数或模糊数据里重建数据信息的反演技术,在数据重构细节与还原数量上都有了极大提升。作者先是通过对给定的批平均梯度进行了优化,然后对于输入对象的特征分布引入了一组基于多种子优化和图像配准的一致性正则化项,大大提高了图像重建的细节。并且研究者还提出了一种标签恢复法,使用全连接层梯度来恢复真实标签。
现阶段,Reddit上有评论对GradInversion所做的技术改进表示肯定,但也猜测输入图像批次越多信息损失也会越大,所以在现实应用里应该不会造成太大的隐私问题。也有评论指出可以以差分隐私技术来应对这一研究所带来的的隐患,但马上就受到了辩驳:其实差分隐私技术也存在很多潜在弊端,无法做到绝对的隐私保护。这项研究的出现,似乎进一步证明了即便高速发展的隐私保护手段也难以确保绝对的安全。
来源:量子位
自监督学习框架超强助力自动驾驶
近日,来自轻舟智航、约翰霍普金斯大学的研究者提出了一个自监督学习框架,利用激光雷达和相机的自监督学习进行点云运动估计。
为解决LiDAR 的稀疏扫描,连续两个点云之间缺乏精确的点与点的对应问题,该研究提出的方案是利用从相机图像中提取的光流来提供跨传感器的自监督和正则化。如下图所示,这种设计形成了一个统一的学习框架,包括 LiDAR 和配对相机之间的交互。
MolarData| AI领域资讯速递
用于点云体柱运动估计的自监督学习框架
据了解,这项工作是首个能够在完全自监督框架下进行点云体住运动预测的学习范式。该研究提出了新的自监督以及跨传感器(cross-sensory)监督信号,通过紧密整合 LiDAR 点云和配对相机图像来实现所需的自监督。实验表明,与现有的监督方法相比,该方法具有良好的性能。
如上图所示,该研究提出的运动学习方法将点云的结构一致性自监督与跨传感器的运动正则化紧密耦合。正则化包括从光流中分解出自我运动,并在传感器之间执行运动一致性(motion agreement)。该研究还引入了一种基于反投影(back-projected)光流的概率运动掩膜(probabilistic motion masking)来增强点云的结构相似性匹配。
来源:机器之心

END

MolarData| AI领域资讯速递
MolarData| AI领域资讯速递
MolarData| AI领域资讯速递
MolarData| AI领域资讯速递
MolarData| AI领域资讯速递
MolarData| AI领域资讯速递
掌握AI咨询
了解更多科技趣闻
长按扫码 关注我们

原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2021/05/8441.html

Like (0)
Previous 2021-05-14
Next 2021-05-21

相关推荐