MolarData| AI领域资讯速递


MOLAR NEWS

2020年第42期  


MolarData人工智能每周见闻分享,每周一更新。

Transformer Yes!华为诺亚、北大等提出IPT模型,底层视觉任务刷榜

北京大学等最新发布论文,联合提出图像处理Transformer,通过对low-level计算机视觉任务,如降噪、超分、去雨等进行研究,提出了一种新的预训练模型IPT,占领low-level多个任务的榜首。

MolarData| AI领域资讯速递

IPT模型采用多头、多尾设计,共用Transformer body,用于图像超分辨率、去噪等不同的图像处理任务。

为了最大限度地挖掘Transformer架构在各种任务上的性能,本文研究了一个合成的ImageNet数据集。其中,每个原始图像将被退化为一系列对应的配对训练数据。然后使用有监督和自监督方法训练IPT模型,这两种方法显示出很强的捕获底层图像处理固有特征的能力。

实验结果表明,本文的IPT可以在快速微调后,仅使用一个预训练的模型,就可以优于目前的SOTA方法。在未来的工作中,作者将把IPT模型扩展到更多的任务中,比如去模糊、去雾等。

来源:AI科技评论



英特尔与京东联合强化AI武器:让创新更专注

为了给AI领域的向量检索提供基础系统支撑与保障,京东与英特尔合作,在基于英特尔®至强®可扩展处理器的服务器上对分布式特征向量检索系统Vearch 进行优化,借助英特尔软硬结合优势,帮助企业改进重复图片去重、相似性商品图片搜索、人脸识别等 AI 应用的响应速度,并大幅降低特征向量检索系统总体拥有成本(TCO)。

MolarData| AI领域资讯速递

在软件方面,京东在某些向量召回场景使用“图+量化”的组合索引方式,它可以召回有序结果,避免了二次排序时需要存储原始向量的做法。

英特尔的硬件优势是特征向量索引性能提升的关键因素。京东采用的是英特尔®至强®可扩展处理器,不仅拥有强大的通用计算能力,其上还集成了增强单指令多数据流(Single Instruction Multiple Data,SIMD)的英特尔®AVX-512指令集等创新技术,可以为单条指令提供双倍数量的操作数,从而大大提升指令的吞吐能力。

来源:AI科技评论



论文解读丨基于神经网络的多音区语音唤醒

基于神经网络的多音区语音增强模型是首个完全基于神经网络的多音区语音增强模型。此模型适用于多麦克风设备的语音唤醒。

针对传统多音区处理多次调用唤醒模块功耗大的弊端,新模型将注意力 (attention) 机制引入到唤醒框架下多个 look-direction 增强的信号提取特征后通过 attention 层映射成单通道输入特征,再送入单路唤醒网络层,与单路唤醒相比仅仅增加了一层网络,既保证了唤醒性能,计算量又大大降低。

MolarData| AI领域资讯速递

多音区的语音增强模型已经与声纹模型结合,形成多音区的说话人验证,提升声纹系统在复杂远场声学环境下的鲁棒性。未来这一工作可与语音识别等其它语音任务相结合。

来源:中国人工智能学会



性能提升30%以上,实时实例分割算法SOLOv2实现产业SOTA

SOLOv2 算法可以按位置分割物体,完成实例分割任务,同时还兼具实时性由于其出色地兼顾了精度和速度,已经被广泛应用于自动驾驶、机器人抓取控制、医疗影像分割、工业质检和遥感图像分析等领域。

MolarData| AI领域资讯速递 

经过 PaddleDetection 深度优化后的 SOLOv2 在具有如下五大亮点:

  • 更优的骨干网络:ResNet50vd-DCN + 蒸馏

  • 更稳定的训练方式:EMA、Sync-BN

  • 更多的数据增强方法

  • 更快的训练方式

  • 多种部署方式

来源:AI科技评论

告别视频通话“渣画质”,英伟达新算法最高压缩90%流量

和其他视频相比,通话的场景比较单一,基本上只有人的头部在运动。因此只要能把头像数据大规模压缩,就能大大节约流量。

MolarData| AI领域资讯速递

英伟达的新算法face vid2vid正是从这一点出发。只要一张图片,就能实现重建各种头部姿势图片。

我们把上传的清晰照片作为源图像,从中获取外貌特征。然后把视频中一帧帧画面作为重构视频的依据,从中提取出面部表情和头部姿势等信息。

而表情和姿势这两个数据可以通过关键点进行编码,这样就分离了人物身份信息和运动信息。在传输视频时只要有运动信息即可,从而节约了流量。

MolarData| AI领域资讯速递

来源:量子位

AI资讯

掌握最新时事新闻

长按扫码关注我们

MolarData| AI领域资讯速递

原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2020/12/8479.html

Like (0)
Previous 2020-12-05 00:09
Next 2020-12-11 23:38

相关推荐