
MOLAR FRESH 2021年第19期
人工智能新鲜趣闻 每周五更新
AI都会写灵魂Rap了?
Transformer跨界说唱,节奏、流畅度都不在话下

只需要给定一句输入,AI 就能生成整首歌词。从押韵、流畅度、节奏方面,基本不逊于人类 Rapper。
这项研究来自港科大、清华、复旦等机构,在这篇论文中,研究者提出了一个基于 Transformer 的 Rap 生成系统「DeepRapper」,该系统可以同时模拟 Rap 的韵律和节奏。
由于没有现成可用的节奏对齐的 Rap 数据集,为了构建这个系统,研究者设计了一个数据挖掘 pipeline,并收集了一个大规模的 Rap 数据集进行韵律建模。受到预训练语言模型的成功启发,研究者将预训练纳入系统。为了获得大规模的预训练数据,研究者还使用了数据挖掘 pipeline 收集了另外两个数据集:
1)节拍对齐的非说唱歌曲,它可以比说唱数据集更大,因为非说唱歌曲比说唱歌曲更通用; 2)纯歌词,同样比非说唱歌曲数据集更大。
在预训练阶段,研究者基于上述两个数据集对 DeepRapper 模型进行了预训练,然后调整模型在说唱歌曲与调整节拍上的性能,微调模型即用于最终的说唱产生。客观评估和主观评估的实验结果都证实了 DeepRapper 在生成押韵和节奏的说唱歌词方面的优势。
(来源:机器人大讲堂)
盲人抖动脸肌就能“打字”!重庆大学受青蛙鸣叫启发,研发免提打字通信系统助力残疾人社交
是什么让病人无需说话,只需抖动脸部肌肉在电脑屏幕上打出 “I NEED WATER” 去向医护人员要水喝?

这是由重庆大学贺显明、郭恒宇、牟笑静等人与王中林院士合作,受蛙鸣行为的启发,联合开发的一款免提打字通信系统,该系统可帮助残疾人与外界通信。该系统的全称叫基于 BTUSE 传感器的免提打字通信系统。即基于摩擦纳米发电机的超灵敏自供电的仿生机电传感器。 由于该传感器输出的是一种脉冲信号,所以该研究团队使用莫尔斯电码作为通信协议,来实现残疾人或者病人的人机交互。
由于不同的触发习惯,每个用户都有一个独特的最优值,而最优值是效率和精度之间的折衷值,可通过机器学习算法的预训练得到。在支持向量机(SVM)模型中进行预训练后,该团队获得了 96.3% 的高识别准确率。作为一种新型医疗通信辅助设备,基于 BTUSE 传感器的免提打字通信系统在智慧医疗方面具有较好的应用前景。
事实上,免提打字通信系统只是该研究团队成果的具体应用之一。围绕 BTUSE 传感器,该研究团队撰写了论文并于近期发表在 Advanced Science。
(来源:机器人大讲堂)
最敏捷机器蟑螂诞生!6秒内穿越1.2米迷宫,可用于气体泄漏检测和灾难救援
真蟑螂踩不死,机器人蟑螂竟然也能踩不死?
相关论文以《静电脚垫使具有轨迹控制的敏捷昆虫级软体机器人成为可能》(Electrostatic footpads enable agile insect-scale soft robots with trajectory control)为题发表在 Science Robotics 上,论文作者主要来自清华 – 伯克利深圳学院、澳门大学以及卡内基梅隆大学。
此次研究成果是一款电子蟑螂机器人,它能像猎豹一样敏捷地转弯。而且运动轨迹可以被精确控制,因而能穿越复杂地形、并快速避开意想不到的障碍。
由于柔韧性较强,即便承受 60 公斤的踩踏力,它也依旧保持完好。蟑螂机器人的外表是金属色,这并不是塑料材质的颜色,而是为了让机器人能导电,该团队在表面镀了一层薄金。
该团队希望把这些特点复制到机器人上,因此选择了不易被踩坏的塑胶材质材料,该材料由一种薄的分层材料构成,当施加电压时,材料会弯曲和收缩。
作者举例称,最近美国佛罗里达州住宅楼倒塌事故,导致数十人死亡,如果使用这款蟑螂机器人,那么就能沿着缝隙往下爬,查看是否还有人被压在建筑物下面,从而实现精准救援。
(来源:DeepTech深科技)
YOLO也玩「吃鸡」,人形目标精准识别!神秘团队用AI打造游戏作弊利器
日前一个FPS游戏视频火爆网络。视频中这位FPS游戏玩家表现堪称出神入化:在2秒钟内消灭四个敌人,而且弹无虚发,枪枪爆头。

这套外挂的厉害之处就在于——它不会被任何反作弊系统侦测到。因为它对于游戏和系统的代码没有进行任何的修改,而是通过外接的视频采集卡+AI+一个输入控制器来实现的。
这套系统的基本原理首先是通过外部视频采集卡来记录游戏的实时输出,并立即将其发送到一台独立的计算机上。
这些显示帧通过CV物体检测算法(比如YOLO)运行,自动标注出敌人位置。一旦敌人在屏幕上被识别出来,这套系统可以很精确地计算出鼠标需要移动的距离和方位,快速瞄准。最后这些数据被发送到像「Titan Two」或「Cronus Zen」这样的控制器上,它可以模拟鼠标的移动,并以极快的速度射击。
在即将推出的版本中,CVCheat将会实现基于计算机视觉的「不可检测的全自动瞄准和全自动射击」。CVCheat Discord的管理员(此处称之为LordofCV)表示,他们的工具并不是为了破坏游戏的平衡。据LordofCV称,随后的版本可以在大约10毫秒内检测到屏幕上的敌人并开火,而且可以在运行速度高达240帧的游戏上有效工作。不过,检测算法还需要进行一些调整。
(来源:新智元)
AlphaFold2带着源码来了,开启AI生命科学的新时代
2021年7月15日,DeepMind团队在Nature杂志上发表了文章”Highly accurate protein structure prediction with AlphaFold”,描述了AlphaFold2,一个基于神经网络的全新设计的AlphaFold版本,其预测的蛋白质结构能达到原子水平的准确度。

AlphaFold 2是一种新颖的机器学习方法,它将关于蛋白质结构的物理和生物学知识,利用多序列比对,融入深度学习算法的设计中。
相对其它基于深度学习预测蛋白结构的算法(存在过度关注局部互作和结构的问题),AlphaFold2通过一种新型基于注意力的深度学习架构,以及使用进化相关序列强制关注多序列比对(full multiple sequence alignment)提高了对蛋白整体结构的把握。不过蛋白复合物多构象问题以及非结构蛋白(Intrinsically unstructured proteins)互作分析问题等对其仍然非常大挑战,需要更多实验数据,考虑更多参数,新型架构。
DeepMind 团队在具有挑战性的第 14 次蛋白质结构预测关键评估 (CASP14) 中验证了基于神经网络的模型的完全重新设计的版本 AlphaFold2,在大多数情况下表现出与实验相媲美的准确性,并且大大优于其他方法。
文章第一份Supplementary Information长达62页,描述了AlphaFold2系统、模型和分析的方法细节,包括数据管道、数据集、modJumpel块、损失函数、训练和推理细节,以及消融。包括补充方法、补充图、补充表和补充算法。
(来源:DrugAI)
END

掌握AI咨询
了解更多科技趣闻
长按扫码 关注我们
原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2021/07/8425.html