MOLAR NEWS
2020年第49期
MolarData人工智能每周见闻分享,每周一更新。
借助机器学习,他们发现了阴谋论是如何传播的
发表在 PLOS ONE 上的研究 ——An automated pipeline for the discovery of conspiracy and conspiracy theory narrative frameworks: Bridgegate, Pizzagate and storytelling on the web,系统地探索了无关的事实和虚假的信息是如何建立的,从而可以追踪到阴谋论的源头。
鉴于真实和虚构的报道都能通过新闻渠道和社交媒体渠道进行传播,我们将越来越难区分事实和虚构,因此,现在迫切需要一种方法了解故事是如何在这些媒体上传播的,而且要了解这些故事赖以存在的生成性叙事框架。
认识到一系列故事或故事片段与具有虚构阴谋论特征的叙事框架是否相一致,可能有助于抵消人们开始相信阴谋论并随后采取行动的程度。
所以,在这支团队提出的框架中,他们认为,假设三个特征 —— 单一的相互作用域、对节点和关系删除的鲁棒性以及外围行为体和关系的增加 —— 将是实际阴谋的关键特征,可能有助于区分实际阴谋和阴谋论。
简言之,阴谋论的特点似乎是参与者的数量相对较少,多个相互关联的领域,以及叙事框架图的脆弱性,通过删除少量的节点或关系,可以很容易地将其断开为一系列不相交的子图。
来源:数据实战派
基于用户点击偏好和阅读满意度的个性化新闻推荐技术
一种典型的个性化新闻推荐流程如图1所示。用户访问一个新闻网站,新闻网站根据用户兴趣信息从新闻池中召回一批候选新闻,再采用个性化新闻推荐算法对召回的新闻进行排序,选择排名靠前的一部分新闻展示给用户。用户在新闻页面的行为(点击和阅读等)会被记录去更新用户的信息。循环反复后,积累的用户个性化数据越来越多,推荐往往也就越来越精准。
基于如上观察,讲者提出了一种基于点击偏好和阅读满意度的用户建模方法,用于新闻推荐。
该模型主要分为两部分:
-
第一部分基于用户点击的新闻标题对用户的点击行为进行建模;
-
第二部分基于用户阅读的新闻内容来对用户的阅读行为进行建模。
在点击行为建模之中,模型通过标题编码器得到用户点击过的新闻标题的表示,并采用注意力机制选择有较高信息量的标题,获得基于点击行为的用户表示。阅读行为的建模主要通过新闻正文和阅读满意度来体现。具体地,模型首先借助新闻正文的长度以及点击时间,计算用户的绝对阅读速度,再根据平均的阅读速度归一化后,得到相对的个性化阅读速度;然后,模型对个性化阅读速度进行量化并转换为嵌入表示;同时,模型使用内容编码器将新闻内容编码为向量表示,并与个性化阅读速度的嵌入表示共同计算注意力权重,进行阅读行为选择,获得基于阅读行为的用户表示;最终,模型通过一个行为注意网络,聚合基于点击行为以及阅读行为的两种用户表示,得到统一的用户表示。
该模型通过两个任务进行联合训练。一种是基于用户表示和候选新闻标题进行的点击预测,另一种是基于用户表示和候选新闻正文的满意度预测。通过对两个损失函数进行联合优化,可以使得推荐用户不仅更可能点击,还更可能阅读的新闻。
来源:AI TIME 论道
水下机器人天团来了!哈佛大学机器鱼登上Science子刊封面
日前,来自哈佛大学的科学家们就从鱼群中汲取灵感,研发出了一批水下机器人,这种机器人可以像真正的鱼群一样同步运动,且不需要任何外部控制。同时,他们也首次利用水下机器人展示了具有隐性协调的复杂三维集体行为。
这项研究中,单只机器小鱼被命名为“Bluebot”,研究人员共组装了 7 只,它们组成的系统则被称为“Blueswarm”。
Bluebot 的功能设计包括三个主要模块:
-
2 个摄像头可对周围环境进行 3D 感知;
-
3 个 LED 灯作为主动信标,用于相互识别;
-
4 个独立可控鳍片可提供 3D 空间游动。
机载鱼眼镜头相机可检测到最远 5m 相邻 Bluebot 的 LED 灯光和闪烁信号,并使用自定义算法确定其距离、方向和航向。
仅使用基于视觉的局部交互,研究人员报告了几个自组织的水下机器人集体行为示例,这些行为包括协调同步时间,空间受控分散和动态旋转运动等,最后以多种行为的组合来实现搜索任务操作。
所有这些都可以通过使用非常简单的通信方式来实现,并且在位置感测或控制方面没有任何外部辅助,这成功验证了三维空间中隐式、自组织和分散协调的水下机器人集合的概念。
来源:中国人工智能学会
学习历史预测未来,国防科大新模型在多个数据集上实现未来事实预测SOTA
首先,研究者通过复制机制来探究时序事实的内在现象,并提出在时序知识图谱中学习推理未来事实的时候应参考已知事实。其次,研究者通过时间感知复制生成(copy-generation)机制创建了一个新的时序知识图谱嵌入模型CyGNet(Temporal Copy-Generation Network) 。该模型能够结合两种推理模式以根据历史词汇表或整个实体词汇表来进行推测,从而更符合上述 TKG 事实的演变模式。最后,研究者在 ICEWS18、ICEWS14、GDELT、WIKI 和 YAGO 等 5 个公开 TKG 基准数据集上进行了广泛的实验,结果表明 CyGNet 在未来事实(链接)预测任务上优于以往 SOTA TKG 模型。
CyGNet 各部分之间的联系如下图所示,主要由复制模式和生成模式两个模块组成。前者从一个具有重复事实的特定历史词汇表中选择实体,后者从整个实体词汇表选择实体。
时序知识图谱预测在现实中是一个重要且有挑战性的问题。传统的方法大多侧重于通过对时序信息进行精细复杂的建模来提高预测的准确性。CyGNet 抓住时序实体经常性的重复出现这一现象,借鉴了自然语言生成领域中的「复制-生成」机制,设计了两个模块进行预测。两个模块的模型都很简单,却打败了传统的设计很复杂的模型,这充分说明了利用好时序实体重复出现特性的优势。然而对于这一特性不明显的数据,CyGNet 的表现可能未必同样出色。
来源:机器之心
AI摸鱼:日本“AI 鱼脸识别”项目,每分钟可识别100条
近日,日本青森县八户市则开启了一项前所未有的实验——使用配备有 AI 系统与摄像头的设备,代替渔民,对捕捞上来的活鱼进行自动分类。
这一项目从 2018 年就已启动,日本农业、林业和渔业部出资 1.3 亿日元(约合人民币 812.7 万元),共同委托青森县产业技术中心食品研究所,和日本水产研究教育机构等组织进行研发。
研究团队购买并改进了东京「Nireko」(尼利可)制造的设备,然后以鲑鱼、鲭鱼(即青花鱼)和鲱鱼为学习样本,对该设备所搭载的机器学习系统进行了训练。训练数据包括:每种鱼类的大小、形状、肥瘦、颜色等数据。
青森县产业技术中心食品研究所所长藤堂贤治还表示,AI 不仅能够解决渔业的老龄化和劳动力短缺问题,还提高了渔民工作效率。未来希望能将这一系统用于更多鱼类的分类,并将其推广到渔民手中。
来源:学术头条
AI资讯
掌握最新时事新闻
长按扫码关注我们

原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2021/01/8465.html