六篇论文,近期精彩
分类:科学技术

威尼斯国际平台app 1

分享嘉宾:黄靖佳,北京大学深圳研究生院信息工程学院二年级博士生。

论文四:Deep Self-Taught Learning for Weakly Supervised Object Localization

责任编辑:

2)Unsupervised Pixel–Level Domain Adaptation with Generative Adversarial Networks

这篇最具代表性的目标检测论文由腾讯AI Lab和新加坡国立大学合作完成。在检测器训练时,该文提出了一种依靠检测器模型自主动态挖掘高质量正例样本的方法。鉴于CNN检测器有强大的拟合训练样本能力,错误训练样本 (False Positive)同样能获得较高类别置信度。但当检测器训练其它正例样本时,错误训练样本获得的类别置信度增量 (Relative Score Improvement) 较小,因此当检测器在训练其它Positive样本时,一个Object Proposal获得的类别置信度增量大小可有效反映该样本的真实质量 (True Positive或False Positive)。依赖类别置信度增量动态挖掘高质量训练样本,可有效增强检测器性能。 该文在PASCAL VOC 07和12目标检测任务上取得了目前最先进的效果。

威尼斯国际平台app 2

1)Universal Adversarial Perturbations

随着增强现实,家务机器人等应用的普及,室内场景重建研究正在得到越来越广泛的关注。与传统底层密集重建方法不同,讲者的研究集中在分析重建场景中的高层结构化信息。在本次公开课中,讲者将分享其结构化重建的最新工作。返回搜狐,查看更多

现场论文展示分三种形式:12分钟长演讲(Oral)4分钟短演讲(Spotlight)和论文海报展示(Poster),长短演讲共215场,海报展示112个。在参会心得上,我们建议重点参加口述演讲,会对精选文章做长或短的进一步解读;而海报展示数量多、内容杂,只在固定时段有,要用好地图和会程指引,有选择地、集中地参加此环节。展会区囊括各类企业,会从研究到应用进行展示讲解,可选择性参加。

人工智能相关的各个研究方向中,最为丰富也最为热门的当属计算机视觉(CV)了,其中的热门任务包括图像分类、对象检测、图像分割、图像生成、图像描述生成等等。下面我们汇总了近期(2018 年以来)9 期精彩的计算机视觉方向分享回顾。

使用GAN loss生成的结果(黄色方框)能够落在自然图像分布上(红色方框集合)。MSE loss虽能获得平均意义上的最小误差(蓝色方框),但却没落在自然图像分布上(红色方框的集合),因而丢失了很多图像细节。

  • 第 58 期,基于课程学习的强化多标签图像分类算法。

但传统方法对姿态假设池Refinement的步骤非常耗时,如何选择一个较好姿态假设子集作为姿态假设池就变得尤为重要。本文作者提出了一同基于策略梯度的强化学习算法来解决这个问题。该强化学习算法通过一个不可微的奖励函数来训练一个Agent,使其选取较好的姿态假设,而不是对姿态假设池中的所有姿态进行Refine。

分享嘉宾:胡枭玮,香港中文大学二年级博士生。

威尼斯国际平台app ,CCAI 2017 | 张胜誉:个性化推荐和资源分配在金融和经济中的应用

原标题:福利 | AI 研习社大讲堂已逾 60 期!近期精彩 CV 分享回顾

CVPR是近十年来计算机视觉领域全球最有影响力、内容最全面的顶级学术会议,由全球最大的非营利性专业技术学会IEEE(电气和电子工程师协会)主办。今年会议于7月21日至26日在美国夏威夷举行。

二、图像/视频描述生成

分享嘉宾:王薇月,南加州大学计算机系在读博士。

[1] A compact DNN: approaching GoogLeNet-Level accuracy of classification and domain adaptation

视频中的行为检测是当下的热点研究任务,该任务要求从一段未经修剪的(untrimmed)视频中找出目标行为发生的时间区间。由于目标行为可能发生的时间点以及目标行为的持续时间均是不确定的,使得在完成这项任务时往往需要花费大量的计算资源对不同时间尺度(长度),不同起点的视频片段进行判断。为了避免这种低效的检测方法,我们提出了一种可以自适应调整检测窗口大小及位置的方法,对视频进行高效的检测。

计算机视觉团队(CV团队)是最早组建的研究团队之一,目前有十多位基础研究科学家,大多拥有国内外院校博士学位,并与一个较大的应用工程师团队紧密合作,由计算机视觉和机器学习专家刘威博士领导。我们很注重对青年研究者的培养,团队中应届毕业的博士接近半数,也将继续在海内外招募不同级别的优秀研究者。

  • 第 60 期,基于残差密集网络的图像超分辨率 (CVPR 2018 亮点论文)。

1)Deep Self-taught Learning for Weakly Supervised Object Localization

阴影检测是计算机视觉中基础并富有挑战性的问题。检测阴影区域,为进一步获取图像中的光照情况、物体的形状与位置,以及摄像机的参数提供了可能,同时阴影的存在为目标的检测与跟踪带来了障碍。检测阴影区域需要理解图像全局的语义信息,本文提出通过方向性地分析图像空间上下文信息来理解阴影,同时设计了DSC模型用于检测、去除阴影,并在两个阴影检测数据集以及两个阴影去除数据集上都达到了顶尖的性能。这篇论文已被CVPR 2018收录,并做口头报告(Oral)。

2)Global Optimality in Neural Network Training

  • 第 63 期,任中正:利用合成数据的跨领域的多任务视觉特征学习。

论文六:Exploiting Symmetry and/or Manhattan Properties for 3D Object Structure Estimation from Single and Multiple Images

分享嘉宾:刘晨,圣路易斯华盛顿大学计算机系在读博士。

从研究领域和前沿思考出发,我们重点关注了五大领域的前沿研究,以下为重点论文评述。

自 AI 大讲堂去年 7 月上线以来, 已经有来自清华大学、北京大学、上海交通大学、香港科技大学、 MIT、UC Berkeley、悉尼科技大学等知名国内外高校的嘉宾进行直播分享,甚至还举办了线下论文分享会,迄今已完成了 68 期,覆盖影响读者过万人。不仅嘉宾自己的研究成果被直播观众以及读者们了解,也让科技爱好者们、学生们、其它研究人员们增进了对人工智能相关思维、知识、应用的认识,为国内人工智能长期持续发展的氛围出一份力。

本文用深度前向卷积神经网络探索视频艺术风格的快速迁移,提出了一种全新两帧协同训练机制,能保持视频时域一致性并消除闪烁跳动瑕疵,确保视频风格迁移实时、高质、高效完成。

分享嘉宾:何诗怡,北京大学计算机视觉硕士,优必选悉尼AI研究院学生。

2)Object Region Mining with Adversarial Erasing: a Simple Classification to Semantic Segmentation Approach

分享嘉宾:任中正,现UIUC攻读计算机博士。

1、传统机器学习模型方法与深度学习模型深度融合

  • 第 61 期,网格曲面的神经网络 (CVPR 2018 oral: Surface Networks)。

领域自适应(Domain Adaptation)是迁移学习(Transfer Learning)的一种,思路是将不同领域(如两个不同的数据集)的数据特征映射到同一个特征空间,这样可利用其它领域数据来增强目标领域训练。深度学习模型训练需要大规模数据,这篇由谷歌发表的文章,提出的思路是对真实物体进行渲染(Rendering),制造大量人造渲染图像,从而帮助深度学习模型训练。

  • 第 59 期,深度学习在点云分割中的应用。

矩阵的低秩稀疏分解是经典机器学习方法,假设一个大规模矩阵可分解为两个或多个低维度矩阵的乘积与一个稀疏矩阵的和,从而大大降低原矩阵表示元素个数。在这篇由优必选悉尼AI研究所、新加坡理工大学和悉尼大学共同完成的论文中,该方法被用来模拟深度学习的滤波参数矩阵,在保证模型性能同时,大大降低了参数个数,这对深度学习模型的进一步推广,尤其是智能手机端应用会有很大推动作用。类似文章还有杜克大学的这篇[1]。

AI 科技评论按:机器学习、人工智能领域的研究人员,以及任何学术研究人员,都关心这两件事:分享、传播自己的研究成果让更多人知道,以及了解自己研究方向的最新进展、结识更多的研究人员。雷锋网 AI 研习社大讲堂就是一个供研究人员们分享自己成果、促进广泛沟通互动的直播平台。

论文首次提出一种全尺寸、无标注、基于病理图片的病人生存有效预测方法WSISA,在肺癌和脑癌两类癌症的三个不同数据库上性能均超出基于小块图像方法,有力支持大数据时代的精准个性化医疗。

  • 第 68 期,室内场景的结构化重建。

该文的证明运用了机器学习中的矩阵分解和对应的优化理论。这项研究工作展示了全局最优解在深度神经网络中存在的条件,为我们设计更加容易训练的模型提供了有价值的指导。

  • 第 64 期,Direction-aware Spatial Context Features for Shadow Detection。

威尼斯国际平台app 3

分享嘉宾:张宇伦,美国东北大学计算机工程在读博士,Adobe 公司深度学习研究实习生

[1]Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network. Ledig C, Theis L, Huszár F, et al. In Proceedings of CVPR 2017.

随着激光雷达,RGBD相机等3D传感器在机器人,无人驾驶领域的广泛应用,深度学习在三维点云数据的研究在近两年取得了广泛关注。点云分割、识别、检测成为学术界、工业界的热门话题之一。是在本次公开课中,讲者将分享其关于点云分割的最新工作。

常用深度学习网络中,往往会用到很多非线性函数,如Sigmoid激励函数和ReLu激活函数等,所以整个网络可被看做是一个非线性复合映射函数。这样的函数很大可能是非凸函数,在优化过程中存在很多局部最优解,增加了模型训练难度。但约翰霍普金斯大学的这篇论文证明,在网络构成函数满足一定假设时,能保证得到全局最优解。背后原理是使整个网络的搜索空间只包含全局最优解和平台解,而不存在局部最优解(如下图所示)。

  • 第 45 期,图像分割的经典算法。

这篇论文为腾讯AI Lab、约翰霍普金斯大学及加州大学洛杉矶分校合作发表,作者主要讨论从二维图像中进行人造物体(如汽车、飞机等)的三维结构重建问题。事实上,绝大多数人造物体都有对称性以及曼哈顿结构,后者表示我们可以很容易在欲重建的人造物体上找到三个两两垂直的轴。如在汽车上,这三个轴可为两个前轮、两个左轮及门框边缘。作者首先讨论了基于单张图片的物体三维结构重建,并证明了仅用曼哈顿结构信息即可恢复图像的摄像机矩阵;然后结合对称性约束,可唯一地重建物体的三维结构,部分结果如下图所示。

现在的神经网络可以通过监督学习学到很好的迁移学习本领,然而却需要百万级别的手工标注数据。自监督(self-supervised)任务就是一种为了取代标注数据的方式。 然而已有的自监督方法大部分是单任务,导致模型容易在这个任务上过拟合。任博士分享了用合成数据做多任务特征学习的工作,以及如何使用domain adaptation来让学到的特征更好的迁移到真实世界的视觉任务上。

微信腾讯AI实验室(tencent_ailab)授权转载

分享嘉宾:刘汉唐,浙江大学计算机系博士生。

团队在本届CVPR上有六篇文章被录取,下面论文一提到的实时视频滤镜技术已在腾讯QQ手机版上线,实现了基础研究到产品应用的迅速转化,正是我们「学术有影响,工业有产出」目标的体现。

分享嘉宾:姜仲石,纽约大学科朗数学研究所(NYU Courant) 二年级博士生。

1)On Compressing Deep Models by Low Rank and Sparse Decomposition

3D Computer Vision

  • 第 50 期,基于强化学习的时间行为检测自适应模型。

CCAI 2017 | 史元春:科幻与创新

与单标签图像分类相比,多标签图像分类是一种更符合真实世界客观规律的方法,尤其在图像和视频的语义标注,基于内容的图像检索等领域有着广泛的应用。因此,本次公开课,何诗怡将分享她用强化学习解决多标签图像分类问题的方法和经验

然而,在单张图像重建中,遮挡和噪声等因素会对重建结果造成很大影响。所以论文后半部分转到了多张图像基于运动恢复结构(Structure from Motion, 简称SfM)及对称信息的物体三维重建中。事实上,SfM算法涉及到对二维特征点进行矩阵分解,而添加对称性约束后,我们并不能直接对两个对称的二维特征点矩阵直接进行矩阵分解,因为这样不能保证矩阵分解得到同样的摄像机矩阵以及对称的三维特征点坐标。在文章中,作者通过进一步利用对称性信息进行坐标轴旋转解决了这个问题。实验证明,该方法的物体三维结构重建及摄像机角度估计均超出了之前的最好结果。

网格是几何数据的常用高效表示, 在几何曲面构建的机器学习方法对计算机图形学,3D计算机视觉以及几何分析和处理有着重要的意义。

五、弱监督下的图像识别

图像分割是计算机视觉中一个经典并且基础的问题,对于理解图像非常关键。图像分割有很多应用场景,比如无人驾驶、地图重建、图像美化等等。深度学习使得图像分割有了巨大的发展,本次分享会介绍深度学习中图像分割的经典算法。

在现有研究和实际应用中,深度学习模型被观察到对样本噪声或扰动比较敏感,比如在原始图像上加一些很小的噪声或变形,都可能造成误分类。但对什么类型、多大幅度的噪声或扰动会引起这种错误,我们还知之甚少。洛桑联邦理工大学和加州大学洛杉矶分校合作的这篇论文对此问题进行了初步探索。

图像超分辨率技术作为底层计算机视觉任务,有着广泛的应用场景,比如:手机图像增强,视频监控,医疗影像,卫星图像,低分辨率人脸识别。因此,图像超分辨率技术吸引了众多来自学术界与工业界的研究兴趣。但是,当前图像超分辨率技术仍然面临一些难题,比如,对高放大倍数的图像超分辨,难以恢复丢失的细节;对已经恢复出的细节,也有着模糊等效应,其质量有待提升。因此,本次公开课,张宇伦同学设计一种新的网络结构,得到更强的表达能力,不仅将之前方法难以恢复的细节恢复出来了,而且,结果更清晰。最终,在不同图像退化模型下都达到了当前较好的结果。

1) Exploiting Symmetry and/or Manhattan Properties for 3D Object Structure Estimation From Single and Multiple Images

CCAI 2017 | 王蕴红:人工智能科学与艺术的鉴赏创作

腾讯AI Lab展台及CV科学家在Poster环节介绍论文

一、低中层视觉问题

针对图像描述生成任务,SCA-CNN基于卷积网络的多层特征来动态生成文本描述,进而建模文本生成过程中空间及通道上的注意力模型。

威尼斯国际平台app 4

威尼斯国际平台app 5

CCAI 2017 | 周登勇:众包中的统计推断与激励机制

Weakly Supervised Recognition

Image or Video Captioning

大会共设44个研讨会(workshop)、22个教程辅导(tutorial)和14场竞赛,覆盖语言学、生物学、3D建模和自动驾驶等计算机视觉的细分领域。

论文一:Real Time Neural Style Transfer for Videos

腾讯AI Lab去年四月成立,今年是首次参展CVPR,共计六篇文章被录取(详情见文末),由计算机视觉总监刘威博士带队到现场交流学习。

本文将深度解析本届CVPR热门研究。第一部分是五大前沿领域的重点文章解析,包括低中层视觉、图像描述生成、3D视觉、计算机视觉与机器学习、弱监督下的图像识别等。第二部分是CVPR及腾讯计算机视觉团队简介等。

CCAI 2017 | 王坚博士致辞:人工智能是推动科技发展的动力

Low-Level and Mid-Level Vision

CCAI 2017 | AAAI 执委 Toby Walsh: AI 是中性技术,如何用它更好地为人类服务

近年来,3D计算机视觉快速发展,被广泛应用在无人驾驶、AR或VR等领域。在本届CVPR,该研究方向亦受到广泛关注,并体现出两大特点:一方面其在传统多视图几何如三维重建等问题上有所突破,另一方面它也和现今研究热点,如深度强化学习等领域紧密结合。我们将对以下两个方向做进一步介绍:

论文五:Diverse Image Annotation

在计算机视觉领域里,低中层视觉问题更关注原始视觉信号,与语义信息的联系相对松散,同时也是许多高层视觉问题的预处理步骤。本届CVPR有关低中层视觉问题的论文有很多,涵盖去模糊、超分辨率、物体分割、色彩恒定性(Color constancy)等多个方面,方法仍以深度学习为主。

在基础和前沿研究方向上,CV团队聚焦中高层视觉,尤其视频等可视结构数据的深度理解,同时也在重要的交叉领域发力,如视觉+NLP、视觉+信息检索等。正在进行或计划中的研究项目兼具了挑战性和趣味性,包括超大规模图像分类、视频编辑与生成、时序数据建模和增强现实,这些项目吸引了哥伦比亚和清华等海内外知名大学的优秀实习生参与。

腾讯AI Lab共六篇论文入选本届CVPR

基于曼哈顿结构与对称信息,文中提出了单张图像三维重建及多张图像Structure from Motion三维重建的新方法。

深度学习成功的一大关键因素是大量训练数据,但现实场景中对海量数据作精细数据标注需要大量人力和财力,这就回到了计算机视觉中的基本问题:目标检测 (Object Detection)和语义分割(Semantic Segmentation)。本届CVPR也有论文关注弱监督下该问题的解决,我们将介绍两篇仅依赖图像级别标注的相关研究。

本文由威尼斯网址开户网站发布于科学技术,转载请注明出处:六篇论文,近期精彩

上一篇:没有了 下一篇:威尼斯国际平台app想要成功的网络约会,无异于
猜你喜欢
热门排行
精彩图文