版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
|CVPR(ConferenceonComputerVisionandPatternRecognition)是计算机视觉领域的顶日在美国犹他州盐湖城举办。本届大会有超过3300篇的大会论文投稿,录取979篇(接受率约为29%),其中包括70篇Oral论文和224篇Spotlight论文,参会人数达到GUAlipres,Laada等电商appKUCVPR18者晚宴、展台技术TalkFashionAI、鹿班CV7SpotlghtGrundTruhSpotlght()Pacalontex,SN-RBD和COOStuffSotlghtof-the-artocaizedGANodecollaseGANLalac-BetraicalizdGN(GAN)GAN的moecllaseCNNSISR)算法不能扩SISR(即模糊核和噪声水平)作为网络输入来解决SISR大多数现有的零样本学习(Zero-ShotLearning,ZSL)方法都存在强偏问题。在论文《基于ZSLAI阿里巴巴Spotlight论文:基于时间尺度选择的在线行为预 实 摘 引 方 实 总 阿里巴巴Poster论文:整体还是局部?应用LocalizedGAN进行图像内容编辑、半监督训练和解决modecollapse问 摘 GAN和基于图模型的半监督机器学习的关 从几何角度研究Modecollapse问 阿里巴巴Poster论文:处理多种退化类型的卷积超分辨 阿里巴巴Poster论文:基于尺度空间变换的本征图像分 摘 引 实 结 阿里巴巴Poster论文:基于直推式无偏嵌入的零样本学 摘 引 QFSL模 实 讨 结 0在这篇论文中,作者提出了一个“尺度选择网”(scaleselectionnetwork)来在不同时刻diledcovoltio)erachia1,第243中,来估计当前动作的当前帧到该动作起始帧之间的距离(s)s((c3,133skpcnneionSSNetSSNet-GTGroundTruthFS-Net(S)则表示在所有时间点均采用同一个固定的尺度用于行为预测。ST-LSTMT-PAMISkeleton-BasedActionRecognitionUsingSpatio-TemporalLSTMNetworkwithTrustGates”。AttentionNetCVPR17“GlobalContext-AwareAttentionLSTMNetworksfor3DActionRecognition”。JCR-RNNMSRAPKUECCV16OnlineHumanActionDetectionusingJointClassification-RegressionRecurrentNeuralNetworks”。可以看到,本文提出SSNetGroundTruthCVPR-18Spotlight论文:基于语境对比特征和门控多尺度融合并且使得像素Askip(如图三所CVPR-18Spotlight论文:\h所见所想所找-基于生成模型的跨模\hMSCOCOFlickr30Kstate-of-the-artankngloss型的跨模态特征学习框架(generativecross-modalfeaturelearningframework,GXN),下LookMatchLook,ImagineMatch,也称为”所看所想所找”。LookImagine看”去“脑补”预期的匹配结果,也就是从得到的局部特征去生成目标模态的数据;MatchGXN(上部区域);图像-文本生成特征学习(蓝色路径)和射到共同空间。这里包括一个图像编码器CNNEnc和两个句子编码器RNNℎ和RNN𝑙 2(𝑣ℎ𝑡ℎ)是高层语义特征而(𝑣𝑙𝑡𝑙)作为局部层次的特征。这里的局部层次特征是通过生成模型学习得到的。第三部分(绿色路径)cGAN𝑡𝑙中生成一幅图像,包括一个只需要计算{𝑣ℎ,𝑡ℎ}和{𝑣𝑙,𝑡𝑙}之间的相似度来进行跨模态检索。本文提出的方法在MSCOCOstate-of-the-不仅能学习到多模态数据的高层的抽象表示,还能学习到底层的表示。显著超越state-of-the-artPosterLocalizedGAN进modecollapse问题GAN局部的AN整体方法Lalac-Betrairap时我们还展示了如果用calizdGN(GANGAN的odeollapeUCFUCFMAPLE实验室(MAchinePerceptionandLEarning)和阿CVPR2018Guo-JunQi,LihengZhang,HaoHu,MarziehEdraki,JingdongWangandXian-ShengHua.GlobalversusLocalizedGenerativeAdversarialNets,inCVPR2018.GANanioldGap)Grph它输出z,我们就可以在高维空间中划出一个流型结构。G,我们可以在数据流型上研究各种几何结构。比如切向量空LaplacianLaplace-Beltrami法在一些数据集上得到的结果。更多的结果可以参考我们的论文“GlobalversusLocalizedGenerativeAdversarialNetworks“。同时,使用局部坐标系的另一个更加实际的好处是,我们给定一个目标数据点xG(zzxzGANmodecollapseGAN,modecollapseGAN的modecollapsezz,GNmecolapsdmenondeicint。constraintCelebAGAN这个思GANGAN数据样本或者一个batchGAN论文原文地址\h展。然而现有基于CNNSISR(LR)图像由高分辨率(HR)图像经过双三SISR(即模糊核和噪声水SISR其中表示HR清晰图像𝒙与模糊核𝒌之间的卷积,表示系数为𝑠的降采样算子,𝒏表示标准差(噪声水平)为的加性高斯白噪声(AWGN)。SISR的方法尤其是基于CNNSISRCNNSIRSRNN在EC(14)VSR在PSRESPN和FSRNNGANicuic)SISRISRNNn-bndSI本文首先分析了在最大后验(MAP)SISRCNNSISRLR𝒚对应HR𝒙可以通过求解下述问题近似,其中为似然(也即数据保真)项,为先验(也即正则)项,为似然项和先验项之间的权衡参数。简单来说,上述公式包含两点:1)HRSISR2)对于非盲超分辨率问题,𝒙的求LR𝒚、模糊核𝒌、噪声水平以及权衡参数SISRMAPCNNCNNSISR水平CNNMAPCNNSISRLRCNNLRW×HPCA噪声水平并在一起得到一个t+1维的向量𝒗,接着将𝒗拉伸为W×H×(t+1)维的张量,我们将此张量称之为退化图(DegradationMaps),其中第𝑖个W×H图的所有元素均为𝒗𝑖。LRCNN选取了快速有效的ESPCNLRBatchNormalization在训练阶段,SRMD075]之间的高斯在测试阶段,SRMDbicubicPSNR和SSIM(如表1)。可以看出虽然SRMDbicubicSRMDTitanXpGPU512×512LR0.084VDSR2PSNRSSIMSRMD4SRMDLR5SRMDHR4SRMD(a)噪声水平以及模糊核宽度的空间分布;(b)LR(最近邻插值放大);(c)HR(放大两倍)。通过实验展示了用合成图像训练得到的超分辨网络模型可以有效地处理真实图像复现出优异的性能。我们在两个基准数据集上评估了网络:MPI-SintelMITIntrinsicImagesetinx-rMPI-SintelMIT相关工作(略I转换为输出图像A非局部映射函数If()L(3)中,我们将描述从ResNet我们将图像I[I0,I1,...,IK]I0=I,KLk(I)=Iku(k1ku拉普拉斯金字塔展开为I=[L0(I),L1(I),...,Lk−1(I),IKL0(IIK首先,让我们使用两个块(LH)的简化网络来为低频带的映射建模映射I→f(I):L,并HL省略。通过将LH连接和求和,该网络是ResNet一个关键的过渡是从(b)到(c)LHH(c)等价于(b)-它们表示拉普拉斯分解方程的两种等价形式,即通过将剩余分量从左手边移到右手边并改变符号。(c)Ld,为此类似于拉普拉斯金字塔分解结构,我们为高频带引入多个子网络块H0,H1,......HK-1LK:网络输入块级联下采样,并且网络块的输出被上采样并从左到右聚合以形成目标输出。在网络中学习下采样和上采样算子的所有参数(2形)3.26Conv(3x3)-ELU-Conv(3x3)-ELUHuangDenseNet中,最后一个ConvELU3231x1Conv我们使用指数线性单位(ELU)ReLUx<0ELUBNELU换,ELU2ℒ=𝜆𝑑ℒ𝑑𝑎𝑡𝑎+𝜆𝑝ℒ𝑝𝑒𝑟𝑐𝑒𝑝+数据损失数据损失定义了预测图像与真实之间的像素级相似性。我们采用下面的联合双边 =
𝑁∑||𝒥𝑝−𝐶𝑝||2+||𝐴∗𝑆−
𝑝𝒥𝑝=
𝑝𝒲𝑝=
CNN们利用标准的VGG-19[44]网络从神经激活中提取语义信息。我们的感知损失定义如下: =
𝐹𝐻𝑊||Φ𝑙(𝒞)−
𝑙𝑙变分损失 ℒ𝑡𝑣=
|𝒞𝑖+𝑖,𝑗−𝒞𝑖,𝑗|+|𝒞𝑖,𝑗+1−Boostrap证明是相当有效的。例如,LiAA和S为了在增强数据集中引入进一步的扰动,我们另外应用自适应流形滤波器到AS,并使用过滤结果合成新数据。AMFASMP-Sntl187500ResynhSitelAS=I()MTIntrnsc011ConstantShadingConstantAlbedo,一些传统方法以及最新的最新的基于神经网络si-MSE25%,在DSSIM43%,这表明我们网络结构在更具有挑战性的数据集上依然表现良好。3.1题,传播。该行(OursSequential)2(a)显示了结果。它显示该架构产DSSIM1-210%-15%的改进。我们也有一套关于其他因素的控制自我比较,包括金字塔结构,损失实验(OurswoPyramid)使用单通道网络显示结果,即,我们使用单个残差1230%以上。请注意,随着金字塔层数的增加,网络复杂损失函数实验(Oursw/MSEloss)MSE事实证明,MSEMSEMSE(DSSIM)MSE们的损失之间也显示出更清晰的边际(10.238.86)。CNN我们进一步研究在这个任务中高斯金字塔图像分量作为我们网络输入的影CNN(Oursw/'FPN'input)CNNFPNCNNITntrnsicImagsOurs+A和Ours+DAOus+DAOus+DAMPISintelMIT大多数现有的零样本学习(Zero-ShotLearning,ZSL)方法都存在强偏问题:训练阶段看不见(目标)类的实例在测试时往往被归类为所看到的(源)ZSLAwA2,CUBSUNZSL9.3%至24.5ZSL0.216.2%的提升。2ZSL2ZSL(inductiveZSLZSL(transductiveZSLZSL,训练阶段只能获取得到ZSL,训练阶段可以获取到有标注的源类数据和未标注的目标类数据。直推ZSLZSLZSLZSL(conventionalsettings)。然而,在一个更加实际的应用场景中,测试图像不仅来源于目标叫作广义设定(generalizedsettings)。ZSLZSLZSL强偏(stongbia(1:在ZSLZSL(Quasi-FullySupervisedLearning,QFSL)2AlxNe、GgleNt();()相关工作(略假设存在一个源数据集𝒟𝑠={(𝑥𝑠𝑦𝑠)}𝑁𝑠,每张图片𝑥𝑠与相应的标签𝑦𝑠对应,其中𝑦𝑠∈𝒴𝑠=
{(𝑦)}𝑆,S表示源类中类的个数。目标数据集𝒟𝑡={(𝑥𝑡𝑦𝑡)}𝑁𝑡,每张图片𝑥𝑡与相应的标签𝑦𝑡𝑖
应,其中𝑦𝑡∈𝒴𝑡={(𝑦𝑖)}𝑇,T表示目标类中类的个数。ZSL
𝑓(𝑥;𝑊)=argmax𝑦∈𝒴𝐹(𝑥,𝑦;𝐹(𝑥,𝑦;𝑊)=ℒ ∑ℒ𝑝(𝑦𝑖,𝑓(𝑥𝑖;𝑊))+𝑠本文假设给定标注源数据集𝒟𝑠,无标注目标数据集𝒟𝑡={(𝑥𝑡)}𝑁𝑡和语义嵌入𝛷ZSL 𝐹4eLUsftmxCNN𝜃CNNCNN模型𝜃ZSLCNN𝐹(𝑥,𝑦;𝑊)=𝜑(𝜃(𝑥;𝑊𝜃);入:𝛷∗(𝑦)=𝜱(𝑦)。[𝛷∗(𝑦1)𝛷∗(𝑦2)𝛷∗(𝑦𝑆+𝑇)]来初始化。和视觉嵌入子网络和视觉-语义衔接子网络不同的是,得与视觉嵌入𝛷∗(𝑦𝑠)此,在训练阶段,我们的模型对于一张给定的图像,产生了𝑆+𝑇个得分。经过得分函数后,我们
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物业清洁分包合同模板
- 钢材交易合同定制
- 监理招标文件范本模板宝典
- 临时散工劳务外包合同
- 大理石采购合同的规范格式
- 权利保证书在劳动合同纠纷中的应用
- 搬家清洁服务协议
- 招标资料专业制作
- 土建工程分包合作协议
- 正品保障销售保证
- 运输车辆卫生安全检查记录表
- 侨界领袖陈嘉庚(共33张PPT)
- 配电房、发电房安全技术操作规程
- 水利工程实验室量测作业指导书
- 房建装修修缮工程量清单
- 徕卡v lux4中文说明书大约工作时间和可拍摄图像数量
- 格力2匹柜机检测报告KFR-50LW(50530)FNhAk-B1(性能)
- 分级护理制度考试题及答案
- 高考作文模拟写作:“德”与“得”导写及范文
- 意向性和と思う课件 高考日语复习
- 江苏专转本《大学语文》考纲
评论
0/150
提交评论