由北京大学王选计算机研究所的博士生徐铸(第一作者)及其导师刘洋教授(通讯作者)团队完成,其研究成果长期发表于TPAMI、IJCV、CVPR、ICML等顶级会议,并在多模态理解与生成任务中屡获竞赛冠军,展现出广泛的学术影响力和扎实的研究基础。本文提出的TRKT方法,聚焦于弱监督动态场景图生成(Weakly Supervised Dynamic Scene Graph Generation)任务,针对当前方法在目标检测质量上的瓶颈,提出了一种时序增强且关系敏感的知识迁移策略,显著提升了动态场景图生成的性能,并已被ICCV 2025接收,代码与模型均已开源。
动态场景图生成旨在对视频逐帧检测物体并推断其间关系,构建结构化的场景表示。弱监督设定下,模型仅使用单帧场景图标签(不含物体位置信息)进行训练,大幅降低了标注成本。现有方法依赖外部预训练目标检测器生成伪标签,这类检测器通常基于静态图像训练,缺乏对时序上下文和关系语义的感知能力,导致在动态场景中定位不准、置信度偏低及漏检等问题,成为制约性能的关键瓶颈。
TRKT方法的核心创新在于通过关系感知与时序信息增强注意力图,优化目标检测结果,进而提升伪标签质量。具体而言,该方法包含两个关键模块:关系敏感的知识挖掘(Relation-aware Knowledge Mining)和双流融合模块(Dual-stream Fusion module)。在知识挖掘阶段,模型通过物体与关系类别解码器生成类别特定的注意力图,突出物体及交互区域,并引入光流信息实现跨帧时序增强,使注意力具备运动感知与鲁棒性。在双流融合阶段,设计定位优化模块(LRM)和置信度提升模块(CBM),融合外部检测结果与增强后的注意力图,共同优化检测定位精度与类别置信度。
实验结果表明,TRKT有效缓解了目标检测在动态关系场景中的不足,生成的伪标签质量显著提高,最终提升了场景图生成的综合性能。这一工作不仅为解决弱监督动态场景图生成中的关键问题提供了新思路,其设计的时序-关系协同机制也具有广泛的迁移潜力,为视频理解、多模态学习等方向提供了重要技术参考。
该研究在问题定义、方法设计与实验验证方面均体现出较高的完整性与创新性,充分展现了作者团队在相关领域的深厚积累与前沿探索能力。
相关标签: 敏感知识、 检测器、 增强关系、 iccv、 时序、 图像生成基础模型、
本文地址:https://www.dhslw.com/article/729.html
2025年9月3日,美国华盛顿地区法院公布了对谷歌反垄断诉讼案的重要裁决,裁定谷歌无需剥离Chrome浏览器及安卓操作系统,也无需停止向苹果等合作伙伴支付产品预装费用,不过,法院同时禁止谷歌签订互联网搜索排他性协议,并要求其向竞争对手开放部分搜索数据以促进市场竞争,这一裁决显著缓解了市场对谷歌业务可能被强制拆分的担忧,消息公布后谷歌股...。
近期,苹果公司向零售员工推出了一款内部专用的AI聊天机器人工具,这一举措显示出其在人工智能领域的进一步布局,根据MacRumors分析师AaronPerris提供的截图,该工具旨在帮助员工更深入地理解苹果产品的优势以及iPhone的多样化应用场景,同时支持员工自由提问以获取相关信息,目前,该工具仍处于测试阶段,预计将很快集成至苹果内部...。
近日,美国商务部宣布将英特尔半导体,大连,有限公司、三星中国半导体有限公司以及SK海力士半导体,中国,有限公司移出经验证最终用户,VEU,授权名单,此举引发多方关注与讨论,从政策层面来看,这一决定标志着美国对华半导体出口管制政策的进一步收紧,旨在限制相关企业在华生产设施的扩张与技术升级,反映出美国试图通过出口管制手段维护其在高科技领域...。
近期,,黑神话,钟馗,在科隆游戏展上发布首支预告片,迅速引发全球玩家关注,相关视频在B站和微博等平台播放量及话题阅读量均突破千万,标志着这一以中国传统文化角色为核心的新作已具备成为现象级文化IP的潜力,在此背景下,安徽省灵璧县文化和旅游局迅速响应,于8月21日召开文化旅游产业发展座谈会,探讨如何借助游戏热度推动地方文旅产业升级,该会议...。
近日,小米与格力围绕空调销量排名、产品质量及技术路径展开的多轮公开争论,引发广泛关注,成为行业与舆论的焦点,从事件发展脉络来看,这场争议本质上是因数据统计口径差异所引发的,罗生门,式对峙,折射出空调行业在渠道变革与技术路线方面的深层次竞合动态,事件起源于8月15日,某博主引用奥维云网7月份空调线上销量市占率数据,显示小米以16.71%...。
近日,迈威生物发布公告称,其自主研发的9MW3811注射液已正式获得国家药品监督管理局的受理通知书,该药物用于病理性瘢痕适应症的II期临床试验申请已进入受理阶段,这一进展标志着公司在创新生物药研发领域取得了重要突破,同时也为相关适应症的临床治疗提供了新的潜在选择,9MW3811是一种靶向人IL,11的人源化单克隆抗体,属于治疗用生物制...。
近日,沃尔玛宣布推出一套基于人工智能技术的,超级代理,系统,旨在全面优化顾客购物体验并提升企业运营效率,该举措反映了零售行业在数字化转型过程中对人工智能技术的深度应用与战略布局,具有重要的行业参考价值,具体来看,沃尔玛此次推出的超级代理系统包含四个核心模块,顾客代理能够根据用户需求自动生成购物清单并完成下单流程,显著提升购物便捷性;员...。
国务院于8月26日发布的,关于深入实施人工智能,行动的意见,以下简称,意见,,标志着我国在推动人工智能与经济社会深度融合方面迈出了关键一步,该文件明确提出,通过,人工智能,行动,将全面促进人工智能技术在各行业各领域的广泛应用,重塑人类生产与生活方式,推动生产力实现质的飞跃,并引发生产关系的深刻变革,其最终目标是到2035年,助力...。
地平线机器人CEO余凯在半年报业绩会上的发言,反映了当前高阶辅助驾驶技术向RoboTaxi领域加速演进的重要趋势,他指出,在数据驱动等关键因素的推动下,相关技术成熟度正在显著提升,并预判未来五到十年内,全行业将逐步实现全场景无人驾驶,这一观点不仅体现了地平线作为技术提供方的前瞻性判断,也呼应了当前自动驾驶行业逐步由辅助驾驶向完全无人化...。
苏州一丛花园艺有限公司是一家专业的苏州绿植租赁服务提供商,专业承接公司、酒店、商场、写字楼、广场、家庭等企事业单位的室内绿化租摆、绿化养护服务,免费提供上门提供室内绿化租摆方案。
汇成联盟,专注CPA日付广告联盟推广,为广告主提供海量手机APP广告、CPA广告、CPS广告等,帮助5万推广站长轻松实现广告高佣金、高转化,是各大站长推荐的高信誉CPA广告联盟平台。
救护车网是一个专注国内各省市的救护车出租转运护送平台,为30000人次提供过非急救护车出租转运、转院、护送病人接送服务,秉承安全及时送达到目的地,快捷、舒适正规救护车预约转运电话:400-9090-120
多哦!duoo.cn!致力于打造开放、互动、可信赖的工具社区。无论是提升工作效率的利器,激发创意的设计神器,还是便利生活的实用网站,多哦!都是您探索网络宝藏的可靠起点,让优质工具触手可及。
福路顺环保科技有限公司是一家从事新型彩色透水地坪,艺术压花地坪,地坪材料,环氧树脂地坪,透水混凝土,高强灌浆料,地坪材料生产,施工,服务为一体的专业化公司。公司产品遍布全国各地,主营园林地面、绿道、市政人行道、公路、小区路面等工程。
科站生物科技有限公司主要为实验室提供技术服务,包括:实验室设计,实验室装修,CMA资质认定,CNAS实验室认可,P2实验室备案,PCR技术验收等实验室服务,还提供仪器选型,仪器校准,实验室能力验证,实验室技术培训,等一系列服务。科站拥有丰富的实验室建设及运营经验,有专职的CMA和CNAS评审员专家团队,为实验室技术服务保驾护航!
音屿音乐工作室为您的乐团量身定做各种乐谱与服务
下载钛空时间App
搜手游是玩家分享好玩的手机网络游戏论坛大全。推荐单机游戏社区,网络游戏平台,网页游戏在线,游戏官方论坛,攻略技能经验交流上游戏论坛!