为促进学术交流、开拓学术视野、激发创新思维,助力图像图形领域研究生学术成长和未来职业发展,中国图象图形学学会(CSIG)创办CSIG学生会员分享论坛,论坛以研究生自主开展学术交流为主,同时,积极发挥导师的指导作用,帮助研究生开阔视野,启迪智慧,提高创新能力。
CSIG第十四期学生会员分享论坛将于2025年1月20日举办,邀请到了卡内基梅隆大学博士生李希昂、清华大学博士生伊昕宇、浙江大学博士生吴安鹏、清华大学博士生邵睿智作精彩学术报告,并邀请南京大学舒祥波教授、山东大学卢宪凯研究员、大连理工大学张平平副教授、中山大学张青副教授担任评议嘉宾对研究工作作出点评并解惑,活动由上海交通大学晏轶超助理教授主持,共同围绕研究生学术生涯的热点话题进行探讨。
主办单位
中国图象图形学学会(CSIG)
承办单位
CSIG优博俱乐部
CSIG会员发展与服务工作委员会
会议时间
2025年1月20日(星期一)9:00-11:35
会议地点
线上地址1(腾讯会议):192-347-957
线上地址2(CSIG视频号直播):
欢迎关注CSIG官方视频号,观看直播
线上地址3(科界直播):
线上地址4(寇享学术直播):
会议议程
舒祥波 教授,南京理工大学
个人简介:舒祥波,南京理工大学计算机科学与工程学院教授/博士生导师、国家优秀青年基金获得者、江苏省杰出青年基金获得者。近年主要研究方向为视频内容分析,在 TPAMI、TIP、TNNLS、CVPR、ICCV、AMM 等国际期刊/会议上发表学术论文近 100 余篇, 其中 ESI 高被引论文 7 篇;获中国电子学会自然科学一等奖、ACM MM 2015 最佳论文提名、MMM 2016最佳学生论文奖、江苏省优秀博士论文奖、中国人工智能学会优秀博士论文奖;主持或参与国家自然科学重点/面上/青年项目、国家重点研发课题、国防基础科研项目等国家级项目。担任 CSIG 青工委副秘书长,以及 IEEE TNNLS、IEEE TCSVT、Pattern Recognition 等期刊编委。
卢宪凯 研究员 山东大学
个人简介:卢宪凯,山东大学软件学院研究员,入选中国科协青年人才托举工程。主要从事计算机视觉,视频目标分割、视频文本定位等方面的研究工作。主持和参与多项课题研究包括国家重点研发子课题、国家自然科学基金青年项目、山东省自然科学优秀青年基金、山东省重点研发计划等。在IEEE TPAMI 、IEEE TIP、IEEE Proceedings 、CVPR 、ICCV 、Neurips、ECCV等国际高水平期刊和顶级会议上发表学术论文30余篇(其中ESI高被引论文3篇),国际专利2项。担任SCI期刊IEEE TMM、Pattern Recognition客座编委。2022年获山东省人工智能优秀青年奖,2024年入选斯坦福大学全球前2%顶尖科学家榜单。
张平平 副教授 大连理工大学
个人简介:张平平,大连理工大学未来技术学院/人工智能学院副教授,研究方向为计算机视觉与深度学习。在领域内的国际顶级会议和期刊 (如CVPR/ ICCV/ ECCV/ TPAMI/ TIP/ TOG等)上发表论文60余篇,目前谷歌学术引用5600余次。主持或参与国家重点研发、国家自然科学基金、省部级基金/ 开放课题等多项科研项目。目前为CSIG/CCF多媒体专委会、CCF视觉专委会委员,担任多个国际顶级学术期刊和会议审稿人或领域主席,国内盛会VALSE第6-8届执行领域主席。曾获得辽宁省自然科学二等奖,2020年度中国图象图形学学会优秀博士论文、辽宁省优秀博士论文等。
张青 副教授 中山大学
个人简介:张青,中山大学计算机学院副教授。目前主要从事视觉内容生成与编辑,神经渲染等方面的研究。发表CCF A类及中科院一区论文40余篇,谷歌学术引用4000余次。主持国自然面上和青年等多项项目。获2019年湖北省自然科学二等奖, 2022年世界人工智能大会青年优秀论文奖。
李希昂 博士研究生
报告题目:ImageFolder: Autoregressive Image Generation with Folded Tokens
报告摘要:Image tokenizers are crucial for visual generative models, e.g., diffusion models (DMs) and autoregressive (AR) models, as they construct the latent representation for modeling. Increasing token length is a common approach to improve the image reconstruction quality. However, tokenizers with longer token lengths are not guaranteed to achieve better generation quality. There exists a trade-off between reconstruction and generation quality regarding token length. In this paper, we investigate the impact of token length on both image reconstruction and generation and provide a flexible solution to the tradeoff. We propose ImageFolder, a semantic tokenizer that provides spatially aligned image tokens that can be folded during autoregressive modeling to improve both generation efficiency and quality. To enhance the representative capability without increasing token length, we leverage dual-branch product quantization to capture different contexts of images. Specifically, semantic regularization is introduced in one branch to encourage compacted semantic information while another branch is designed to capture the remaining pixel-level details. Extensive experiments demonstrate the superior quality of image generation and shorter token length with ImageFolder tokenizer.
个人简介:Xiang Li is a final-year PhD student at Carnegie Mellon University, advised by Prof. Bhiksha Raj. He is broadly interested in the intersection between multimodal understanding and generation. His recent research focuses on building discrete tokenizers for both generation and understanding. He has previously interned at Microsoft Research, Microsoft Azure, Bytedance and Adobe Research.
伊昕宇 博士研究生
报告题目:基于稀疏传感器的人体实时动作捕捉
报告摘要:人体动作捕捉技术在巨身智能、虚拟现实和人机交互等多个领域有着大量应用。传统的动作捕捉系统虽然稳健可靠,但通常依赖于密集的反光标记点或传感器阵列,使得它们受到成本、复杂性和空间设置等因素的限制。我们提出利用稀疏的可穿戴传感器,例如惯性测量单元(IMU),实时捕捉人体姿态和运动。这种方法不受遮挡、环境光线的影响,不限制人体运动范围,又减少了对佩戴者活动的干扰。本次报告主要的内容包括基于少量IMU的人体运动捕捉和物理优化、基于可穿戴传感器的人体定位和场景重建以及在惯性运动捕捉中建模非惯性效应等研究问题。
个人简介:伊昕宇目前是清华大学软件学院的五年级博士生,导师为徐枫教授。在此之前,他于2020年获得中国科学技术大学少年班计算机科学学士学位。他的主要研究兴趣集中在基于惯性传感器的实时人类运动捕捉。伊昕宇以第一作者身份发表了五篇论文(其中三篇SIGGRAPH,一篇CVPR),并曾获得CVPR 2022最佳论文奖提名。他的两篇SIGGRAPH论文入选技术论文展览,在会议现场进行技术展示。这一系列工作多次受到国内外科技媒体的报道,在Bilibili、Youtube等视频平台上累计超过32万播放量,并受到国际科技媒体如Two Minute Papers(拥有1.5亿总播放量)的关注。他还为TOG、ECCV、ICCV、3DV、IMWUT等期刊担任审稿人。个人主页:https://xinyu-yi.github.io/
吴安鹏 博士研究生
报告题目: Causal Inference with Instrumental Variable in Complex Scenarios
报告摘要:In causal inference, instrumental variable (IV) regression is a classical method used to estimate causal effects in the presence of unobserved confounders. By introducing a variable (the instrument) that affects the treatment but not directly the outcome (other than through the treatment), the IV method helps identify the causal relationship. However, in complex scenarios, some studies overlook residual confounding effects from observed covariates during the two-stage regression. To address this, we propose an Instrumental Variable Regression with Confounder Balancing algorithm, to jointly correct biases from unmeasured confounders and achieve balance among observed confounders.
个人简介:吴安鹏,浙江大学计算机与科学技术学院,DCD实验室五年级博士生,导师是吴飞教授和况琨教授,访学外导是张坤教授。研究方向为因果推断、因果表征学习、可解释机器学习和因果大语言模型,主要涉及两条研究路线:(1) 机器学习相结合的因果推断方法, 和(2)使用因果表征学习进行OOD场景下的稳定范化预测,以期构建高性能稳定因果学习和可解释机器学习模型。目前有10+篇论文发表在TKDE, TKDD, ICML, AAAI, KDD等顶刊顶会上。
邵睿智 博士研究生
报告题目:三维动态人体生成
报告摘要:本报告探讨了生成式人工智能在三维动态人体生成领域的关键技术突破。随着人工智能从一维文本、二维图像向三维空间领域拓展,三维动态人体生成因其在虚拟现实、数字人、具身智能等领域的应用价值而日益重要。当前该技术面临三个主要挑战:动态三维表征的高计算复杂度、动态三维数据的稀缺性,以及生成结果在真实感和物理合理性方面的不足。针对这些问题,本报告将从三维表征、三维生成学习范式以及静态三维拓展到动态四维这三个角度展开相关研究工作,通过高效的动态表征学习设计,将二维扩散模型扩展到三维扩散模型,以及结合视频生成大模型的动态生成先验,最终实现了高质量、时空一致的三维动态人体生成。
个人简介:邵睿智博士目前读于清华大学,师从刘烨斌教授,研究方向为三维计算机视觉,研究兴趣包括三维重建,三维生成以及神经渲染。他同时受邀在斯坦福大学进行学术访问,合作导师为Gordon Wetzstein教授。在攻读博士学位期间,邵睿智博士已在CVPR、ECCV、ICCV、ICLR和SIGGRAPH等国际顶级会议上发表16篇学术论文。其中9篇论文以第一作者身份发表,4篇论文获得会议ORAL/Highlight特别表彰。此外,他所开源的论文项目在github平台上已累计获得逾10,000颗星标。
晏轶超 助理教授 上海交通大学
个人简介:晏轶超,上海交通大学人工智能研究院助理教授,博士生导师。获上海交通大学电子工程系学士、博士学位,法国里昂中央理工学院硕士学位,曾担任阿联酋起源人工智能研究院研究科学家。主要研究方向为三维数字人技术,发表包括TPAMI、CVPR、NeurIPS在内的论文30余篇。先后主持国家自然科学基金青年项目、CCF-阿里巴巴青年科学家基金等项目8项。曾入选上海市海外高层次人才计划,获2024年中国图象图形学学会自然科学二等奖,2020年中国图象图形学学会优秀博士论文奖。
Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190