张家豪

博士研究生

澳大利亚国立大学

简介

他是澳大利亚国立大学计算机科学研究学院的四年级博士研究生。他对众多深度学习主题都有浓厚的兴趣，特别是在视频理解与生成领域。同时，他还是一名活跃的全栈网站开发人员。目前，他正在进行一个由Stephen Gould教授、Anoop Cherian博士、Yizhak Ben-Shabat博士和Cristian Rodriguez博士指导的研究项目。在此之前，他于2021年分别从澳大利亚国立大学和山东大学获得了高级计算（荣誉）学士学位和计算机科学与技术学士学位。

兴趣爱好

视频理解
视频生成
网页开发

教育经历

计算机科学博士, 2022至今
澳大利亚国立大学
高级计算(荣誉学位), 2019 - 2021
澳大利亚国立大学
计算机科学与技术, 2017 - 2019
山东大学

精选文章

张家豪, Anoop Cherian, Cristian Rodriguez, Weijian Deng, Stephen Gould

六月, 2025 In ICCV 2025

Manual-PA: Learning 3D Part Assembly from Instruction Diagrams

Manual-PA: Learning 3D Part Assembly from Instruction Diagrams

我们提出了Manual-PA，一种基于Transformer的框架，通过利用装配说明书中的图示信息，引导家具零件的选择与6D位姿估计，实现高效且真实的3D装配，能够将零件与说明书图示进行语义对齐。

张家豪, Frederic Zhang, Cristian Rodriguez, Yizhak Ben-Shabat, Anoop Cherian, Stephen Gould

九月, 2024 In WACV 2025

Temporally Grounding Instructional Diagrams in Unconstrained Videos

Temporally Grounding Instructional Diagrams in Unconstrained Videos

我们提出了一种新方法，通过建模说明书步骤图之间的关系和时序，实现了在视频中同时定位多个步骤图，而非单独处理每一步。

张家豪, Anoop Cherian, Yanbin Liu, Yizhak Ben-Shabat, Cristian Rodriguez, Stephen Gould

二月, 2023 In CVPR 2023

Aligning Step-by-Step Instructional Diagrams to Video Demonstrations

Aligning Step-by-Step Instructional Diagrams to Video Demonstrations

我们提出了一套新框架和数据集（IAW），用于将装配说明书中的图示步骤与真实世界的装配视频片段进行对齐，实现图文与视频间的跨模态检索和逐步对应。

文章

张家豪, Anoop Cherian, Cristian Rodriguez, Weijian Deng, Stephen Gould (2025). Manual-PA: Learning 3D Part Assembly from Instruction Diagrams. In ICCV 2025.

PDF 引用代码数据集 ArXiv

Weijian Deng, Dylan Campbell, Chunyi Sun, 张家豪, Shubham Kanitkar, Matthew E. Shaffer, Stephen Gould (2025). Pos3R: 6D Pose Estimation for Unseen Objects Made Easy. In CVPR 2025.

PDF 引用项目海报演示文稿视频

张家豪, Frederic Zhang, Cristian Rodriguez, Yizhak Ben-Shabat, Anoop Cherian, Stephen Gould (2024). Temporally Grounding Instructional Diagrams in Unconstrained Videos. In WACV 2025.

PDF 引用代码数据集海报演示文稿 DOI ArXiv

张家豪, Anoop Cherian, Yanbin Liu, Yizhak Ben-Shabat, Cristian Rodriguez, Stephen Gould (2023). Aligning Step-by-Step Instructional Diagrams to Video Demonstrations. In CVPR 2023.

PDF 引用代码数据集海报演示文稿视频 DOI ArXiv 补充材料

Zheyu Zhuang, Yizhak Ben-Shabat, 张家豪, Stephen Gould, Robert Mahony (2022). GoferBot: A Visual Guided Human-Robot Collaborative Assembly System. In IROS 2022.

PDF 引用视频 DOI ArXiv

项目

帮助你快速浏览 ArXiv 每日论文的 Chrome / Edge 浏览器扩展。

ArXiv Toolkit

Manual-PA: Learning 3D Part Assembly from Instruction Diagrams 的官方实现.

Manual-PA

WACV 2025 Temporal Instructional Diagram Grounding in Unconstrained Videos 的官方实现.

TDGV

Assembly Video Manual Alignment

CVPR 2023 Aligning Step-by-Step Instructional Diagrams to Video Demonstrations 的官方实现。

Assembly Video Manual Alignment

Ikea Assembly In the Wild (IAW) 数据集主页

前端项目，用于介绍 IAW 数据集。

Ikea Assembly In the Wild (IAW) 数据集主页

Pytorch Lightning Template

一个使用Lightning全家桶的简单深度学习项目模板。

Pytorch Lightning Template

学术成果管理系统

为实验室开发的学术成果管理系统。

学术成果管理系统

计算机科学领域的机构出版指标。

CSMetrics

Influence Flower

可视化展示学术实体之间的引用影响关系，包括论文、作者、机构和研究主题。

Influence Flower

SlimeVerse 官方主页。

SlimeVerse

一个在浏览器上运行的视频标注工具。

Vidat

Image Caption Generator

一个基于 encoder(Resnet152)-decoder(LSTM) 的图像描述模型实现。

Image Caption Generator

使用 Cpp Micro Service 开发的分布式插件系统。

Plugin Manager

威海建筑咨询管理系统

企业级商业项目，建筑咨询管理公司的内容管理系统。

威海建筑咨询管理系统

学院自习室预约系统

学院自用的自习室预约系统。

学院自习室预约系统

为学院ACM训练开发的在线评测系统。

Virtual Judge

经历

Research Intern

Mitsubishi Electric Research Laboratories (MERL)

十月 2025 – 二月 2026 波士顿，美国

Research Intern

七月 2025 – 九月 2025 湾区，美国

Teaching Assistant

The Australian National University

七月 2025 – 十月 2025 堪培拉，澳大利亚

我是COMP8536 - Advanced Topics in Deep Learning for Computer Vision的助教。

Teaching Assistant

The Australian National University

二月 2024 – 五月 2024 堪培拉，澳大利亚

我是COMP4528/COMP6528 - Computer Vision的助教。

Teaching Assistant

The Australian National University

二月 2023 – 六月 2023 堪培拉，澳大利亚

我是COMP2420/COMP6420 - Introduction to Data Management, Analysis and Security的助教。

Teaching Assistant

The Australian National University

七月 2022 – 十一月 2022 堪培拉，澳大利亚

我是COMP3670/COMP6670 - Introduction to Machine Learning和COMP4650 - Document Analysis的助教。

Research Assistant

The Australian National University

五月 2022 – 二月 2023 堪培拉，澳大利亚

我负责InfluenceMap和CSMetrics网站的容器化工作。

软件开发工程师(实习)

十一月 2019 – 一月 2020 济南，中国

我在浪潮实习期间，帮助开发了一个基于Cpp Micro Service的插件管理系统。

威海机电学院预约系统开发工程师

山东大学(威海)，机电与信息工程学院

五月 2019 – 七月 2019 威海，中国

我独立开发了学院的预约系统，该系统旨在简化预约流程。该系统目前仍在使用。

威海建筑咨询系统开发工程师

山东大学(威海)，机电与信息工程学院

三月 2019 – 七月 2019 威海，中国

我是威海建筑咨询系统的主要开发者之一(六人团队)，该系统是一个企业级的业务项目。

VJ运行维护

山东大学(威海)，机电与信息工程学院

二月 2018 – 七月 2019 威海，中国

我是学院ACM训练用VJ(Virtual Judge)系统的主要维护者之一。该系统自2017年发布以来已经有超过1万次提交。

获奖

博士奖学金（全奖）

澳大利亚国立大学 3月 2022

校长表扬信

澳大利亚国立大学 5月 2021

海外留学一等奖学金

山东大学 10月 2020

海外留学一等奖学金

山东大学 7月 2019

校学业三等奖学金

山东大学 7月 2019

校科研创新二等奖学金

山东大学 7月 2018

校学业三等奖学金

山东大学 7月 2018

蓝桥杯省赛二等奖

蓝桥杯 6月 2018