I am currently a researcher at the Alibaba Qwen Team. Prior to this, I was a PhD student in the CUHK Text Mining Group, under the supervision of Professor Wai Lam.

My research primarily focuses on applying reinforcement learning techniques to enhance the reasoning capabilities and alignment of large language models (LLMs).

📝 Preprints

Soft Adaptive Policy Optimization

Chang Gao, Chujie Zheng, Xiong-Hui Chen, Kai Dang, Shixuan Liu, Bowen Yu, An Yang, Shuai Bai, Jingren Zhou, Junyang Lin

Paper

Qwen3-VL Technical Report

Qwen Team including Chang Gao

Paper

Group Sequence Policy Optimization

Chujie Zheng, Shixuan Liu, Mingze Li, Xiong-Hui Chen, Bowen Yu, Chang Gao, Kai Dang, Yuqiong Liu, Rui Men, An Yang, Jingren Zhou, Junyang Lin

Paper

Qwen3 Technical Report

Qwen Team including Chang Gao

Paper

📝 Publications

NeurIPS 2025

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoning

Shenzhi Wang, Le Yu, Chang Gao, Chujie Zheng, Shixuan Liu, Rui Lu, Kai Dang, Xionghui Chen, Jianxin Yang, Zhenru Zhang, Yuqiong Liu, An Yang, Andrew Zhao, Yang Yue, Shiji Song, Bowen Yu, Gao Huang, Junyang Lin

Paper

ACL 2025 Findings

SWE-Fixer: Training Open-Source LLMs for Effective and Efficient GitHub Issue Resolution

Chengxing Xie*, Bowen Li*, Chang Gao*, He Du, Wai Lam, Difan Zou, Kai Chen

Paper Code

ACL 2025 Findings

JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning

Chang Gao, Wenxuan Zhang, Guizhen Chen, Wai Lam

Paper Code

NeurIPS 2024

StrategyLLM: Large Language Models as Strategy Generators, Executors, Optimizers, and Evaluators for Problem Solving

Chang Gao, Haiyun Jiang, Deng Cai, Shuming Shi, Wai Lam

Paper Code

ACL 2024 Findings

CodeAttack: Revealing Safety Generalization Challenges of Large Language Models via Code Completion

Qibing Ren*, Chang Gao*, Jing Shao, Junchi Yan, Xin Tan, Wai Lam, Lizhuang Ma

Paper Code

NeurIPS 2023

M3Exam: A Multilingual, Multimodal, Multilevel Benchmark for Examining Large Language Models

Wenxuan Zhang, Sharifah Mahani Aljunied, Chang Gao, Yew Ken Chia, Lidong Bing

Paper Code

ACL 2023 Findings

Easy-to-Hard Learning for Information Extraction

Chang Gao, Wenxuan Zhang, Wai Lam, Lidong Bing

Paper Code

EMNLP 2022 Findings

Towards Generalizable and Robust Text-to-SQL Parsing

Chang Gao, Bowen Li, Wenxuan Zhang, Wai Lam, Binhua Li, Fei Huang, Luo Si, Yongbin Li

Paper Code

EMNLP 2022

Prompt Conditioned VAE: Enhancing Generative Replay for Lifelong Learning in Task-Oriented Dialogue

Yingxiu Zhao, Yinhe Zheng, Zhiliang Tian, Chang Gao, Jian Sun, Nevin L. Zhang

Paper Code

ACL 2022

UniGDD: A Unified Generative Framework for Goal-Oriented Document-Grounded Dialogue

Chang Gao, Wenxuan Zhang, Wai Lam

Paper Code

ECIR 2022

Search Clarification Selection via Query-Intent-Clarification Graph Attention

Chang Gao, Wai Lam

Paper

CIKM 2020

Rotate3D: Representing Relations as Rotations in Three-Dimensional Space for Knowledge Graph Embedding

Chang Gao, Chengjie Sun, Lili Shan, Lei Lin, Mingjiang Wang

Paper Code

📖 Educations

2020.08 - 2025.03, PhD, The Chinese University of Hong Kong, Hong Kong, China
2018.09 - 2020.06, Master, Harbin Institute of Technology, Harbin, China
2014.09 - 2018.06, Undergraduate, Harbin Institute of Technology, Weihai, China

🎖 Honors and Awards

2020.09 ACM SIGIR Student Travel Grant
2020.06 Outstanding Master Thesis Award
2018.06 Outstanding Graduate Award
2017.11 National Scholarship
2016.11 National Scholarship

Chang Gao (高畅)

📝 Preprints

📝 Publications

📖 Educations

🎖 Honors and Awards