Publications

Peixuan Han, Hongyi Du, Jiayu Liu, Yihang Sun, Jiaxuan You (2026). Ψ-Bench: Evaluating Persona-Sensitive Influencing in Persuasive Dialogues. Under review at EMNLP ‘26.

PDF Source Document

Hongyi Du, Jiaqi Su, Jisen Li, Lijie Ding, Yingxuan Yang, Peixuan Han, Xiangru Tang, Kunlun Zhu, Jiaxuan You (2025). Which LLM Multi-Agent Protocol to Choose?. In ICML ‘26.

PDF Cite Code Source Document

Cheng Qian, Hongyi Du, Hongru Wang, Xiusi Chen, Yuji Zhang, Avirup Sil, Chengxiang Zhai, Kathleen McKeown, Heng Ji (2025). ModelingAgent: Bridging LLMs and Mathematical Modeling for Real-World Challenges. In EMNLP ’25 Findings.

PDF Cite Code Source Document

Kunlun Zhu, Hongyi Du, Zhaochen Hong, Xiaocheng Yang, Shuyi Guo, Zhe Wang, Zhenhailong Wang, Cheng Qian, Xiangru Tang, Heng Ji, Jiaxuan You (2025). MultiAgentBench: Evaluating the Collaboration and Competition of LLM Agents. In ACL ’25.

PDF Cite Code Source Document

Cheng Qian, Peixuan Han, Qinyu Luo, Bingxiang He, Xiusi Chen, Yuji Zhang, Hongyi Du, Jiarui Yao, Xiaocheng Yang, Denghui Zhang, Yunzhu Li, Heng Ji (2024). EscapeBench: Towards Advancing Creative Intelligence of Language Model Agents. In ACL ’25.

PDF Cite Code Source Document