TESTA: Temporal-Spatial Token Aggregation for Long-form Video-Language Understanding

Add to Favorites

Poster_Demo_Industry_Findings Virtual 2: Language Grounding to Vision, Robotics and Beyond (Poster)

Conference Room: Virtual-Gathertown

Conference Time: December 08, 14:00-15:30 (+08) (Asia/Singapore)

Global Time: December 08, Poster_Demo_Industry_Findings Virtual 2 (06:00-07:30 UTC)

TLDR:

You can open the #paper-1936 channel in a separate window.

Abstract: