½ðÄê»á

À´Ô´£ºÒ©Æ·ÊÕÄÉÏ䣬×÷Õߣº £¬£º

ÚÀ£¬ÎÒ¸úÙ¯½²Å¶£¬ë¡Á½Ìì°¢À­ÀÏÍ·×Ó´îÅóÓѸÂÚ¨ºú£¬½²µ½ë¡¸ö¡°QqȺÃÀÅ®¿ì²Í¡±£¬Ù¯ÏþµÃ·¥£¬ë¡¸ö¹¤¾ßÕæÊÇ¡°ÌýÍ·Ï족£¬µ«½²À´½²È¥£¬Ù¯Ïþ»ñµÃµ×ÊÇɶÎïÊ·¥À²£¿À϶àÈËÒÔΪÊÇɶ¸ß¼¶¸ö¿ì²ÍЧÀÍ£¬ÆäʵßíÊÇÄÇ»ØÊ¡£Ù¯½²ÊÇ·¥£¿

QqȺÃÀÅ®¿ì²ÍÊÇɶ£¿ßíÒª¹âÌýÃû×ÖÏì

Ïà¹ØÍ¼Æ¬

롸öÂï¡­¡­Ù¯ÒªÄÃÉϺ£»°½²ÊÇ¡°ÃÅÍâÏìîõîõ¡±£¬µ«ÀïÏáÆäʵàÇÎð¶à¡£ë¡¸öÊÇɶàÏ£¿¼òµ¥½²Å¶£¬ë¡¸ö¾ÍÊÇÍøÂçÀïÏáÄÇЩ¸öÔ˶¯Èº£¬ÓÐЩÊÇרßã¿ìµÝ¡¢ÃÀʳÍâÂôЧÀÍ£¬ËäÈ»À²£¬ÓÐЩÃû×Ö¡°Ó¬Í·Ð¡Àû¡±£¬ÈÝÒ×ÈÃÈËÎó»áÓÐÉ¶ÌØ±ðЧÀÍ¡ª¡ªÙ¯¶®¸ö·¥À²£¿

²»¹ýÕæÕý¸öÃŵÀŶ£¬ë¡¸öȺÆäʵ¾ÍÊÇΪÁ˱㵱ËÄÖܵÄÈË£¬ÌṩһЩ¿ìËÙ¸öЧÀÍ¡£¾ÍÏñ°¢À­ÀÏÔç³½¹â£¬ÅªÌÃÀïÏáÍ·ÓÐɶ°¢ÆÅÉÕ·¹£¬»òÕßС³öÊÛÉú¼å£¬ÎÒ½²Å¶£¬ë¡¸ö¸ÐÊܲîÎð¶àÀ²¡£²»¹ýÃû×ÖÈ¡µÃÏ죬ÎüÒýÑÛÇò°ÕÁË¡£

ÀïÃæ¸öÃŵÀ£¬ÎÒ¸úÙ¯½²Å¶

Ïà¹ØÍ¼Æ¬

Ù¯ÒªÊÇÏëÓÃë¡ÖÖЧÀÍ£¬¿Ï¶¨ÒªÏþµÃ¼¸¸öÃŵÀ¡£µÚһŶ£¬Òª¸ãÇå³þÙ¯ËùÔÚ¸öȺÊDz»ÊÇ¿¿Æ×¡£Ù¯ÏþµÃ·¥£¬ÀÏÍ·×Ó½²¡°ÎðÒª¹â¿´ÈÈÄÖ¡±£¬Ù¯ÒªÊÇËæ±ãÂÒÞè½øÈ¥£¬¿ÉÄܾͻáÅöµ½Ð©ÐéÍ·°ÍÄÔ¸ö¹¤¾ß¡£µÚ¶þŶ£¬ë¡ÖÖȺÀïÏáÓÐЩÈË»áÂôЩ¡°ºÚÐÄ»õ¡±£¬Ù¯Òª¿´Çå³þÔÙϵ¥¡£ë¡¸öÂ½²µÃÀ´¾ÍÏñ°¢À­ÀÏÔçÈ¥²Ë³¡Âò¹¤¾ßÒ»Ñù£¬¡°¿´ÈËÌôµ£²»ÐÁ¿à¡±£¬µ«Ìô´íÁ˾Ϳ÷Ëð¡£

͵͵¸æËßٯŶ£º¡°QqȺÃÀÅ®¿ì²Í¡±ÀïÏá¸öЧÀÍ£¬ÓÈÆäÊÇɶÍâÂô¿ìµÝ£¬Ù¯×îºÃÑ¡ÄÇЩ´øÆÀ¼Û¸ö£¬»òÕßȺÀï¿Ú±®ºÃµÄÉ̼Ò¡£°¢À­ÀÏÔç³½¹â½²¡°Âò¹¤¾ßÒª¿´¡®ÀÏ×ֺ𝡱£¬ë¡¸öÒâ˼²îÎð¶àÀ²¡£

Ù¯ÏþµÃ·¥£¬ÓÐЩȺ»¹ÕæÓеãÒâ˼

ë¡ÌìÒ¹¿ìµãÎÒ³ÔºÃÒ¹·¹£¬¾ÍÏë³öÈ¥µ´µ´Âí·£¬ß¼Ã»Ïëµ½×ßµ½ÅªÌõ×£¬Ìýµ½¼¸¸öÒÌÂè¸ÂÚ¨ºú£¬½²µ½ë¡¸öȺÀïÏáÓÐÒ»¼ÒÈ˼ÒÂô¼Ò³£²Ë¸ö¡£ÒÁ¸ö²ËŶ£¬ÕæÊÇÏñ°¢À­Ð¡Ê±ºò³Ô¸öζµÀ¡£½á¹û£¬ÎÒһ̽ѯ£¬¾ÓÈ»¾Íס°¢Àï´îËÄÖÜ£¡ë¡ÖÖȺ°¡£¬Ù¯ÒªÊÇÅöµ½¿¿Æ×¸ö£¬ÕæÊÇÓÐЩ¾ªÏ²¡£

롸ö¹¤¾ßºÍÀÏÉϺ£ÓÐɶ¹ØÏµ£¿

ÎÒ¸úÙ¯½²Å¶£¬ë¡¸ö¹¤¾ßËäÈ»ÌýÆðÀ´ÊÇÍøÂçÀïÏá¸öÐÂÏÊÍæÒ⣬µ«ÕÕÎÒ¿´À´Å¶£¬ë¡¸öÆäʵ¾ÍÊÇÏÖ´ú°æ¸ö¡°ÅªÌÃÎÄ»¯¡±¡£ÀÏÔç³½¹âŶ£¬°¢À­ÉϺ£¸öŪÌÃÀïÏáÍ·£¬É¶Îïʶ¼Äܸ㶨¡£Ù¯ÒªÂòɶ·¥£¬°¢Àï´îÓа¢ÆÅÂô£»Ù¯ÒªÐÞɶ¹¤¾ß·¥£¬ÅªÌÿھÍÓÐʦ¸µ¡£ë¡¸ö¡°QqȺÃÀÅ®¿ì²Í¡±£¬Ù¯ÒªÊÇÓõú㬾ÍÏñ»Øµ½ÀÏÉϺ£¸öŪÌÃÀïÏáÒ»Ñù£¬É¶¶¼±ãµ±¡£


Ù¯¿ÉÄÜ»áÎÊ£ºÊDz»ÊÇÿ¸öȺ¶¼ÖµµÃÐÅÀµ£¿

ÕÕÎÒ¿´À´Å¶£¬ë¡ÖÖȺÀïÏáÓкÃÓлµ£¬Ù¯ÒªÊÇÅöµ½ÄÇЩ¸öÃû×ÖÈ¡µÃÏ쵫ɶÎïʶ¼Ã»ÓиöȺ£¬×îºÃÎðÒªÀË·Ñʱ¼ä¡£¿¿Æ×¸öȺŶ£¬Ù¯½øÈ¥ºó£¬ÈºÀïÏáÍ·¸öЧÀÍÕæÊÇÏñ¼ÒÃſڸöŪÌÃ̯ͷһÑù£¬±ãµ±ÓÖʵÔÚ¡£

±êÇ©£º

  • QqȺÃÀÅ®¿ì²Í
  • ÉϺ£ÅªÌÃЧÀÍ
  • ÍøÂçÍâÂô
  • ÀÏÉϺ£ÎÄ»¯
  • ÍøÂçȺ×é

¡¶ÆÜϼÌÒ´åºó½ÖÍíÉÏÓÐÁµ°®Âð¡·

? Li H, Zuo Y, Yu J, ..., Zhou B, Ding N. SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning [J]. arXiv preprint arXiv:2509.09674, 2025.

¡¶Î«·»Ð¡ºúͬˣµÄÅ®ÈËÔÚÄÄ¡·

ËûÌåÏÖ£¬Ïã¸ÛºÍÄڵصıùÑ©Ô˶¯½»Á÷Ò»Ö±ºÜÊÇÃÜÇУ¬»á¾­³£¾Ù°ìѵÁ·ÓªµÈÔ˶¯£¬Ïã¸ÛÑ¡ÊֻᰴÆÚµ½¶«±±¼ÓÈ뼯ѵ¡£ËûЦ³Æ£º¡°ÄãÃÇÒªÊÇÂÃÐÐÒ»ÏÂÏã¸ÛÍâµØµÄѵÁ·Óª»á·¢Ã÷£¬ÌرðСµÄСÅóÓÑÏÖÔÚ¶¼¿ªÊ¼Ñ§¶«±±»°ÁË¡£¡±

¡¶ä¯ºÓÒ»Ìõ½Ö150ÔªËæ½ÐËæµ½ÊÇʲô¡·

Êг¡µ£ÐÄ£¬Èô½øÒ»²½´óÁ¦ÊÕ½ôÁ÷¶¯ÐÔ£¬¿ÉÄÜ»áÍÆ¸ßºã¾Ã¹úÕ®ÊÕÒæÂÊÓëµäÖÊ´û¿îÀûÂÊ£¬ÕâÓë°×¹¬ÔÚס·¿¿Éµ£¸ºÐÔ·½ÃæµÄµ£ÐÄÏà³åÍ»¡£

ÍøÕ¾µØÍ¼