±±ÓÊÓëÌÚÑ¶AI LabÌá³öMoE-CL¼Ü¹¹£¬½â¾ö´óÄ£ÐÍ³ÖÐøÑ§Ï°ºËÐÄÍ´µã

±±ÓÊÓëÌÚÑ¶AI LabÌá³öMoE-CL¼Ü¹¹£¬½â¾ö´óÄ£ÐÍ³ÖÐøÑ§Ï°ºËÐÄÍ´µã

ÔÚ¹¤Òµ¼¶´óÓïÑÔÄ£ÐÍ£¨LLM£©Ó¦ÓÃÖÐ£¬¶¯Ì¬ÊÊÅäÈÎÎñÓë±£Áô¼ÈÓÐÄÜÁ¦µÄ ¡°×Ô½ø»¯¡± ÐèÇóÈÕÒæÆÈÇÐ¡£ÕæÊµ³¡¾°ÖÐ£¬²»Í¬ÁìÓòÓïÑÔÄ£Ê½²îÒìÏÔÖø£¬LLM ÐèÔÚÑ§Ï°ÐÂ³¡¾°ºÏ¹æ¹æÔòµÄÍ¬Ê±£¬²»¶ªÊ§¾É³¡¾°µÄÅÐ¶ÏÄÜÁ¦¡£ÕâÕýÊÇ´óÄ£ÐÍ×Ô½ø»¯ºËÐÄËßÇó£¬¼´ ¡°×ÔÖ÷ÓÅ»¯¿çÈÎÎñÖªÊ¶ÕûºÏ£¬ÊÊÓ¦¶¯Ì¬»·¾³¶øÎÞÐè´óÁ¿Íâ²¿¸ÉÔ¤¡±¡£

Îª½â¾ö´ËÎÊÌâ£¬±±ÓÊ°Ù¼Ò AI ÍÅ¶ÓÓëÌÚÑ¶ AI Lab ÍÅ¶ÓÌá³ö²ÎÊý¸ßÐ§µÄ¶Ô¿¹ÐÔ»ìºÏ×¨¼Ò¼Ü¹¹ MoE-CL£¬×¨ÃÅÓÃÓÚ LLM µÄ×Ô½ø»¯³ÖÐøÖ¸ÁîÎ¢µ÷¡£ÆäºËÐÄÉè¼ÆÔÚÓÚ ¡°½âñî LoRA ×¨¼Ò¡± Óë ¡°GAN ¶Ô¿¹½µÔë¡± µÄ½áºÏ£ºÎªÃ¿¸öÈÎÎñÅäÖÃ×¨Êô LoRA ×¨¼ÒÒÔ±£ÁôÈÎÎñÌØ¶¨ÖªÊ¶£¬±ÜÃâ²ÎÊý¸üÐÂÏà»¥¸ÉÈÅ£»Í¬Ê±ÉèÖÃ¹²Ïí LoRA ×¨¼Ò£¬Í¨¹ýÉú³É¶Ô¿¹ÍøÂç£¨GAN£©ÖÐµÄÈÎÎñ¸ÐÖª¼ø±ðÆ÷ÒÖÖÆÎÞ¹ØÔëÉù£¬È·±£¿çÈÎÎñÖªÊ¶¸ßÐ§ÇÒ¾«×¼´«µÝ£¬×îÖÕÊµÏÖ ¡°ÖªÊ¶±£Áô¡± Óë ¡°¿çÈÎÎñ·º»¯¡± µÄÆ½ºâ£¬ÕâÒ²ÊÇ LLM ×Ô½ø»¯µÄºËÐÄÂß¼¡£

´ÓÊµÑéÐ§¹ûÀ´¿´£¬MoE-CL µÄ×Ô½ø»¯ÄÜÁ¦ÒÑÔÚÊµ¼Ê³¡¾°Óë»ù×¼²âÊÔÖÐµÃµ½ÑéÖ¤¡£ÔÚÌÚÑ¶ÕæÊµÒµÎñ³¡¾° A/B ²âÊÔÖÐ£¬Ëü½«ÈË¹¤½éÈë³É±¾½µµÍ 15.3%£»ÔÚ¹«¿ª MTL5 ¿çÓò»ù×¼Óë¹¤Òµ¼¶ Tencent3 »ù×¼²âÊÔÖÐ£¬ÆäÆ½¾ù×¼È·ÂÊÓÅÓÚÏÖÓÐÖ÷Á÷·½·¨£¬ÇÒÔÚ²»Í¬ÈÎÎñÑµÁ·Ë³ÐòÏÂ±£³ÖÎÈ¶¨£¬Ö¤Ã÷ÆäÎÞÐèÈË¹¤µ÷Õû¼´¿ÉÊÊÅäÈÎÎñ¶¯Ì¬±ä»¯¡£

ÂÛÎÄ±êÌâ£º Self-Evolving LLMs via Continual Instruction TuningÂÛÎÄÁ´½Ó£º https://arxiv.org/abs/2509.18133´úÂë²Ö¿â£ºhttps://github.com/BAI-LAB/MoE-CL

01 ÒýÑÔ

ÔÚÊý×Ö¾¼ÃÅî²ª·¢Õ¹µÄµ±ÏÂ£¬º£Á¿ÎÄ±¾Êý¾ÝÈç³±Ë®°ãÓ¿Èë»¥ÁªÍøÆ½Ì¨¡£ÀýÈç£¬ÐÂÎÅ×ÊÑ¶µÄ¿ìËÙ¸üÐÂ¡¢µçÉÌÆ½Ì¨µÄº£Á¿ÆÀÂÛµÈ¶àÔ´Òì¹¹Êý¾ÝÃ¿ÈÕ¼¤Ôö£¬ÃæÁÙ¿çÁìÓò¡¢¸ßÊ±Ð§¡¢Ç¿¾«¶ÈµÄ¶àÖØÌôÕ½¡£Èô²ÉÓÃ´«Í³·½°¸£¬ÎªÃ¿ÖÖÎÄ±¾ÀàÐÍµ¥¶ÀÑµÁ·Ä£ÐÍ£¬½«ÏûºÄ¾Þ´óµÄ¼ÆËã×ÊÔ´ÓëÈËÁ¦³É±¾£»¶øÊ¹ÓÃµ¥Ò»Ä£ÐÍ´¦ÀíÈ«ÁìÓòÎÄ±¾£¬ÓÖÒòÊý¾Ý·Ö²¼²îÒìµ¼ÖÂÐÔÄÜÊ§ºâ£¬ÄÑÒÔÂú×ãÒµÎñÐèÇó¡£ÔÚ´Ë±³¾°ÏÂ£¬Ø½ÐèÒ»ÖÖ¼ÈÄÜ¸ßÐ§´¦ÀíÐÂÈÎÎñ£¬ÓÖÄÜ±£Áô¾ÉÈÎÎñÖªÊ¶µÄÍ¨ÓÃ¼¼Êõ·½°¸¡£Îª´Ë£¬ÎÒÃÇÌá³ö MoE-CL ´óÄ£ÐÍ»ìºÏ×¨¼Ò£¨MoE£©³ÖÐøÑ§Ï°¼Ü¹¹£¬ÖÂÁ¦ÓÚ´òÆÆ´«Í³·½·¨µÄ¾ÖÏÞ£¬ÒÔÊµÏÖ¶àÁìÓòÎÄ±¾ÈÎÎñµÄ¸ßÐ§ÐÍ¬´¦Àí¡£Ê¹µÃ´óÄ£ÐÍ¾ß±¸×Ô½ø»¯ÄÜÁ¦£º¶¯Ì¬ÊÊÓ¦ÑµÁ·Êý¾Ý£¬×ÔÖ÷ÓÅ»¯¿çÈÎÎñÖªÊ¶ÕûºÏ¡£

02 ·½·¨

»ìºÏ×¨¼Ò³ÖÐøÑ§Ï°£¨MoE-CL£©¿ò¼Ü¾Û½¹¶àÈÎÎñÑ§Ï°ÖÐµÄÖªÊ¶»ýÀÛÓëÈÎÎñÊÊÓ¦ÄÑÌâ¡£ÆäºËÐÄ²ÉÓÃ Transformer ¿éµÄ LoRA ÔöÇ¿¼¼Êõ£¬ÖØµãÓÅ»¯Ç°À¡Éñ¾ÍøÂç£¨FFN£©²ã£¬Í¨¹ýÒýÈëµÍÖÈ¾ØÕó½µµÍ²ÎÊý¸üÐÂÁ¿Óë¼ÆËã³É±¾£¬Í¬Ê±ÌáÉýÑ§Ï°Ð§ÂÊ¡£

MoE-CL ½« LoRA ×¨¼Ò·ÖÎªÈÎÎñÌØ¶¨ÓëÈÎÎñ¹²ÏíÁ½Àà£ºÇ°Õß×¨¹¥ÌØ¶¨ÈÎÎñÖªÊ¶£¬ºóÕßÌáÈ¡¿çÈÎÎñÍ¨ÓÃÐÅÏ¢¡£½áºÏÉú³É¶Ô¿¹ÍøÂç£¨GAN£©·ÖÀëÈÎÎñÌØ¶¨Óë¹²ÏíÐÅÏ¢£¬È·±£Ä£ÐÍ»ñÈ¡¸ßÖÊÁ¿¹²ÏíÖªÊ¶¡£

¼Ü¹¹ÉÏ£¬N ²ã LoRA ÔöÇ¿µÄ Transformer ¿é¼¶ÁªÌáÈ¡ÐÅÏ¢£¬×îÖÕÓÉÃÅ¿ØÍøÂçÈÚºÏÁ½ÀàÐÅÏ¢£¬ÎªÈÎÎñÔ¤²âÌá¹©Ö§³Å¡£ÕâÖÖÉè¼ÆÊ¹Ä£ÐÍ¼ÈÄÜÂú×ãÈÎÎñÌØÒìÐÔÐèÇó£¬ÓÖÄÜÀûÓÃÈÎÎñ¹²ÐÔ£¬ÊµÏÖ¸ßÐ§³ÖÐøÑ§Ï°¡£

Í¼ 1£ºMoE-CL µÄÕûÌå¿ò¼Ü¡£MoE-CL Í¨¹ý²ÉÓÃ´øÓÐÈÎÎñ¸ÐÖªÅÐ±ðÆ÷µÄ¶Ô¿¹ÐÔ MoE-LoRA ¼Ü¹¹£¬»º½âÁËÔÖÄÑÐÔÒÅÍüÎÊÌâ¡£MoE-CL Ö÷ÒªÓÉÁ½²¿·Ö×é³É£¬ÈÎÎñ¸ÐÖªÅÐ±ðÆ÷ÓÅ»¯ºÍÖ¸Áîµ÷ÕûÓÅ»¯¡£

2.1 ÈÎÎñ¸ÐÖªÅÐ±ðÆ÷ÓÅ»¯

2.2 Ö¸Áîµ÷ÕûÓÅ»¯

03 ÊµÑé

ÎÒÃÇÔÚ MTL5 ºÍ Tencent3 Á½¸öÆÀ²â»ù×¼ÉÏ½øÐÐÁËÊµÑé£¬²¢½«ÎÒÃÇµÄ·½·¨Óë¼¸ÖÖ¾ßÓÐ´ú±íÐÔµÄ³ÖÐøÑ§Ï°·½·¨½øÐÐ±È½Ï£¬ÒÔÕ¹Ê¾ MoE-CL µÄÓÐÐ§ÐÔ¡£

3.1 Ö÷ÊµÑé½á¹û

MTL5 ºÍ Tencent3 ÆÀ²â»ù×¼ÉÏµÄÊµÑé½á¹ûÈçÍ¼ 2£¬3 ËùÊ¾£¬ÓÐÒÔÏÂ½áÂÛ£º

Tencent3 ÆÀ²â»ù×¼ÉÏµÄÊµÑé½á¹û£¬Ê¹ÓÃÌÚÑ¶»ìÔª×÷Îª»ù×ùÄ£ÐÍ¡£´ÖÌåºÍÐ±Ìå±íÊ¾¸ù¾ÝÖ÷ÒªÆÀ¹ÀÖ¸±ê×¼È·ÂÊµÄ×îÓÅºÍ´ÎÓÅ¡£

·º»¯ÄÜÁ¦ÓëÎÈ¶¨ÐÔÍ»³ö£ºÏà±ÈËùÓÐ»ùÏß·½·¨£¬MoE-CL Æ½¾ù×¼È·ÂÊÏÔÖøÌáÉý£¬ÇÒ·½²î¼«Ð¡£¬ÔÚ¸´ÔÓÈÎÎñÖÐÕ¹ÏÖ³öÓÅÒìµÄ·º»¯ÄÜÁ¦ÓëÎÈ¶¨ÐÔ£»ÖªÊ¶Ç¨ÒÆÓÅÊÆÏÔÖø£ºMoE-CL ÔÚÕý·´ÏòÇ¨ÒÆÉÏ±íÏÖÎÈ¶¨£¬½Ï MoCL ¸ü²»Ò×ÊÜºóÐøÈÎÎñÓ°Ïì£¬ÑéÖ¤ÁËÉú³É¶Ô¿¹ÍøÂç¼¯³ÉÖÁ»ìºÏ LoRA ×¨¼ÒÍøÂçµÄÓÐÐ§ÐÔ£»Â³°ôÐÔ±íÏÖ³öÉ«£ºÃæ¶Ô²»Í¬ÈÎÎñÐòÁÐË³Ðò£¬MoE-CL Í¨¹ý·ÖÀë¹²ÏíÓëÌØ¶¨ÈÎÎñ×¨¼ÒµÄ¼Ü¹¹Éè¼Æ£¬ÔÚ MTL5 ºÍ Tencent3 »ù×¼²âÊÔÖÐÕ¹ÏÖ³ö¼«Ç¿µÄÂ³°ôÐÔ £¬Ô¶³¬ÆäËû»ùÏß·½·¨¡£

3.2 ÑéÖ¤Éú³É¶Ô¿¹ÍøÂçµÄÓÐÐ§ÐÔ

ÎªÑéÖ¤¶Ô¿¹ÐÔ MoE-LoRA ¼Ü¹¹¶ÔÔÖÄÑÐÔÒÅÍüµÄÒÖÖÆÐ§¹û£¬±¾ÎÄ¹¹½¨ÁË²»º¬Éú³É¶Ô¿¹ÍøÂç£¨GAN£©µÄ MoE-CL ¶Ô±È°æ±¾¡£ÊµÑé½á¹û£¨Í¼ 4£©ÏÔÊ¾£¬º¬ GAN µÄ MoE ×¨¼Ò¼Ü¹¹ÔÚ³ÖÐøÑ§Ï°ÈÎÎñÖÐÆ½¾ùÐÔÄÜÏÔÖøÓÅÓÚÎÞ GAN °æ±¾¡£ÕâÊÇÒòÎª GAN ÄÜ¹»¾«×¼½«ÌØ¶¨ÈÎÎñÐÅÏ¢·ÖÅäÖÁ¶ÔÓ¦µÍÖÈÊÊÅäÆ÷×¨¼Ò£¬ÓÐÐ§¹æ±ÜÈÎÎñ¼äÖªÊ¶¸ÉÈÅ£¬ÓÈÆäÔÚ·´ÏòÇ¨ÒÆ£¨BwT£©Ö¸±êÉÏ±íÏÖÍ»³ö£¬ÓÐÁ¦Ö¤Ã÷ÁË GAN ÔÚ·ÀÖ¹ÔÖÄÑÐÔÒÅÍü·½ÃæµÄ¹Ø¼ü×÷ÓÃ¡£

Í¼ 4£ºÉú³É¶Ô¿¹ÍøÂç¶Ô MoE-CL µÄÓ°Ïì¡£Èý¸öÖ¸±ê¶¼ÊÇÊýÖµÔ½´ó±íÃ÷ÐÔÄÜÔ½ºÃ¡£

3.3 ÀëÏß A/B ²âÊÔ

ÔÚÌÚÑ¶ÕæÊµÎÄ±¾·ÖÀàÈÎÎñÖÐ£¬Ä£ÐÍÒÀ¾ÝÖÃÐÅ¶ÈµÃ·Ö×Ô¶¯ÅÐ¶¨ÄÚÈÝÑù±¾Àà±ð£º³¬³öãÐÖµµÄÑù±¾±»Ö±½Ó±ê¼ÇÎªºÏ¹æ£¨°×Ñù±¾£©»ò²»ºÏ¹æ£¨ºÚÑù±¾£©£¬ÎÞÐèÈË¹¤½éÈë¡£ÌÞ³ýÂÊ×÷ÎªºËÐÄÆÀ¹ÀÖ¸±ê£¬Ö±¹Û·´Ó³×Ô¶¯·ÖÀàÑù±¾Õ¼±È£¬ÌÞ³ýÂÊÔ½¸ß£¬ÒâÎ¶×ÅÈË¹¤³É±¾Ô½µÍ¡£

ÎªÑéÖ¤ MoE-CL µÄÊµ¼ÊÓ¦ÓÃ¼ÛÖµ£¬ÑÐ¾¿ÍÅ¶Ó¿ªÕ¹ÀëÏß A/B ²âÊÔ£¬¶Ô±ÈÆäÓëÉú²úËã·¨µÄÌÞ³ýÂÊ±íÏÖ¡£ÊµÑéÊý¾Ý£¨Í¼ 5£©ÏÔÊ¾£¬ÔÚÈÎÎñ A ºÍÈÎÎñ B ³¡¾°ÏÂ£¬MoE-CL ¾ùÊµÏÖÏÔÖøÍ»ÆÆ¡£ÆäÖÐ£¬ÈÎÎñ A ³¡¾°ÖÐ MoE-CL ÌÞ³ýÂÊ¸ß´ï 28.8%£¬½Ï»ùÏßËã·¨ÌáÉý 15.3%£¬Ö±½Ó½µµÍÁËÍ¬µÈ±ÈÀýµÄÈË¹¤½éÈë¹¤×÷Á¿£¬ÇÐÊµÎªÒµÎñ³¡¾°´øÀ´½µ±¾ÔöÐ§µÄÉÌÒµ¼ÛÖµ¡£

Í¨¹ýÌÞ³ýÂÊºâÁ¿µÄÀëÏß A/B ²âÊÔ¡£

04 ×Ü½á

»ìºÏ×¨¼Ò³ÖÐøÑ§Ï°¿ò¼Ü MoE-CL Í¨¹ýÈý´óºËÐÄÉè¼ÆÆÆ¾Ö£º×¨ÊôÈÎÎñ×¨¼Ò·ÀÖ¹ÔÖÄÑÐÔÒÅÍü£¬ÈÎÎñ¹²Ïí×¨¼Ò´Ù½ø¿çÈÎÎñÖªÊ¶Ç¨ÒÆ£¬Éú³É¶Ô¿¹ÍøÂç±£ÕÏ¹²ÏíÐÅÏ¢ÖÊÁ¿¡£ÈýÕßÐÍ¬ÔË×÷£¬Ê¹Ä£ÐÍ¸ßÐ§ÊÊÓ¦ÐÂÈÎÎñ£¬ÊµÏÖ´óÄ£ÐÍ³ÖÐøÑ§Ï°ÖÐµÄ×Ô½ø»¯¡£

Ïà¹ØÍÆ¼ö£º中欧官网首页九州平台网站现在还有哪个德州app可以玩

·ÖÏí£º 2025-09-28 04:21:52 ¹²81¿î