2023-08-26
×î½üAIȦ×Ó²»¿É²»Î½ÈÈÄÖ£¬±»³ÆÎª´óÄ£×Ó¡°µÓÚ¨Ñо¿¡±µÄ ¡¶Attention is All You Need¡·ÂÛÎĵİËλ×÷ÕßÒÑËùÓдÓGoogleÈ¥Ö°£¬Í¶ÉíAI´´Òµ£¬²¢ÇÒ¶¼ÊÕ»ñÁË×ÊÔ´Êг¡ÈϿɣ¬»ñµÃ¾Þ¶îͶ×Ê¡£µ±ÏÂ×î»ðÈȵÄOpenAIµÄGPTÄ£×Ó¡¢¹È¸èµÄBardÄ£×ÓÒ²¶¼²»Ô¼¶øÍ¬µØ½è¼øÁË¡¶Attention is All You Need¡·ÂÛÎÄÖеÄTransformer¼Ü¹¹¾ÙÐÐÉè¼Æ£¬Õâ¾ÍÈÃÈ˲»½ûºÃÆæ£ºÕâ¸ö¸Ä±äÁËAIÉú³¤Àú³Ì£¬Ê¹AIÕæÕý±äµÃ¡°ÖÇÄÜ¡±µÄTransformerÊÂʵÊǺη½ÉñÊ¥ÄØ£¿

£¨Í¼ Attention Is All You Need£©
½âÃÜTransformer£ºÌ½Ë÷´óÓïÑÔÄ£×Ó½¹µã
´ÓÒÑÍù¾ÐÄàÓÚ¹æÔòµÄ³ÌÐò£¬µ½ÏÖÔÚÄܹ»×ÔÎÒѧϰ¡¢×ÔÎÒ½ø»¯µÄÖÇÄÜÌ壬ÏÖÏÖÔÚµÄAIÊÇÔõÑù×öµ½·ÉËÙǰ½ø£¿ÔçÆÚµÄÑ»·Éñ¾Íø£¨Recurrent Neural Network£¬RNN£©µ½ÊÇ·ÇʱӰÏó£¨Long Short Term Memory£¬LSTM£©£¬´Ó¾í»ýÉñ¾ÍøÂ磨Convolutional Neural Network, CNN£©µ½TransformerÄ£×Ó£¬ÕâЩÞÖ¿ÚÄÑÄîµÄÓ¢Îĵ¥´Ê£¬±³ºóÈ´ÊÇÈ˹¤ÖÇÄÜÁìÓòµÄÒ»²¨ÓÖÒ»²¨¸ïÃü¡£

£¨Í¼ ´îÔØLLM´óÄ£×ÓµÄÔªÏíÖÇÄÜÔÆÆ½Ì¨£©
µ«ÔÚChatGPTºá¿Õ³öÉúǰ£¬×ÔÈ»ÓïÑÔ´¦Öóͷ£ÁìÓòµÄAI´óÓïÑÔÄ£×ÓÓ¦ÓÃËÆºõ¶¼ÀëÎÒÃÇ»¹ºÜÒ£Ô¶¡£ÒÔÍùµÄ¶Ô»°ÐÍAI£¬¾ÍÏñÊǸö³äÂúÔ¤Éę̀´ÊµÄ»úеÈË£¬²»¹ÜÄã˵ʲô£¬Ëü¶¼ÊÇÄÇÒ»Ì×»úеʽµÄ¡°if x; then a; else if y; then b¡¡ ¡±£¬Ö»»áÑ¡ÔñÄÚÈÝ£¬¶ø²»»á´´ÔìÄÚÈÝ¡£¿ÉÊÇ£¬Ëæ×ÅTransformerÄ£×ÓµÄո¶ͷ½Ç£¬´óÓïÑÔÄ£×ÓËÆºõÕÒµ½ÁËÐÂµÄÆ«Ïò¡£
ÄÇôTransformerÊÇÒÀÀµÊ²Ã´»úÖÆ»òÕß˵ÊÇÔÀí£¬ÈÃÔ±¾²»¿ÉÃ÷È·ÈËÀàÓïÑÔµÄAI£¬±äµÄÄܹ»Ã÷È·²¢ÌìÉúÏìÓ¦ÄÚÈݵÄÄØ£¿Æä½¹µãÔÚÓÚ¡¶Attention is All You Need¡·ÂÛÎÄÖÐÌáµ½µÄ×Ô×¢ÖØÁ¦»úÖÆ£¬ÕâÖÖ»úÖÆÈÃÄ£×ÓÄܹ»ÔÚ´¦Öóͷ£Îı¾Ê±¸üºÃµØ²¶»ñÉÏÏÂÎÄÐÅÏ¢£¬½¨Éè´ÊÓë´ÊÖ®¼äµÄÁªÏµ£¬ËƺõÄ£ÄâÁËÈËÀà¶Ô»°µÄÁ¬¹áÐÔ¡£TransformerÄ£×Óͨ¹ý¶ÔÊäÈëÎı¾µÄ×ÔÎÒ¹Ø×¢£¬Äܹ»ÔÚ²î±ðλÖÃÖ®¼ä½¨Éè¹ØÁª£¬´Ó¶ø¸üºÃµØÃ÷È·Õû¸öÎı¾µÄÓïÒå½á¹¹£¬Ò²ÈóäÂú´´ÔìÁ¦µÄÌìÉúʽAI£¨AIGC£©³ÉΪ¿ÉÄÜ¡£

£¨Í¼ ´îÔØAIGCÐéÄâÊý×ÖÈ˵ÄÔªÏíÊý×ÖħºÐ£©
ÊÍ·ÅÄ£×Ó´´ÔìÁ¦µÄ¶àÍ·×Ô×¢ÖØÁ¦»úÖÆ
TransformerʹÓÃ×¢ÖØÁ¦»úÖÆÀ´Ä£ÄâÈËÀà¶ÔÉÏÏÂÎĵÄÃ÷È·¡£ÕâÖÖ»úÖÆÔÊÐíÄ£×ÓÔÚ´¦Öóͷ£Îı¾Ê±£¬Æ¾Ö¤²î±ðλÖõĴʻ㽨Éè×Ô˳ӦµÄ×¢ÖØÁ¦¡£»»¾ä»°Ëµ£¬Ä£×ÓÄܹ»Ã÷ȷÿ¸ö´Ê»ãÓëÆäËû´Ê»ãÖ®¼äµÄ¹ØÏµ£¬²¢ÇÒ²»ÊÜ¡°¾àÀ롱µÄÏÞÖÆ¡£¿´ËÆÖØ´óµÄ»úÖÆ£¬×ÅʵÔÀíºÜ¼òÆÓ£¬¾ÍÊÇͨ¹ýÅÌËãÿ¸ö´Ê»ãÖ®¼äµÄÏàËÆ¶È£¬À´¹¹½¨×¢ÖØÁ¦È¨ÖØ¡£²¢ÇÒ¶àÍ·»úÖÆµÄÒýÈëÔöÌíÁËÄ£×ӵIJ¢ÐÐÐÔ£¬´Ó¶ø¸ü¸ßЧµØ²¶»ñ´Ê»ãÖ®¼äµÄ¹ØÁª¡£
²»¹ýÖ»ÓйØÁªÐÔÊDz»·óµÄ£¬ÎªÁËսʤTransformerÄ£×ÓÎÞ·¨²¶»ñ´Ê»ã˳ÐòÐÅÏ¢µÄÎÊÌ⣬OpenAIÔÚGPTÄ£×ÓÖл¹ÒýÈëÁË¡°Î»ÖñàÂ롱ÊÖÒÕ£¬Äã¿ÉÒÔ°Ñ¡°Î»ÖñàÂ롱Ã÷ȷΪһ±¾¡°µØÍ¼¡±£¬Ëü¸æËßÿ¸ö´Ê»ãÔÚ¾ä×ÓÖеÄλÖá£ÕâÑùÒ»À´£¬´óÓïÑÔÄ£×ÓÄ£×Ó²»µ«ÄÜÃ÷È·´Ê»ãµÄÓïÒ壬»¹ÄܸÐÖªËüÃÇÔÚ¾ä×ÓÖеÄÂöÂç¡£¾ÍÓÌÈçÎÒÃÇÔÚÔĶÁʱ£¬»áƾ֤ÎÄ×ÖµÄλÖÃÀ´ÍƶÏËüÃǵÄÖ÷ÒªÐԺ͹ØÏµ¡£

£¨Í¼ Multi-Headed Attention)

£¨Í¼ TransformerÄ£×Ó)
ÖÖÖÖ¾«ÃîµÄ»úÖÆÏ໥ÍŽᣬ×÷ÓýÁËÏÖÔÚ»ùÓÚTransformerµÄÖÖÖÖ´óÓïÑÔÄ£×Ó£¬Ò²ÈÃÔËÐдóÓïÑÔÄ£×ÓµÄAI²»ÔÙÖ»Äܹ»»úеʽ»Ø¸²£¬¶øÊdzÉΪһ¸öÄܹ»Éî¿ÌÃ÷È·Îı¾¡¢ÌìÉúÆæÒì»ØÓ¦µÄÖÇÄÜÌ塣ͨ¹ý×Ô×¢ÖØÁ¦¡¢¶àÍ·»úÖÆºÍλÖñàÂëµÄÅäºÏ×÷Óã¬Ä£×ÓÔÚ´¦Öóͷ£Îı¾Ê±£¬ÍðÈçһλʫÈË£¬Äܹ»ÓÃÇ¡µ½ÀûÒæµÄÑÔ´Ç£¬¹¹½¨³ö¾«²Ê·×³ÊµÄ¾ä×Ó£¬ÁîÈË̾Ϊ¹ÛÖ¹¡£Ò²ÈÃÈËÃÇ¿´µ½ÕâÏîÊÖÒÕÔËÓÃÔÚÐéÄâÊý×ÖÈËÉíÉϻᱬ·¢ÔõÑùµÄÊÖÒÕ¸ïÃü¡£

£¨Í¼ GPT-3 µ½ ChatGPTµÄÐÄ·Àú³Ì£©
´óÓïÑÔÄ£×ÓÄܹ»ÎªÐéÄâÊý×ÖÈ˸¶Óë¡°Áé»ê¡±Âð£¿
´óÓïÑÔÄ£×Ó×÷ÓýµÄÌìÉúʽAI£¬ÈÃÈËÓë»úе¾ÙÐÐÎÄ×Ö¶Ô»°³ÉΪ¿ÉÄÜ£¬µ«ÔõÑùÄܹ»Í»ÆÆ¿Ö²À¹È£¬ÈûúеÈËÓëÈ˵Ľ»Á÷ÏñÈËÓëÈ˽»Á÷Ò»Ñù×ÔÈ»Á÷ͨ£¬ÔòÓÖÊÇÒ»¸öеÄÄÑÌâ¡£
×ðÁúʱ¿ÈËÉú¾ÍÊDz«¹ÙÍøz6mg×Ó¹«Ë¾Ôª¾³¿Æ¼¼×ÔÑС¸MetaSurfing-ÔªÏíÖÇÄÜÔÆÆ½Ì¨¡¹£¬´îÔØÐÐÒµÁìÏȵÄÐéÄâÊý×ÖÈ˽»»¥ÏµÍ³¡¢´óÓïÑÔÄ£×Ó¡¢¶àģ̬¸ÐÖªµÈÊÖÒÕ£¬ÎªÐéÄâÊý×ÖÈ˸¶ÓëÁËÊÓ¾õ¡¢Ìý¾õºÍÓïÑÔÄÜÁ¦£¬Ê¹ÐéÄâÊý×ÖÈËÄܹ»ÏñÈËÀàÒ»Ñù½»Á÷¡¢Ã÷È·ºÍ˼Ë÷¡£²¢Í¨¹ý¡¸ÔªÏíÊý×ÖħºÐ¡¹ÒÔ3DÁ¢ÌåÐÎʽ·ºÆð³öÓÐÁé»ê¡¢ÓÐÓ°Ïó¡¢¶àÇéÐ÷¡¢¶à¸ÐÖª¡¢³¬Ð´ÊµµÄÈ«ÄâÕæÈËÀà¸öÌ壬ÈÃÐéÄâÊý×ÖÈË¿ÉÒÔÏñÕæÈËÒ»Ñù¾ÙÐС°ÃæÆËÃæ¡±½»»¥£¬ÓµÓÐ×Ô¼ºµÄ¡°ÉíÌ塱¡¢¡°ÑÔ´Ç¡±ºÍ¡°Í·ÄÔ¡±£¬ÈçÈËÀàÒ»Ñùƽ³£Í¨¹ýÓïÑÔ±í´ïÐÄÌïµÄÇéÐ÷ºÍ˼Ë÷¡£

£¨Í¼ ´óÓïÑÔÄ£×ÓÄܹ»ÎªÐéÄâÊý×ÖÈ˸¶Óë¡°Áé»ê¡±Â𣿣©
AIÔªÄê
ÕýÈç¡¶Attention is All You Need¡·ÂÛÎĵÄ×÷ÕßËùչʾµÄ£¬¿Æ¼¼µÄǰ½øÒ»Ö±Íƶ¯×ÅÈ˹¤ÖÇÄÜÁìÓòµÄÇ°ÑØÌ½Ë÷¡£µ±ÏÂÎÒÃÇÕýÔÚÉí´¦AIʱ´úµÄÀ˳±Ö®ÖУ¬ÑÛ¼û×Å´óÓïÑÔÄ£×ÓÓëÐéÄâÊý×ÖÈËÕâÁ½¸öÁìÓòµÄÅöײÓëÈںϣ¬Î´À´ÎÒÃÇ»òÐíÄܹ»ÔÚÐéÄâÌìÏÂÖÐÓëÐéÄâÊý×ÖÈ˾ÙÐÐÉî¿ÌµÄÕÜѧ¶Ô»°£¬Ì½ÌÖ2023ÄêµÄÕⳡAI¸ïÃü£¬¶ÔºóÊÀÒý·¢µÄÉîÔ¶Ó°Ïì¡£