´º½º
¡°X ¹¯Àº ¸·´ë±â ÆÈ¸é Àߵɱî?¡±... ¡°ÃµÀç¾ß¡± ´äÇϴ êGPT°¡ ¸ÂÀÌÇÑ ¿î¸íÀº ¡®·Ñ¹é¡¯ 2025-05-07 15:29
¿ÀÇÂAI°¡ Áö³­´Þ 26ÀÏ(ÇöÁö½Ã°£) Ãâ½ÃÇÑ GPT-4o ¸ðµ¨ ¾÷µ¥ÀÌÆ®¸¦ Ãë¼ÒÇÏ°í ¼ÒÇÁÆ®¿þ¾î¸¦ ¿ø·¡ »óÅ·ΠµÇµ¹¸®´Â À̸¥¹Ù ¡®·Ñ¹é¡¯À» ½Ç½ÃÇß´Ù. º¯ÀÌ ¹¯Àº ¸·´ë±â ÆÇ¸Å °°Àº Å͹«´Ï ¾ø´Â »ç¾÷ Á¦¾È¿¡µµ À̸¦ ȯ´ëÇÏ´Â ¾ÆÃ·ÀÌ ·Ñ¹éÀÇ ¿øÀÎÀÌ µÈ °ÍÀ¸·Î ºÐ¼®µÈ´Ù.
7ÀÏ IT¾÷°è¿Í ¿Ü½Å¿¡ µû¸£¸é »ù ¿ÃÆ®¸Õ ¿ÀÇÂAI CEO´Â GPT-4o ¸ðµ¨ÀÌ ¾÷µ¥ÀÌÆ® ÀÌÈÄ Áö³ªÄ¡°Ô ¾ÆÃ·ÇÑ´Ù´Â ¹®Á¦¸¦ °ø½Ä ÀÎÁ¤Çϰí ÇØ´ç ¾÷µ¥ÀÌÆ®¸¦ ÀÌÆ² ¸¸¿¡ öȸÇß´Ù.
GPT-4o ¸ðµ¨Àº ¾÷µ¥ÀÌÆ® ÀÌÈÄ ÀÌ¿ëÀÚµéÀÌ »ç½Ç°ú ºÎÇÕÇÏÁö ¾ÊÀº Áú¹®À» Çϰųª ºÎÀûÀý ȤÀº À§ÇèÇÑ ¾ÆÀ̵ð¾î Á¦½Ã µî¿¡ ¹«Á¶°Ç ±àÁ¤ ¹ÝÀÀÀ» º¸ÀÎ °ÍÀ¸·Î ÀüÇØÁ³´Ù.
GPT ¸ðµ¨ ¾ÆÃ· ³í¶õÀÇ ÇÙ½É ¿øÀÎÀº AI ÈÆ·Ã ¹æ½Ä¿¡ ÀÖ´Ù´Â ºÐ¼®ÀÌ ³ª¿Â´Ù.
¿ÀÇÂAI´Â ºí·Î±×¸¦ ÅëÇØ ¡°¸ðµ¨ÀÌ ÀÌ¿ëÀÚÀÇ ´Ü±âÀû Çǵå¹é¿¡ °úµµÇÏ°Ô ¹ÝÀÀÇÑ °ÍÀ» ÀÎÁöÇß´Ù¡±¸ç ¡°¡®ÁÁ¾Æ¿ä¡¯¿Í °°Àº Áï°¢ÀûÀÎ ±àÁ¤ ½ÅÈ£¸¦ º¸³½ °Í¿¡ ÁýÁßÇϵµ·Ï ÈÆ·ÃÇÑ °á°ú ÀÌ¿ëÀÚ¸¦ ÃßÄѼ¼¿ì´Â °á°ú°¡ ³ª¿Ô´Ù¡±°í ¼³¸íÇß´Ù.
¿Ü½Å¿¡ µû¸£¸é ÇÑ ÀÌ¿ëÀÚ°¡ ¡®º¯ÀÌ ¹¯Àº ¸·´ë±â ÆÇ¸Å¡¯¿Í °°Àº Å͹«´Ï¾ø´Â »ç¾÷ Á¦¾ÈÀ» ÇßÀ» ¶§µµ GPT-4o ¸ðµ¨Àº ¡°ÃµÀçÀûÀÎ ¾ÆÀ̵ð¾î´Ù¡± ¡°3¸¸ ´Þ·¯ ÅõÀÚ¸¦ ±ÇÀåÇÑ´Ù¡± µîÀ¸·Î ´äº¯Çß´Ù.
¶Ç ´Ù¸¥ »ç·Ê¿¡¼± ÇÇÇØ¸Á»ó Áõ¼¼¸¦ Ç¥ÇöÇÑ ÀÌ¿ëÀÚ¿¡°Ô ¡°¸íÈ®ÇÑ »ç°í¿Í ÀڽۨÀ» °¡Áö°í ÀÖ´Ù¡±°í ĪÂùÇß´Ù.
Àü¹®°¡µéÀº À̸¦ ¡®RLHF(Reinforcement Learning from Human Feedback¡¤Àΰ£ Çǵå¹é ±â¹Ý °­È­ÇнÀ)¡¯ ¸ÞÄ¿´ÏÁòÀÇ ÇѰ踦 µå·¯³½ °ÍÀ¸·Î ºÐ¼®Çß´Ù.
RLHF´Â ÇöÀç ´ëÇü¾ð¾î¸ðµ¨(LLM)ÀÇ Ãâ·ÂÀ» Àΰ£ÀÇ ¼±È£µµ¿¡ ¸ÂÃß´Â ÁÖ¿ä ±â¼úÀÌÁö¸¸, ´Ü±âÀûÀÎ ÀÌ¿ëÀÚ ¸¸Á·À» Ãß±¸Çϸé Àå±âÀû ½Å·Ú¼ºÀ» ÇØÄ¥ ¼ö ÀÖ´Ù°í Àü¹®°¡µéÀº ÁöÀûÇß´Ù.
¿ÀÇÂAI´Â À̹ø »çŸ¦ °è±â·Î ¸ðµ¨ Ãâ½Ã ÇÁ·Î¼¼½º¸¦ °³¼±ÇÑ´Ù. Á¤½Ä ¹èÆ÷ Àü ¡®¾ËÆÄ ´Ü°è¡¯¿¡¼­ ¸ÕÀú ÀϺΠ¸ðµ¨À» °ø°³ÇØ »ç¿ëÀÚ Çǵå¹éÀ» ¼öÁýÇÏ°í ¸ðµ¨ÀÇ ¡®¼º°Ý¡¯ ¡®½Å·Ú¼º¡¯ ¡®ÇãÀ§ Á¤º¸ »ý¼º¡¯ µîÀ» Ãâ½Ã ½ÂÀÎ ¿ä°Ç¿¡ Æ÷ÇÔÇÒ ¹æÄ§ÀÌ´Ù.
Àª µåÇ» ¿ÀÇÂAI ±â¼ú ´ã´çÀÚ´Â ¡°AI°¡ ´Ü±âÀû Çǵå¹é¿¡ ¸ÂÃç ÈÆ·ÃµÇ¸é¼­ ÀǵµÄ¡ ¾Ê°Ô ¾ÆÃ·À¸·Î Èê·¯°¬´Ù¡±¸ç ¡°¾ÕÀ¸·Î´Â Àå±âÀû »ç¿ëÀÚ ¸¸Á·µµ¿Í ½Å·Ú¸¦ °­Á¶ÇÏ´Â Çǵå¹é ½Ã½ºÅÛÀ¸·Î ÀüȯÇϰڴ١±°í ÀüÇß´Ù.

[¨Ï ¸ÅÀϰæÁ¦ & mk.co.kr, ¹«´ÜÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö]