gemini 2

인공지능의 성적표 - MMLU에 대해 알아봅시다

최근에 논란이 되었던 구글 Gemini는 Gemini Ultra의 MMLU 스코어가 GPT-4와 사람 전문가의 점수를 뛰어 넘었다고 홍보했는데요, 과연 이 MMLU 가 무엇인지 이번 포스트를 통해 알아봅시다. MMLU란 무엇인가MMLU(Massive Multitask Language Understanding)는 인공지능의 다양한 지식과 문제 해결 능력을 평가하는 도구입니다. 이 벤치마크는 과학, 기술, 공학, 수학(STEM), 인문학, 사회과학 등 약 57개의 다양한 과목에 걸친 질문들로 구성되어 있습니다. 이 질문들은 초등학생 수준부터 전문가 수준까지 다양한 난이도를 가지고 있습니다. 제로샷 퓨샷MMLU가 특별한 이유는 '제로샷(zero-shot)'과 '퓨샷(few-shot)' 성능을 측정하기 때문입니..

AI 뉴스 2023.12.14

구글 제미니는 과장되었다?! 데모 비디오의 진실

오늘 구글이 충격적인 영상을 하나 발표했습니다. 바로 구글의 새로운 인공지능 모델인 제미니(Gemini)의 시연 영상인데요. 영상을 보시면 마치 아이언맨의 자비스처럼, 인공지능이 영상을 보면서 음성으로 설명도 해주고 문제 풀이를 해주는 모습을 보여줍니다. 아마 이 구글 제미니 시연 영상을 보시고 충격을 받으신 분이 적지 않으리라 생각합니다. 기존에도 GPT4가 뛰어난 성능으로 여러 분야에서 활용되고 있지만 구글 제미니 처럼 비디오. 이미지, 음성 등 여러가지 종류의 데이터를 능숙하게 다루는것은 신선한 충격이기 때문입니다. 실제로 구글 제미니는 GPT4는 물론이고 사람 전문가 보다 높은 MMLU벤치마크 점수를 낸다고 발표했습니다. (전문가가 아닌 일반인은 이미 인공지능이 앞선지 꽤 되었습니다) 그런데 이 ..

AI 뉴스 2023.12.07