본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2024.09.18

인공지능신문/ 최광민 기자

 

인공지능(AI) 기술의 급격한 발전 속에서 대형언어모델(LLM) 및 AI 모델의 성능을 객관적으로 평가하고 이해하기 위한 엄격하고 재현 가능한 평가는 모델 개선의 다음 단계를 알리고, 인공지능의 과학적 발전을 리딩하는 데 매우 중요하다.
그러나 벤치마크 포화, 측정을 위해 배포되는 방법의 투명성 부족, 생성 작업에 적합한 측정값을 추출하는 개발 과제, 그리고 보다 일반적으로 모델 간의 포괄적인 비교를 보여주기 위해 고려해야 할 광범위한 기능을 포함하여 커뮤니티의 즉각적인 주의가 필요한 여러 가지 이유로 인해 평가 프로세스가 실제로 어려워졌다.
이러한 흐름 속에서 마이크로소프트(Microsoft)가 개발한 오픈 소스 프레임워크 '유레카(Eureka)'를 기반으로 한 연구 보고서가 17일(현지시간) 발표되어 주목을 받고 있다.
(후략)

 

[원본기사 : https://www.aitimes.kr/news/articleView.html?idxno=32234]

맨 위로
맨 위로