반응형
GPT-4, 문자.음성.이미지 생성하는 '멀티모달'

독일 마이크로소프트가 대규모 인공지능(AI) 모델 'GPT-4'를 다음 주 공개하겠다고 밝혔다.

 

안드레스 브라운 독일 마이크로소프트 최고기술책임자(CTO)는 9일(현지시간) 독일서 개최한 'AI인 포커스-디지털 킥오프' 행사에서 "다음 주 GPT-4를 공개하겠다"고 발표했다고 독일 IT 매체 하이젠이 보도했다.

 

이번 행사에서 마이크로소프트 독일 관계자들은 대규모 언어 모델 발전 방향과 애저에 접목한 오픈AI 기술을 소개했다. 해당 발표에서 브라운 CTO는 GPT-4 모델에 대해 대략적으로 설명하면서 공개 일정까지 밝힌 셈이다.

독일 마이크로소프트 안드레아스 브라운 CTO (사진=행사 캡처)
독일 마이크로소프트 안드레아스 브라운 CTO (사진=행사 캡처)

그는 "GPT-4는 모두가 예상했던 형태다"며 "문자뿐 아니라 음성, 이미지, 영상을 이해·생성할 수 있는 '멀티모달'" 이라고 설명했다. 독일 마이크로소프트 측은 GPT-4를 자사 검색엔진 '빙'에 탑재해 성능을 업그레이드 할 계획도 알렸다. 다만 구체적인 일정은 밝히지 않았다.

 

마이크로소프트는 오픈AI 챗봇인 챗GPT를 검색엔진 '빙'에 탑재했다. GPT-3.5 버전을 한 단계 업그레이드한 프로메테우스 모델을 활용했다. 그러나 많은 사용자들이 부정확하고 비윤리적인 답변에 불만을 표출했다. 느린 답변 속도도 문제 삼았다.

 

GPT-4가 빙에 탑재되면 사용자는 문자뿐 아니라 이미지, 소리를 포함한 여러 모드를 통해 검색 결과를 받을 수 있을 전망이다. 기존보다 더 빠른 답을 받을 수도 있다.

 

다수 외신은 올해 초부터 오픈AI가 GPT-4를 이용한 챗GPT 모바일 애플리케이션을 개발 중이라고 보도한 바 있다. 외신들은 해당 앱은 문자뿐 아니라 이미지, 비디오를 생성할 수 있는 기능을 갖췄으리라 추측했다. 당시 샘 알트만 오픈AI 최고경영자는 "기사 보도는 사실이 아니다"며 선 그었다.

원문기사

반응형