[AI] #7. AWS Bedrock 25 Apr 2024 AI [AI] #7. AWS Bedrock Amazon Bedrock은 AI 회사들의 파운데이션 모델(Foundation Model, FM)을 API를 통해 사용할 수 있게 해주는 완전관리형 서비스입니다.
[AI] #6. 언어 모델 정렬을 위한 TR-DPO 22 Apr 2024 AI [AI] #6. 언어 모델 정렬을 위한 TR-DPO 언어 모델의 정렬은 언어 모델이 인간의 가치, 선호도 및 의도와 일치하는 결과를 생성하도록 보장하는 과정을 말합니다. 이는 고객 서비스 봇부터 콘텐츠 생성 시스템에 이르기까지 다양한
[AI] #5. 무한 입력이 가능한 Infini-attention 18 Apr 2024 AI [AI] #5. 무한 입력이 가능한 Infini-attention 어텐션 메커니즘의 기본 개념은 입력 시퀀스에서 출력을 예측할 때 전체 입력이 아닌 관련 부분에만 집중하는 것입니다. 예를 들어 기계번역을 할 때, 소스 문장의 특정 단어들에
[AI] #4. GPT-4 터보 개선 14 Apr 2024 AI [AI] #4. GPT-4 터보 개선 오픈 AI가 유료사용자들을 위해서 GPT-4-turbo-2024-04-09 모델을 배포했습니다. 최근 불거진 게으름문제를 해결한 것으로, 앤트로픽 클로드3과 구글 제미나이 최신모델을 모두 뛰어넘었다는 벤치마크도 함께 공개했습니다. 오픈 AI가 동영상
[AI] #3. 트랜스포머 모델의 효율성을 높이는 새로운 접근법: Mixture-of-Depths(MoD) 14 Apr 2024 AI [AI] #3. 트랜스포머 모델의 효율성을 높이는 새로운 접근법: Mixture-of-Depths(MoD) 트랜스포머 모델은 자연어 처리 분야에서 두각을 나타내고 있지만, 그 성능은 많은 계산 자원을 필요로 합니다. Google DeepMind의 연구팀이 최근 발표한 "Mixture-of-Depths: Dynamically allocating compute