본문 바로가기
AI

대표적인 대형 언어 모델 20종 (2024년 8월 기준)

by -Joy- 2024. 8. 26.

챗GPT의 출시 및 붐 이후 지난 약 1.5년 동안 참 다양한 대형 언어모델이 세상에 공개되었습니다. 구글과 마이크로소프트, 메타와 같은 IT 공룡들은 물론 기존에 잘 알려지지 않았던 다양한 회사에서 다양한 기능을 수행하는 언어 모델을 하나 둘 공개해 오고 있는데, 그만큼 이 AI산업 자체가 계속해서 성장과 혁신을 거듭하고 있는 모양새입니다.

 

그럼 현재 기준으로 전세계적으로 잘 알려져 있는 주요한 대형 언어 모델 약 20가지를 함께 살펴보겠습니다.

대표적인 대형 언어 모델 20종 (2024년 8월 기준)

 

대형 언어 모델 20가지

언어모델명 개발사 웹사이트 공개일 소스 파라미터 수 특징
Grok-2 X.AI https://x.ai/blog/grok-2 2024년 08월 13일 오픈소스 미공개 - 워크플로 및 일정 자동화 기능에 집중
Llama 3.1 Meta AI https://ai.meta.com/blog/meta-llama-3-1/ 2024년 06월 23일 오픈소스 4050억 개 - 학술 연구와 각종 산업에 적용하여 메타사 비즈니스를 확장시키는 데 집중
Claude 3.5 Anthropic https://www.anthropic.com/news/claude-3-5-sonnet 2024년 06월 20일 API 미공개 - 아웃풋의 윤리성과 안전성에 집중
Nemotron-4 340B Nvidia https://build.nvidia.com/nvidia/nemotron-4-340b-instruct 2024년 06월 14일 오픈소스 3400억 개 - 다른 기업이 신규 LLM을 더욱 효율적으로 만들 수 있도록 지원
GPT-4o OpenAI https://openai.com/index/hello-gpt-4o/ 2024년 05월 13일 API 미공개 - 대형 언어 모델 중 가장 유명
- 글의 맥락 이해도가 기존 버전 대비 개선됨
- 다양한 앱에 적용
Phi-3 Microsoft https://ai.azure.com/explore/models/Phi-3-mini-128k-instruct/version/5/registry/azureml 2024년 04월 23일 API 및 오픈소스 38억 개 - 크기로 따지면 소형 언어모델에 속하지만 GPT-3.5와 경쟁 가능
Mixtral 8x22B Mistral AI https://mistral.ai/technology/#models 2024년 04월 10일 오픈소스 1410억 개 - 모델의 성능 대비 이용비를 낮추는 데 집중
Jamba AI21 Labs https://www.ai21.com/jamba 2024년 03월 29일 오픈소스 520억 개 - 세계 최초의 프로덕션 등급 언어 모델
DBRX Databricks Mosaic ML https://github.com/databricks/dbrx 2024년 03월 27일 오픈소스 1320억 개 - 추론 속도와 양을 타사 대비 향상시키는 데 집중
Command R Cohere https://cohere.com/command 2024년 03월 11일 API 및 오픈소스 350억 개 - 대기업 및 중소기업 업무용 기능에 집중
Inflection-2.5 Inflection AI https://inflection.ai/ 2024년 03월 10일 비공개 미공개 - 복잡한 쿼리를 이해하고 자연스러운 아웃풋을 생성하는 데 집중
Gemma Google DeepMind https://ai.google.dev/gemma 2024년 02월 21일 오픈소스 70억 개 - Gemini와 유사하지만 텍스트 입출력에만 집중한 모델
Sora OpenAI https://openai.com/index/sora/ 2024년 02월 15일 API 미공개 - 텍스트 기반 프롬프트로 영상 컨텐츠 생성이 가능한 모델
Gemini 1.5 Google DeepMind https://deepmind.google/technologies/gemini/#gemini-1.5 2024년 02월 02일 API 미공개 - 방대한 리소스와 AI 전문 지식을 활용하여 자연어를 더욱 정밀하게 이해 및 생성하는 데 집중
Stable LM 2 Stability AI https://stability.ai/stable-lm 2024년 01월 19일 오픈소스 16억 개 - 예측 가능한 아웃풋을 만들어 신뢰도를 높이는 데 집중
Mistral 7B Mistral AI https://mistral.ai/news/announcing-mistral-7b/ 2023년 09월 27일 오픈소스 73억 개 - 효율성과 성능 조절에 집중
Falcon 180B Technology Innovation Institute https://falconllm.tii.ae/falcon-180b.html 2023년 09월 06일 오픈소스 1800억 개 - 금융, 의료, 기술 산업 적합성 및 적응성에 집중
XGen-7B Salesforce https://github.com/salesforce/xgen 2023년 07월 03일 오픈소스 70억 개 - 다른 언어 모델 대비 더욱 긴 아웃풋(최대 8K)을 생성하는 데 집중
PaLM 2 Google https://ai.google/discover/palm2/ 2023년 05월 10일 오픈소스 3400억 개 - 머신러닝 전문 기술을 통해 복잡한 언어를 이해하고 생성하는 데 집중
Alpaca 7B Stanford CRFM https://crfm.stanford.edu/2023/03/13/alpaca.html 2023년 03월 13일 오픈소스 70억 개 - 스탠포드대 연구팀이 개발한 언어 모델로, 연구 목적으로만 이용 가능
Pythia EleutherAI https://www.eleuther.ai/papers-blog/pythia-a-suite-for-analyzing-large-language-modelsacross-training-and-scaling 2023년 02월 13일 오픈소스 120억 개 - 비영리 연구단체가 개발했으며 Databricks의 Dolly 2.0과 같은 일부 LLM의 베이스 모델로 활용 중

 

댓글