챗GPT의 출시 및 붐 이후 지난 약 1.5년 동안 참 다양한 대형 언어모델이 세상에 공개되었습니다. 구글과 마이크로소프트, 메타와 같은 IT 공룡들은 물론 기존에 잘 알려지지 않았던 다양한 회사에서 다양한 기능을 수행하는 언어 모델을 하나 둘 공개해 오고 있는데, 그만큼 이 AI산업 자체가 계속해서 성장과 혁신을 거듭하고 있는 모양새입니다.
그럼 현재 기준으로 전세계적으로 잘 알려져 있는 주요한 대형 언어 모델 약 20가지를 함께 살펴보겠습니다.
대형 언어 모델 20가지
언어모델명 | 개발사 | 웹사이트 | 공개일 | 소스 | 파라미터 수 | 특징 |
Grok-2 | X.AI | https://x.ai/blog/grok-2 | 2024년 08월 13일 | 오픈소스 | 미공개 | - 워크플로 및 일정 자동화 기능에 집중 |
Llama 3.1 | Meta AI | https://ai.meta.com/blog/meta-llama-3-1/ | 2024년 06월 23일 | 오픈소스 | 4050억 개 | - 학술 연구와 각종 산업에 적용하여 메타사 비즈니스를 확장시키는 데 집중 |
Claude 3.5 | Anthropic | https://www.anthropic.com/news/claude-3-5-sonnet | 2024년 06월 20일 | API | 미공개 | - 아웃풋의 윤리성과 안전성에 집중 |
Nemotron-4 340B | Nvidia | https://build.nvidia.com/nvidia/nemotron-4-340b-instruct | 2024년 06월 14일 | 오픈소스 | 3400억 개 | - 다른 기업이 신규 LLM을 더욱 효율적으로 만들 수 있도록 지원 |
GPT-4o | OpenAI | https://openai.com/index/hello-gpt-4o/ | 2024년 05월 13일 | API | 미공개 | - 대형 언어 모델 중 가장 유명 - 글의 맥락 이해도가 기존 버전 대비 개선됨 - 다양한 앱에 적용 |
Phi-3 | Microsoft | https://ai.azure.com/explore/models/Phi-3-mini-128k-instruct/version/5/registry/azureml | 2024년 04월 23일 | API 및 오픈소스 | 38억 개 | - 크기로 따지면 소형 언어모델에 속하지만 GPT-3.5와 경쟁 가능 |
Mixtral 8x22B | Mistral AI | https://mistral.ai/technology/#models | 2024년 04월 10일 | 오픈소스 | 1410억 개 | - 모델의 성능 대비 이용비를 낮추는 데 집중 |
Jamba | AI21 Labs | https://www.ai21.com/jamba | 2024년 03월 29일 | 오픈소스 | 520억 개 | - 세계 최초의 프로덕션 등급 언어 모델 |
DBRX | Databricks Mosaic ML | https://github.com/databricks/dbrx | 2024년 03월 27일 | 오픈소스 | 1320억 개 | - 추론 속도와 양을 타사 대비 향상시키는 데 집중 |
Command R | Cohere | https://cohere.com/command | 2024년 03월 11일 | API 및 오픈소스 | 350억 개 | - 대기업 및 중소기업 업무용 기능에 집중 |
Inflection-2.5 | Inflection AI | https://inflection.ai/ | 2024년 03월 10일 | 비공개 | 미공개 | - 복잡한 쿼리를 이해하고 자연스러운 아웃풋을 생성하는 데 집중 |
Gemma | Google DeepMind | https://ai.google.dev/gemma | 2024년 02월 21일 | 오픈소스 | 70억 개 | - Gemini와 유사하지만 텍스트 입출력에만 집중한 모델 |
Sora | OpenAI | https://openai.com/index/sora/ | 2024년 02월 15일 | API | 미공개 | - 텍스트 기반 프롬프트로 영상 컨텐츠 생성이 가능한 모델 |
Gemini 1.5 | Google DeepMind | https://deepmind.google/technologies/gemini/#gemini-1.5 | 2024년 02월 02일 | API | 미공개 | - 방대한 리소스와 AI 전문 지식을 활용하여 자연어를 더욱 정밀하게 이해 및 생성하는 데 집중 |
Stable LM 2 | Stability AI | https://stability.ai/stable-lm | 2024년 01월 19일 | 오픈소스 | 16억 개 | - 예측 가능한 아웃풋을 만들어 신뢰도를 높이는 데 집중 |
Mistral 7B | Mistral AI | https://mistral.ai/news/announcing-mistral-7b/ | 2023년 09월 27일 | 오픈소스 | 73억 개 | - 효율성과 성능 조절에 집중 |
Falcon 180B | Technology Innovation Institute | https://falconllm.tii.ae/falcon-180b.html | 2023년 09월 06일 | 오픈소스 | 1800억 개 | - 금융, 의료, 기술 산업 적합성 및 적응성에 집중 |
XGen-7B | Salesforce | https://github.com/salesforce/xgen | 2023년 07월 03일 | 오픈소스 | 70억 개 | - 다른 언어 모델 대비 더욱 긴 아웃풋(최대 8K)을 생성하는 데 집중 |
PaLM 2 | https://ai.google/discover/palm2/ | 2023년 05월 10일 | 오픈소스 | 3400억 개 | - 머신러닝 전문 기술을 통해 복잡한 언어를 이해하고 생성하는 데 집중 | |
Alpaca 7B | Stanford CRFM | https://crfm.stanford.edu/2023/03/13/alpaca.html | 2023년 03월 13일 | 오픈소스 | 70억 개 | - 스탠포드대 연구팀이 개발한 언어 모델로, 연구 목적으로만 이용 가능 |
Pythia | EleutherAI | https://www.eleuther.ai/papers-blog/pythia-a-suite-for-analyzing-large-language-modelsacross-training-and-scaling | 2023년 02월 13일 | 오픈소스 | 120억 개 | - 비영리 연구단체가 개발했으며 Databricks의 Dolly 2.0과 같은 일부 LLM의 베이스 모델로 활용 중 |
'AI' 카테고리의 다른 글
GPT-4 Turbo를 무료로 이용할 수 있는 뤼튼 사용법 (0) | 2023.12.13 |
---|---|
애플 Siri, 생성형 AI 기술 애플GPT로 업그레이드 예정 (1) | 2023.11.30 |
애플의 시리가 시리라는 이름을 가진 이유 (Apple Siri 뜻) (0) | 2023.11.30 |
트위터 프로필 라벨, 파란색 금색 회색 실버 마크, 배지, 라벨 자세히 알아보기 (0) | 2023.08.16 |
Dall-E 'You are out of credits' 메시지? DALL·E 2의 크레딧 차감 방식 (0) | 2023.07.10 |
댓글