딥시크 오픈AI 신모델 DeepSeek-V3

728x90
반응형

인공지능 기술 발전이 가속화되면서 오픈소스 AI 모델이 주목되고 있습니다. 그 중 중국 스타트업 DeepSeek가 최근 공개한 DeepSeek-V3는 기존 오픈소스 모델들을 뛰어넘는 성능으로 AI 커뮤니티에서 큰 이슈가 되고 있습니다.

@미리캔버스 이미지

 

DeepSeek-V3 특징

 

  • 거대한 규모 : DeepSeek-V3는 총 671억 개의 매개변수를 가진 대규모 언어모델이며, 이는 Meta의 Liama 3.1모델(406억 매개변수)를 크게 앞선 수치입니다.
  • 효율적인 아키텍처 : Mixture-of-Experts(MoE) 아키텍처를 채택하여 각 작업마다 37억 개의 매개변수만 활성화됩니다. 이에 따라 계산 효율성을 크게 높였습니다.
  • 광범위한 학습 데이터 : 14.8조 개의토큰으로 학습되어, 다양한 분야에서 뛰어난 성능을 보입니다.
  • 오픈소스 : DeepSeek-V3는 Hugging Face에서 자유롭게 사용할 수 있는 오픈소스 모델입니다.

DeepSeek : 중국 AI 스타트업

성능 및 벤치마크

 

DeepSeek-V3는 다양한 벤치마크 테스트에서 뛰어난 성능을 보여주었습니다.

 

  • 텍스트 생성 및 코딩 : Meta의 Liama 3.1과 OpenAI의 GPT-4를 능가하는 성능을 보입니다.
  • 수학 및 중국어 처리 : 특히 수학적 문제 해결과 중국어 처리 분야에서 탁월한 성능을 보여줍니다.
  • 처리 속도 : 초당 60개의 토근을 처리할 수 있어, 이전 버전보다 3배 빠른 속도를 자랑합니다.

 

OpenAI GPT-4와 DeepSeek-V3 비교

특징 OpenAI GPT-4 DeepSeek-V3
오픈 소스 여부 비공개 오픈소스
매개변수 수 비공개 671억
컨텍스트 윈도우 8.192토큰 128,000토큰
입력 비용(백만 토큰 당) $30.00 $0.14
출력 비용(백만 토큰 당) $60.00 $0.28
주요 강점 다중 모달리티 지원 수학,코딩,중국어처리
개발 비용 수억 달러 추정 약 557만 달러

 

 

AI산업에 미치는 영향

 

  • 오픈소스AI의 경쟁력 강화 : DeepSeek-V3의 등장으로 오픈소스 AI모델의 경쟁력이 크게 향상되었습니다.
  • AI 기술의 민주화 : 저렴한 개발 비용(약 557만 달러)으로 고성능 모델을 만들어 AI 기술의 접근성을 높였습니다는 기존 오픈소스 모델들을 뛰어넘는 성능으로 AI 커뮤니티에서 큰 이슈가 되고 있습니다.
  • 산업 전반의 혁신 촉진: 다양한 산업 분야에서 DeepSeek-V3를 활용한 혁신이 기대됩니다.

 

DeepSeek-V3의 등장은 AI 기술의 새로운 지평을 열게 되었습니다. 오픈소스 모델임에도 불구하고 최고 소준의 성능을 보여주며 앞으로의 AI 기술 발전에 크게 기여할 것으로 보고 있습니다 .다만, 고급 기능에도 불구하고 때때로 ChatGPT또는 GPT-4로 잘못 식별하여 논란을 불러오기도 했습니다. 이는 훈련 데이터와 AI 개발 및 윤리에 대한 잠재적 영향에 대한 논란과 의문이 제기되고 있습니다. 앞으로 DeepSeek-V3가 다양한 산업분야에서 어떻게 발전해나갈지 주목할 필요가 있습니다.

 

https://chat.deepseek.com/

 

728x90
반응형
  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유