이번엔 바이두…딥시크 반값 '어니 X1' AI 모델 내놨다

#헤드라인

https://n.news.naver.com/mnews/article/011/0004462300

이번엔 바이두…딥시크 반값 '어니 X1' AI 모델 내놨다

‘중국의 네이버’로 불리는 바이두가 새로운 추론형 인공지능(AI)을 딥시크의 절반 가격에 내놓았다. 딥시크가 촉발한 AI 사용료 ‘가성비 전쟁’이 치열해지면서 미국 거대 기술 기업인 빅테

n.news.naver.com

딥시크가 포문 연 사용료 인하에

美빅테크도 미니 모델 속속 내놔

클라우드 없는 오픈AI 고심 커져

#본문

‘중국의 네이버’로 불리는 바이두가 새로운 추론형 인공지능(AI)을 딥시크의 절반 가격에 내놓았다.딥시크가 촉발한 AI 사용료 ‘가성비 전쟁’이 치열해지면서 미국 거대 기술 기업인 빅테크들의 고민도 깊어지는 양상이다.

16일(현지 시간) 미국 정보기술(IT) 전문 매체 테크크런치에 따르면 중국 바이두는 전날 신형 AI ‘어니(Ernie) 4.5’와 ‘어니 X1’을 공개했다. 이 중 어니 X1은 바이두가 선보인 첫 추론형 AI 모델이다. 바이두는 “어니 X1은 딥시크 추론 모델인 R1과 동등한 성능인 반면 가격은 절반”이라고 강조했다.

바이두가 언급한 가격은 AI를 종량제로 사용하는 기업용 애플리케이션프로그래밍인터페이스(API) 사용료를 뜻한다. 일반적으로 API 사용료는 100만 토큰(AI 연산단위)당 값으로 책정된다. 어니 X1은 100만 토큰당 데이터 입·출력가가 각각 0.28달러, 1.1달러다. 현재 딥시크 R1 기본 가격은 각각 0.55달러, 2.19달러다. 바이두가 중국 대표 플랫폼이라는 우위를 등에 업고 가격 경쟁력까지 내세운 셈이다.

‘AI 덤핑 전쟁’의 포문은 딥시크가 열었다. 딥시크는 지난해 일반 모델 ‘V2’를 출시하며 100만 토큰당 입·출력가를 각각 0.14달러, 0.28달러로 책정했다. 2023년 말 등장한 오픈AI ‘GPT-4 터보’가 각각 10달러, 30달러를 받았고 오픈AI 첫 추론 모델인 ‘o1’이 각각 15달러, 60달러를 청구했다는 점을 감안하면 비교하기 어려울 정도로 저렴하다. 이 밖에 알리바바·텐센트·바이트댄스·모니카 등 주요 기술 기업들이 앞다퉈 진화된 AI 모델을 속속 내놓으며 패권 경쟁에 뛰어들고 있다.

챗GPT가 기사 내용을 바탕으로 생성한 이미지

일각에서는 지난해부터 미국 빅테크들이 잇따라 가볍고 저렴한 ‘미니’ 모델을 내놓은 배경에는 딥시크가 촉발한 사용료 인하 열풍이 자리하고 있다는 분석이 나온다. 실제 오픈AI가 지난해 7월 선보인 ‘GPT-4o 미니’는 API 입·출력가가 각각 0.15달러, 0.6달러로 여전히 중국산 AI보다는 높지만 GPT-4 터보보다 크게 낮아졌다. 현재 주력 추론 모델인 ‘o3 미니’ 또한 각각 1.1달러, 4.4달러로 o1 대비 저렴하다.

구글은 제미나이 플래시를 한층 더 경량화한 ‘제미나이 2.0 플래시-라이트’를 내놓기도 했다. 100만 토큰당 입·출력료가 각각 0.075달러, 0.3달러에 불과해 입력만 놓고 보면 딥시크 ‘V3’ 절반 수준이다. 구글의 행보는 클라우드라는 든든한 ‘뒷배’가 있기에 가능하다는 평가다. 테크계 관계자는 “구글은 클라우드 ‘임대료’를 받으면 되지만 오픈AI는 자체 클라우드가 없어 마진을 낮추는 데 한계가 있다”고 진단했다.

오픈AI는 프리미엄 전략을 내세우고 있다. 최신 기능을 제한 없이 사용할 수 있는 ‘챗GPT 프로’를 월 200달러에 내놓은 데 이어 현재 개발 중인 박사급 AI 에이전트는 월 2만 달러에 판매하는 방안을 검토하는 것으로 알려졌다. 테크계 관계자는 “오픈AI가 일본 소프트뱅크와 추진 중인 ‘스타게이트’ 데이터센터 프로젝트도 자체 클라우드 확보로 장기적인 마진 인하 경쟁에서 살아남기 위한 행보”라고 짚었다.

실리콘밸리=윤민혁 특파원(beherenow@sedaily.com)

#추가 조사할 내용

[클라우드]

컴퓨팅 리소스(서버, 스토리지, 데이터베이스, 네트워킹, 소프트웨어, 분석 및 인텔리전스)를 인터넷을 통해 서비스로 제공하는 주문형 서비스. 사용자가 물리적 리소스를 직접 관리할 필요 없이 사용한 만큼만 비용을 지불함. 대규모 데이터를 신속하게 처리하고 분석할 수 있는 환경을 제공하며, 필요에 따라 AI 리소스를 쉽게 확장하거나 축소할 수 있는 유연성을 제공하기 때문에 AI 기술 경쟁에서 클라우드의 중요성이 있다고 여겨짐.

특징

주문형 서비스: 필요에 따라 컴퓨팅 자원을 직접 프로비저닝하고 배포할 수 있어 IT 관리자의 개입 없이 자율적인 리소스 관리 가능
광범위한 네트워크 액세스: 웹을 통해 접근할 수 있어 PC, 랩톱, 스마트폰 등 다양한 장치에서 서비스 이용 가능, 글로벌 운영 및 원격 근무 지원에 적합
리소스 풀링: 컴퓨팅 리소스(CPU, 메모리, 스토리지 등)를 함께 풀링하여 사용함으로써 리소스 활용도 극대화, 개별 구성 요소 장애에 대한 복원력 증대
유지 관리 간소화: 물리적 인프라 유지 관리에 대한 부담을 줄이고 소프트웨어 형태로 관리가 가능하여 관리 작업을 간소화, 어디서든 관리 인터페이스에 접근 가능
확장성과 빠른 탄력성: 클라우드 기반 가상 서버 인스턴스의 프로비저닝 및 배포가 빠르고 쉬우며 필요에 따라 인프라를 신속하게 확장하거나 축소할 수 있어 계절적 수요나 빠르게 성장하는 비즈니스에 적합

클라우드 컴퓨팅 서비스 모델 종류

IaaS (Infrastructure as a Service): 서버, 스토리지, 네트워크 등 IT 인프라에 대한 주문형 액세스를 제공하며, IT 리소스에 대한 높은 수준의 제어를 제공
PaaS (Platform as a Service): 클라우드 애플리케이션 개발에 필요한 모든 하드웨어 및 소프트웨어 리소스를 제공하여, 기업이 기본 인프라 관리 부담 없이 애플리케이션 개발에 집중
SaaS (Software as a Service): 인프라, 유지보수, 소프트웨어 업데이트를 포함한 전체 애플리케이션 스택을 서비스로 제공하여, 사용자가 인터넷을 통해 소프트웨어에 접속하고 사용 가능

AI 기술 경쟁에서 바라보는 클라우드의 경쟁력

데이터 처리 및 분석: 기업이 수집하고 보유한 대용량 데이터를 신속하게 처리하고 분석할 수 있는 환경 제공
리소스 확장성: 필요에 따라 AI 리소스를 쉽게 확장하거나 축소할 수 있는 유연성을 제공하여 AI 모델 학습 및 배포에 필요한 컴퓨팅 자원을 효율적으로 관리
비용 효율성: 하드웨어 및 소프트웨어에 대한 대규모 초기 투자 없이 고급 AI 클라우드 서비스에 접근할 수 있도록 하여 비용 절감
배포 속도: 애플리케이션의 빠른 배포가 가능해 제품 출시 기간 단축, 기업이 시장 경쟁에서 우위를 확보할 수 있도록 지원

#적용할 점

[딥시크]
1. 제품/기술
- 일반 모델 ‘V2’: 100만 토큰당 입출력 가격이 각각 0.14달러, 0.28달러로 매우 저렴한 가격 제시
- 추론 모델 ‘R1’: 다른 기업과 성능 비교의 기준이 되는 모델
2. 사업 특징
- 저렴한 가격 정책을 내세워 “가성비 전쟁”을 촉발, 경쟁사의 가격 인하 압박 유발
- 예시: 마치 “가성비 최고의 스마트폰”처럼, 기본 기능은 충실하면서도 가격이 매우 저렴하여 많은 기업들이 관심을 갖게 만드는 전략

[바이두]
1. 제품/기술
- 신형 AI ‘어니 4.5’와 첫 추론형 AI 모델 ‘어니 X1’ 출시
- 어니 X1은 딥시크의 R1과 비슷한 성능이지만 가격은 절반 수준으로 책정
2. 사업 특징
- “중국의 네이버”라는 브랜드 파워와 함께 가격 경쟁력을 강조하여 시장 점유율 확대 노림
- 예시: 동일한 성능의 제품을 더 저렴하게 제공하는 할인마트와 비슷한 전략

[오픈AI]
1. 제품/기술
- 고급 AI 모델 ‘GPT-4 터보’, ‘o1’, ‘o3 미니’ 등 다양한 모델 보유
- 프리미엄 전략: 챗GPT 프로(월 200달러)와 박사급 AI 에이전트(월 2만 달러) 등 고가 상품도 함께 운영

2. 사업 특징
- 자체 클라우드 인프라가 없어 외부 클라우드 서비스에 의존, 이로 인해 마진 압박 문제 발생
- 장기적으로는 데이터센터 확보(예: 일본 소프트뱅크와의 ‘스타게이트’ 프로젝트)를 추진 중
예시: 고급 기능을 탑재한 프리미엄 스마트폰처럼, 일반 모델보다 가격이 높지만 차별화된 서비스를 제공

[구글]
1. 제품/기술
- ‘제미나이 2.0 플래시-라이트’: 경량화된 AI 모델로 100만 토큰당 입출력 가격이 각각 0.075달러, 0.3달러로 매우 저렴
2. 사업 특징
- 강력한 클라우드 인프라를 바탕으로 가격 경쟁력 확보
- 클라우드 서비스를 통한 마진 보완 가능
예시: 대규모 서버와 클라우드 자원을 활용하는 기업이 대량 생산으로 원가를 낮추는 방식과 유사

[현직자 질문]
- 현재 프로젝트에서 AI API와 프론트엔드 간 통신을 구현할 때 사용하는 라이브러리나 프레임워크는 무엇인가요? 특히 대량의 토큰 데이터를 효율적으로 처리하기 위한 전략(예: 캐싱, 실시간 스트리밍 처리 등)은 무엇인가요? REST API 호출 시 데이터 양이 많아져 페이지 로딩 시간이 길어지는 문제를 어떻게 해결하는지 궁금합니다.
- AI 모델이 자주 업데이트되거나 가격 변동 등 중요한 정보가 변경될 때, 사용자 경험(UX)과 인터페이스(UI)를 어떻게 최적화하고 유지보수하는지, 프론트엔드 측면에서 어떤 전략이나 도구를 사용하고 있는지 궁금합니다.
- 클라우드 기반의 AI 서비스를 운영하면서 백엔드 팀과의 협업 시, 프론트엔드 개발자로서 주로 고려해야 하는 기술적/운영적 이슈(예: API 응답 시간, 장애 대응 등)는 무엇이며, 이를 해결하기 위해 어떤 도구나 프로세스를 사용하고 있는지 설명해 주실 수 있나요? API 응답 지연이나 오류 발생 시 프론트엔드에서 사용자에게 어떻게 대응하고 있는지 궁금합니다.

'경제신문스크랩' 카테고리의 다른 글

젠슨 황의 새 법칙 …"로봇·PC로 AI 확장, GPU 100배 더 필요" (0)	2025.03.26
"오픈AI·딥시크 필적"… LG, 추론AI 자신감 (1)	2025.03.26
"혈당 높으니 산책하세요" 시니어 돌보는 AI (0)	2025.03.19
농구 본 적 없는 구글 로봇, '덩크슛' 성공 (2)	2025.03.16
AI의 잘못된 정보, AI로 바로잡는다 (0)	2025.03.16

#헤드라인

#본문

#추가 조사할 내용

#적용할 점

'경제신문스크랩' 카테고리의 다른 글

티스토리툴바