#헤드라인
[#Let's 스타트업] AI가 만드는 AI 학습데이터 … 방산업계 러브콜
https://n.news.naver.com/mnews/article/009/0005463492
[#Let's 스타트업] AI가 만드는 AI 학습데이터 … 방산업계 러브콜
젠젠에이아이 "인공지능(AI)을 학습시키는 합성 데이터를 AI가 만듭니다." 조호진 젠젠에이아이 대표(사진)는 최근 매일경제와의 인터뷰에서 자사 솔루션에 대해 'AI를 위한 AI'라고 설명하며 이같
n.news.naver.com
#본문
젠젠에이아이

"인공지능(AI)을 학습시키는 합성 데이터를 AI가 만듭니다."
조호진 젠젠에이아이 대표(사진)는 최근 매일경제와의 인터뷰에서 자사 솔루션에 대해 'AI를 위한 AI'라고 설명하며 이같이 말했다. 2022년 설립된 젠젠에이아이는 생성형 AI 기반의 합성 데이터 솔루션 개발 기업으로, 실제 환경에서 수집하기 어려운 데이터를 고품질로 빠르게 생성하는 기술을 보유하고 있다.
AI 학습에 필요한 데이터가 고갈되고 있다는 분석이 나오면서 합성 데이터 분야는 최근 크게 주목받고 있다. 조 대표는 "창업 전 어도비에서 일하며 AI를 개발할 때 데이터가 많이 부족하고 데이터를 모으는 데도 막대한 비용이 든다는 것을 알게 돼 이 문제를 해결하고자 창업했다"고 밝혔다.
젠젠에이아이는 기존에 없던 이미지나 물체를 생성할 뿐만 아니라 고객사 요청 사항에 따라 수집한 데이터의 날씨, 계절, 시간, 카메라 타입 등을 변경해 준다. 자체 보유한 그래픽처리장치(GPU)가 구동하는 AI를 활용해 기업이 원하는 맞춤형 데이터를 빠르게 생성할 수 있다는 설명이다.
조 대표는 "똑같은 장소라도 상황에 따라 형태가 다르기 때문에 이 모든 상황의 데이터로 AI를 학습시켜야 정확도가 올라간다"며 "젠젠에이아이는 사실상 무한대의 데이터를 만들 수 있고, 기업들은 적은 비용으로 AI를 정확하게 학습시킬 수 있다"고 설명했다.
젠젠에이아이의 솔루션은 자율주행·CCTV 등 활용 분야가 매우 다양하지만 현재 가장 힘을 쏟고 있는 분야는 방위 산업이다. 조 대표는 "방산 업계에서 필요한 AI는 학습 데이터 수집이 매우 어렵거나 사실상 불가능하기 때문에 합성 데이터가 꼭 필요하다"며 "현재 한국항공우주산업(KAI), 국방과학연구소 등과 활발하게 협력하고 있다"고 밝혔다.
젠젠에이아이는 KAI가 현재 추진 중인 AI 파일럿의 자동표적 식별 기술 개발 사업에 특수 합성 데이터를 공급할 예정이다. 조 대표는 "특히 북한 관련 데이터는 매우 드물어 AI 파일럿 학습에 어려움이 있는데, 젠젠에이아이가 표적이 격추되거나 폭발하는 등 다양한 상황의 합성 데이터를 생성해 제공한다"고 말했다.
KAI는 젠젠에이아이를 통해 데이터 수집 기간을 최대 90% 단축하고 비용을 50% 이상 절감할 수 있을 것으로 보고 있다. 이를 위해 최근 젠젠에이아이에 투자해 지분 10%를 확보하기도 했다. 조 대표는 "삼팔선 부근 등 방위 산업에서 활용할 수 있는 다양한 합성 데이터를 생산하고 있다"며 "이를 통해 국방 기술의 발전에 보탬이 되고 싶다"고 말했다.
[안선제 기자]
안선제 기자(ahn.sunje@mk.co.kr)
#추가 조사할 내용
[합성 데이터 분야]
합성 데이터 : 실제 사건에서 수집된 것이 아니라 컴퓨터 프로그램을 통해 인위적으로 생성된 데이터
1. 합성 데이터 생성 방법
- 생성적 AI 모델: GPT, GAN, VAE 등의 알고리즘을 사용해 기존 데이터의 패턴을 학습하고 새로운 데이터 생성
- 시뮬레이션: 물리 엔진이나 게임 엔진을 활용해 실제와 유사한 환경을 시뮬레이션하고 데이터 생성
- 통계적 방법: 실제 데이터의 통계적 특성과 분포를 분석해 유사한 특성을 가진 새로운 데이터 생성
2. 합성 데이터의 특징
- 프라이버시 보호: 실제 개인 정보를 포함하지 않아 개인정보 보호 규제를 준수하기 쉬움
- 다양성과 확장성: 거의 무한대에 가까운 시나리오를 생성할 수 있어 AI 모델의 학습 범위를 크게 확장할 수 있음
- 비용 효율성: 실제 데이터 수집과 라벨링에 드는 비용과 시간 절감
- 맞춤형 데이터 생성: 특정 요구사항에 맞는 데이터를 생성할 수 있어 다양한 분야에 적용 가능
3. 합성 데이터의 경쟁력
- 데이터 부족 문제 해결: 민감한 분야나 희귀한 상황의 데이터를 쉽게 생성할 수 있음.
- AI 모델 개발 가속화: 초기 모델 구축부터 실제 데이터로의 전환까지 전체 개발 과정을 빠르게 진행할 수 있음
- 규제 장벽 우회: 개인정보 보호 규제를 준수하면서도 필요한 데이터를 활용할 수 있음
- 극단적 사례 학습: 실제 환경에서 발생하기 어려운 극단적 상황의 데이터도 생성 가능
#적용할 점
[젠젠에이아이]
1. 제품: 실제 환경에서 얻기 어려운 고품질 데이터를 AI를 이용해 합성(인공적으로 생성)하는 솔루션 제공
2. 기술
- 자체 개발한 생성형 AI와 GPU를 활용하여 사용자가 원하는 조건(날씨, 계절, 시간, 카메라 타입 등)에 맞춘 데이터를 빠르게 생성
- 전통적인 데이터 수집 방식보다 최대 90% 짧은 기간과 50% 이상 낮은 비용으로 데이터를 공급
3. 사업 영역: 자율주행이나 CCTV 외에도, 특히 방위산업 분야에 특화되어 활용도가 높음
[현직자 질문]
- 현재 사용하고 있는 생성형 AI 모델의 구조나 알고리즘에 대해 좀 더 구체적으로 설명해 주실 수 있나요?
- 합성 데이터의 품질과 현실성을 어떻게 평가하고 보증하시는지 궁금합니다.
- 실제 데이터와 비교했을 때, 합성 데이터의 한계나 보완점은 무엇이라고 보시나요?
- 최근 발전하는 AI 기술 트렌드에 맞춰 기술 업데이트나 연구개발 방향은 어떻게 설정하고 계신가요?
'경제신문스크랩' 카테고리의 다른 글
오픈AI, 새 이미지AI 출격…"교육 혁명 이끌 것" (0) | 2025.03.28 |
---|---|
복귀 임박한 이해진 "네이버, 의료AI에 진심" (1) | 2025.03.26 |
SKT, 자체 LLM 확 키운다…"전 사업에 에이닷엑스 활용" (0) | 2025.03.26 |
젠슨 황의 새 법칙 …"로봇·PC로 AI 확장, GPU 100배 더 필요" (0) | 2025.03.26 |
"오픈AI·딥시크 필적"… LG, 추론AI 자신감 (1) | 2025.03.26 |