1. What is Deci.AI
Deci : the deep learning acceleration platform for developers to build, optimize, and deploy ultra-fast models on any hardware
Deci enables deep learning to live up to its tru potential by using AI to build better AI. With the company's end-to-end deep learning acceleration platform, AI developers can build, optimize, and deploy faster and more accurate models for any environment, including cloud, edge, or mobile.
With Deci's platform, developers can increase deep learning model inference performance by 3x-15x, on any hardware, while still preserving accuracy. This translates deirectly into new use cases on limited hardware, substantially shorter development cycles, and reduced compute costs by up to 80%
The platform is powered by Deci's Automated Nueral Architecture Construction (AutoNAC) technology, an algorithmic optimization engine that squeezes maximum utilization out of any hardware. The AutoNAC engine contains a Neural Architecture Search (NAS) component that redesigns a given trained model's architecture to optimally improve its inference performance (throughput, latency, memory, etc.) for specific target hardware while preserving its baseline accuracy.
Deci achieved a record-breaking 11.8x accelerate inference speedup on Intel CPUs at MLPerf Industry Benchmark and has been naemd to the CBInsights top 100 AI companies. Led by a team of world-class deep learning experts, Deci lets AI developers focus on what they do best - creating innovaitve AI-based solutions for our world's most complex problems.
2. Why Deci.AI is important?
디 인포메이션은 24일(현지시간) 엔비디아가 이스라엘 AI 스타트업 런콜론ai(Run:ai) 및 데시(Deci)와 두건의 인수 계약을 체결했다고 보도했다.
이에 따르면 150여명의 직원을 보유한 런콜론ai는 엔비디아로부터 7억달러(약 9700억원)에 인수됐다. 이에 앞서 이 회사는 인사이트 파트너스 및 타이거 글로벌 매니지먼트를 포함한 투자자로부터 1억1800만달러(약 1600억원)의 자금을 조달한 바 있다.
반면 데시의 인수 가격은 알려지지 않았다. 데시는 인사이트 파트너스 및 스퀘어 패그 캐피털과 같은 투자자로부터 5500만달러(약 760억원)를 모금했으며, 약 100명의 직원을 보유하고 있다.
두 스타트업은 모두 생성 AI 모델 개발이나 실행 비용을 낮추는 것을 목표로 하고 있다. AI 모델을 구동하는 GPU 칩에 대한 수요를 유지하려는 엔비디아의 노력과도 부합한다.
우선 런콜론ai는 개발자가 여러 AI 워크로드를 순차적이 아닌 병렬로 실행할 수 있도록 만들어, AI 칩을 효율적으로 만든다. 이는 결과적으로 필요한 GPU의 수를 줄이는 데 도움이 된다.
GPU나 다른 AI 가속기에서 실행되는 AI 워크로드에 맞춰 필요한 컴퓨팅 용량을 자동으로 할당, GPU 자원을 효과적으로 공유할 수 있도록 지원하는 쿠버네티스 기반 컨테이너 플랫폼을 개발한다.
특히 GPU 클러스터 리소스를 여러 AI 워크로드에 공유하기 위해 AI '가상화 인프라'를 구축한다는 것이 특징이다. 이를 활용하면 컴퓨팅에 가상 계층을 구축, 적은 리소스를 쓰면서 빠르게 GPU에서 AI 모델을 학습할 수 있다.
데시는 AI 칩에서 더 저렴하게 실행될 수 있도록 AI 모델을 압축하고, 엔비디아의 쿠다(Cuda) 소프트웨어로 개발된 AI 앱을 강화한다.
엔비디아가 지난해 인수한 또 다른 스타트업인 옴니ML(OmniML)의 접근 방식과 유사하다. 정확도를 잃지 않으면서 신경망의 크기를 줄이는 압축 기술을 사용해 AI 모델을 최적화하는 식이다.
이를 통해 엔비디아는 쿠다 소프트웨어와 함께 데시와 옴니ML의 기술을 제공, 개발자가 AI 기반 앱을 더 저렴하게 구축할 수 있도록 지원한다는 계획이다.
