오늘 기사를 보면 코난테크놀러지의 LLM 32B(ENT-11)이 이달 안에 공개예정이라고 밝혔다. 5일 안에 공개하겠다고 했는데, 일부 성능은 딥시크보다 우위라고 자체 성능 평가 결과를 공개했다. 이번 공개 모델은 일반모드와 추론모드를 하나의 엔진에 통합했으며 일부 기능들에서 딥시크보다 4~5%범위에서 상대적인 우위를 지닌다고 밝혔다. 기존의 LLM은 일반모드와 추론모드가 통합되지 않고 개별적으로 동작하므로 효율성이 낮아지게 되는데, 통합 엔진의 효율성에 대한 공식적인 검증들이 확대되면 좋을 것 같다.
코난테크놀러지 AI 기술력에 대한 기대
성능의 공개 검증이 필요하겠지만 코난테크놀러지 AI 기술력이 3월 현재 세계 AI 이용자 TOP50의 2위 자리에 있는 딥시크와 견줄만 하다는 것은 국내 AI기업으로서 상당히 고무적인 일이다. 왜냐하면 퓨리오사 사례에서 보았지만 국내의 벤처가 현재 처한 투자 환경은 열악하기 그지없기 때문이다. 기사에서 딥씨크를 언급하는 것 만으로도 기사가 굉장히 자극적이다. 대규모 언어모델인 ChatGPT에 익숙한 우리들에게 딥씨크는 신선한 충격이었지만, 중국의 AI사실로 거부감 또한 상당하기 때문이다.
성능 평가내용
통합구조 – 일반모드와 추론모드를 각자 운영하던 방식과는 달리 하나의 엔진에 통합. GPU비용을 줄이면서도 고성능을 유지할 가능성 보여 줌.
한국어 최적화 – 한국어 관련 처리 정확도와 응답 속도가 경쟁 모델들보다 빠르며, 기존에 확장하던 국내 사업에서의 경쟁력 강화에 도움이 될 것으로 예상(국방, 조달시장, 공공기관, 병원, 기업 등) 된다.
효율성의 극대화 – 딥시크의 5%정도 변수만으로 대등한 성능을 도출하기에 극강의 가성비라고 할 수 있다.(매개변수가 320억 개로, 중국 딥시크의 ‘R1’ 모델 6,710억 개에 비해 약 20배 적은 규모)
ENT-11은 이전 모델인 ENT-10보다 일반 모드 성능이 4.5%포인트 향상되었다. 컨텍스트 처리 능력도 최대 16K에서 128K 토큰으로 대폭 확장. 이는 A4 용지 기준 한글 128장, 영어 320장 분량의 정보를 한 번에 처리할 수 있는 수준으로, 긴 문맥을 다루는 작업에서 훨씬 강력해졌음을 보여준다.(그록3 도움)
재무관련 내용
코난테크놀러지 LLM은 2024년 공개 예정이었지만, 그 보다 1년여 늦어진 것 같다. 2024년은 전년도 보다 매출이 줄고 적자가 확대된 한 해였는데, 개발을 위한 지속적인 투자로 인해 수주량 등의 증가에도 불구하고 재무상태가 점점 나빠지고 있다. 2025년 LLM의 공개와 더불어 매출 증대와 LLM 기술력으로 인한 의미있는 성장을 기대해본다.
LLM 서비스 공개와 기대점
대외적으로 한국에서 LLM서비스를 공개하는 것은 이번이 처음이다. 과연 성능과 관심이 어느 정도일지 기대된다. 그 동안 ChatGPT, Gemini, Llama, Grok3, Midjourney, ImageFX, SUNO AI 등 AI 서비스를 다양하게 사용한 이용자로써 다른 LLM과의 지적 수준과 어느 수준의 대화가 가능할 지 기대된다.