KlingAI1.6 Renewal 클링으로 영상 만들기

KlingAI – 딥씨크의 도움으로 영상 생성하기

KlingAI에서 딥씨크로 작성한 한글 프롬프트로 영상 생성을 해 보았다.

미확인 물체가 도시 상공에 떠 있고 구름이 빠르게 이동하는 장면을 요청했다. 딥씨크에 내용을 넣고 프롬프트 사용 버튼으로 영상에 적용한 후 Generate 버튼을 눌렀다. 기존 사용 방식보다 속도와 내용에 있어 훨씬 정확하고 편리하다. LLM과 특정 서비스와의 협업은 이제 필수사항이 될 것 같다.

프롬프트를 별도로 학습할 이유도 없어졌다. 이제는 원하는 내용을 딥씨크에게 요구하기만 하면 된다.

프롬프트에는 미스터리한 빛이 있었는데 영상에는 빛은 확인할 수 없었다. 아직까지 디테일한 프롬프트를 영상에 반영하지는 못하는 것 같다.

 

5초 영상 생성

 

그리고 생성된 영상을 익스텐드를 사용해서 연장해 보았다.

 

Extend 적용

연장 영상에서는 도시가 파괴되는 모습을 보여달라고 요청하고, 익스텐드 버튼을 누르자 좌측 메뉴 하단에 시계 아이콘이 켜져서 익스텐드 모드임을 확인시켜줬다. 생성 버튼을 누르자 10분 정도 소요시간이 표시되었다. 일반 5초짜리 영상은 3분 정도 소요되는데 비해 익스텐드 영상은 시간이 훨씬 길게 소요되었다. 생성 영상 프롬프트 하단의 시간에 마우스를 가져가면 현재 5초 연장이 허락된다는 메시지가 보인다.

 

영상이 생성되는데 10분이 필요하다고 표기되고 영상 생성 화면 윗부분에 Extend 글자가 보인다. 5초짜리 기존 영상에 이어 5초를 연장해서 총 10초짜리 영상이 만들어진다.

그리고 ref – video에 마우스를 가져가면 연장에 사용한 원본 영상의 썸네일이 화면에 보인다.    

 

연장 1 – 10초 영상

리뉴얼이 어떻게 되었는지 모르겠지만 프롬프트와 상관없는 영상을 만드는 것으로 보아 모델의 큰 수준에는 별 진전이 없어 보인다.

 

연장 2 – 15초 영상

혹시 영상이 짧아서 프롬프트를 다 만들지 못했을 수도 있을 것 같아 5초를 더 연장해서 15초짜리 영상을 만들어 보았다. 35×3 = 105 Credits 소요. 클링아 잘하자. 지금 무지하게 참고 있다.

 

 

연장 3 – 21초 영상

그래 마지막이다. 돈 낭비 시간 낭비일 것 같지만. 역시 클링은 프롬프트를 잘 이해하지 못한다. 뭐 그렇게 복잡한 프롬프트도 아닌데 말이다. 35×4 = 140 Credits 소요. 자세히 보면 도시의 일부가 무너지고 잔해들이 움직이는 것이 조금 보인다. 억지감동. 아주 극적이지는 않다. 미확인 비행물체 상부도 파괴되어 있다? 더 이상은 무리다. 의미 없다.

지난번 뮤직비디오 제작 때도 말을 듣지 않는 클링으로 2주간 크레딧을 다 사용해 가면서 억지로 영상을 만들었었는데, 이런 방식으로는 짧은 영화제작도 쉽지 않을 것 같다. 사실 이럴 경우 한 가지 방법은 이미지 한 장을 사용하는 것보다 전후 2장의 이미지를 사용하는 게 좀 더 확실한 결과물을 만들 수 있다. 과정이야 어찌 되든 결과적으로 영상의 마지막은 두 번째 이미지가 될 것이다.

Clovax LLM(클로바엑스) 사용 후기

네이버의 클로바엑스 – 한국의 LLM

AI 지우개 사용

이미지를 첨부하자 편집할 영역을 선택하라는 메시지가 나온다.

7번 정도 클릭해서 이미지 좌측의 전봇대와 전선들을 선택했다. 선택하면 사라져야 할 안내말풍선이 사라지지 않아서 일부분은 선택할 수 없었다. 이 부분을 개발자들은 테스트하지 않았나 보다. 선택과 함께 지우기 버튼 클릭.

 

편집을 다시 시도하자 안내 문구가 사라졌다.

 

이미지 편집 중 열심히 답변 중입니다. 하는 메시지가 보인다.

 

세 개의 샘플 이미지가 생성되었다.

 

이미지를 선택하자 깔끔하게 편집된 이미지와 우측 다운로드 버튼이 보인다. 아래 안내 문구에 가려 다 편집되지 못한 전봇대의 잔해도 보인다. 생성된 3개의 이미지는 편집 영역과 내용이 적다 보니 거의 동일한 이미지가 생성되었다.

 

이미지 편집 결과

1456×816, 1.75MB 사이즈의 이미지를 제공했는데 편집 후 1024×573, 0.89MB의 이미지가 생성되었다.

생성 전후의 이미지를 비교하면 해상도가 많이 떨어진 것이 확인된다. 아쉽게도 취미로 이런 것도 되네 하는 용도로 사용하거나 1024 이하의 해상도 편집용으로는 사용이 가능할 것 같다.

추가 기능들은 좀 사용해 보고 후기를 작성하겠습니다. 서비스를 간단히 사용하고 느낀 점은 네이버가 LLM서비스 공개에 진심은 아니구나 하는 느낌이었습니다. 참고로 미드저니의 업스케일 이미지(이미지편집)의 사이즈는 2912×1632, 6.77MB 이다.

ChatGPT , Midjourney, ImageFX 지브리프사 비교

ChatGPT Ghibli 프사

 

ChatGPT 링크다. https://chatgpt.com/

우선 챗지피티에게 지브리 스타일의 프사가 가능하냐고 물었다.

 

Midjourney

미드저니에서 같은 프롬프트로 생성한 이미지.

개인적으로는 미드저니의 스타일이 가장 마음에 든다. 같은 지브리 스타일이지만 파란 하늘과 역동적인 카메라 뷰와 주인공의 자세.

구글의 ImageFX

구글의 ImageFX는 프로프트를 잘 반영하는 특성이 있다. 프롬프트 내용대로 강변을 걷고 있는 소녀의 모습을 생성했다. 같은 지브리 스타일이다.

 

지브리 프사의 인기

지브리 프사의 폭발적 관심의 이유가 뭘까 궁금해진다.

1. OpenAI의 챗GPT-4o 모델이 새로운 이미지 생성 기능을 도입. 이미지 생성 정책이 변경된 것으로 보인다. 기존 무료사용자의 경우 이미지 하나를 생성하고 나면 ChatGPT 사용이 제한되었지만 그 제한이 없어졌다. 

2. 무엇보다 중요한 것은 이미지의 무료사용 신호탄이 터졌다고나 할까. ImageFX로도 상당히 많은 이미지를 무료로 생성할 수 있었지만 사실 잘 알려지지 않은 서비스였다. 이미 사용자가 많은 OpenAI ChatGPT의 경우 무료사용자가 기존에도 이미지를 생성할 수 있었지만 이번 모델의 업그레이드와 무료정책으로 인해 관심이 폭발한 것이 아닌가 생각된다. 미드저니의 경우 초기 이미지 생성형 모델이지만 유료이기 때문에 이미지 생성에 크게 관심이 있지 않은 일반인의 경우 사용이 제한될 수 밖에 없었다.

3. 대화형 이미지 생성. 미드저니의 경우는 프롬프트를 LLM에서 생성해서 이미지를 생성하는 것이 일반적인 사용방법이어서 ChatGPT처럼 대화형으로 이미지생성을 요구할 수는 없었다. 달리 생각해 보면 미드저니의 이미지 생성방법도 결국 LLM과의 협업이 필요하다고 생각된다. KlingAI도 DeepSeek 도입으로 프롬프트 생성이 간편해졌고, 한글 프롬프트도 가능해졌다. 미드저니도 지금 같은 고민을 하고 있을 것 같다.

 

KlingAI – DeepSeek, 한글 프롬프트 사용가능

KlingAI 서비스 개편

인터페이스의 단순화

AI Sound 가능

에셋 관리

KlingAI 1.6익스텐션 기능 추가로 짧은 영상에서 좀 더 긴 영상 생성 가능해짐. 3M.

꽃 피는 효과 추가

딥씨크 덕분에 클링에서 한글 프롬프트 사용이 가능해짐

 

KlingAI(클링AI) + DeepSeek(딥씨크)

클링AI 인터페이스 중 가장 크게 눈에 띄는 부분은 딥씨크 LLM이 생성이미지와 영상의 보조도구로 자리하고 있는 것이다. 영상이나 이미지를 만들기 위해 ChatGPT를 활용하는 경우가 많은데 그걸 인터페이스에 적용한 것이다. 생성형 AI서비스는 대형LLM회사가 결국에는 이미지, 영상, 음원 등을 총체적으로 생성하는 것을 목표로 하기에 협업이 쉽지 않다고 생각한다.

지금은 개별 AI 모델들이 특정 기능에 특화되어 있지만, 시간이 지나면서 점점 멀티모달 AI(텍스트, 이미지, 영상, 음원 등을 종합적으로 이해하고 생성하는 AI)가 발전하면서 경계가 모호해지는 방향으로 가고 있다.

 

 

딥시크로 프롬프트 만들기

클링AI에 딥시크가 있어서 사용하기에는 정말 편하다. 물론 하나의 윈도우 창을 더 열고 LLM에게 프롬프트를 요청해도 결과는 다른지 않겠지만 편리하다. 요청에 의해 만들어진 프롬프트를 사용 버튼만 누르면 직접 적용할 수 있다. 준비된 이미지에 딥시크에게 영상의 프롬프트를 요청해서 바로 적용할 수 있다. 딥시크의 사용은 별도의 크레딧이 필요없이 무료다.

KlingAI 고품질 영상 만드는 과정

1. 고품질의 이미지 생성이 가장 중요하다. 원본의 완성도가 영상 품질의 8할이다.

2. 이미지에 영상 프롬프트 적용.

3. 프롬프트를 수정해가면서 원하는 영상 생성.

 

리뉴얼된 클링AI로 지난번 실패한 영상을 딥씨크와 함께 재도전

클링리뉴얼의 설명대로 지난번 만들다 실패한 에셋을 활용해서 추가 이미지를 첨부하지 않고 실행

두장의 이미지에셋으로 딥씨크에게 영상의 프롬프트를 요청

잠깐 한글이 되는 건가? 딥씨크에게 한글로 물었는데 답변도 한글이고 만들어준 프롬프트는 한글이네, 프롬프트 사용버튼을 눌렀는데 프롬프트도 한글. 딥씨크는 한글을 완벽히 이해하고 있다.

KlingAI의 재발견

딥씨크 프롬프트 사용 가능

한글 사용가능

리뉴얼 전후의 영상비교

영상의 품질은 리뉴얼 되기 전과 거의 동일, 고양이의 걸음이 어색한 부분은 살짝 개선되었지만, 나비는 없고 프롬프트는 반영이 제대로 안됨. 이미지가 픽셀아트 스타일이어서 품질과도 관련이 있을 수 있는 문제다. 다른 이미지를 통해 영상을 더 테스트해 보아야 할 것 같습니다.

아래 영상을 클릭하시면 감상하실 수 있어요.

음원을 악보로 만드는 AI -악보생성, 가사입력 및 악보출력까지

AnthemScore

딥러닝 기술을 활용하여 복잡한 오케스트라 음악도 정확하게 악보로 변환할 수 있는 소프트웨어, ScoreCloud AI프로그램이 있지만 유료버전에서만 음원으로 악보변환이 가능하다.

https://www.lunaverus.com/ 으로 이동 AnthemScore설치

         

 

Download Trial을 누르고 설치

윈도우 경우 다운로드 용량은 20MB남짓하지만 서버에 연결하여 다운설치를 병행하므로 시간이 제법 걸린다.

 

실행하면 좌측에 메뉴아이콘들이 있고 건반과 가운데는 검은색 빈화면이다.

File을 클릭해서 음원화일을 열고 OK버튼을 누름

악보생성 및 편집

음원을 분석한 화려한 화면 위에 악보가 거의 10초만에 생성된다. Trial버전이라 30초 분량만 생성되었다. 아쉬운 것은 가사는 지원하지 않아 MuseScore 등 악보편집 프로그램으로 가사를 입력해야한다. 파일은 MP3, WAV 등 음원파일을 지원하고 특이하게 MP3의 경우 WAV음원보다 1.5배 길이의 악보가 생성되었다. 짧은 음악은 무료 악보만들기가 가능할 듯 하다.

하단의 플레이버튼을 누르고 하부 음표위치의 BAR 들을 조정하면 음원의 편집이 가능하다.

MIDI파일 Export

메뉴의 Export기능을 사용화면 음원을 MIDI파일로 변환할 수 있다. 변환된 미디 파일은 가사입력 프로그램에서 사용한다.

 

MuseScore – 무료 오픈소스, 가사입력 프로그램

https://musescore.org/ko

 

MuseScore Studio 설치

가운데 Download MuseScore Studio without Muse Hub로 악보제작 프로그램만 다운로드, 파일을 실행해서 설치

가사입력

음표 또는 쉼표를 악보에서 누르고 메뉴중 추가(A) – 텍스트(T) – Lyrics를 누르면 가사를 입력할 수 있다.

악보 내보내기

파일 – 내보내기 해상도를 600dpi로 올렸다. 프린터 해상도 600dpi지원은 기본.

PDF 악보 저장

Sample이라 다 입력하지는 않았지만 이런식으로 악보제작이 가능하다.

ChatGPT vs ImageFx vs Midjourney vs Grok3 4컷 만화 비교

요 며칠 ChatGPT-4o가 지브리 스타일 이미지를 서비스를 무료 개시했는데 사용자가 많아 일시 중단했다. 사람들의 관심도가 크고 오픈AI가 이미지 서비스를 집적하니까 그 파급력도 큰 것 같다.

이 시점에 이미지 모델들의 수준을 네 컷 만화 서비스로 테스트 해보려 한다. 네 컷 만화 기사도 인터넷에서 화제가 되었는데, 만화 그리는 수준을 다른 LLM들과 이미지 서비스 전문 업체인 미드저니와 비교해 보았다.

프롬프트는 동일하게 AI발전에 대한 4컷의 만화로 구성하고, 일부러 년대와 내용이 있어 난이도가 살짝 있는 공통의 프롬프트를 선택해서 이해도를 테스트했다.

공통의 프롬프트

“A four-panel comic strip depicting the rapid advancement of AI in a humorous and simple style, featuring a cute, round AI robot and a human character.”

Panel 1 (2010):
A small, round AI robot excitedly identifies a cat in a picture. A human smiles and says, “AI can recognize cat pictures!”

The robot happily responds, “Meow!”  The background is minimal, focusing on the joyful interaction.

Panel 2 (2020):
The same AI robot is now drawing, writing, and composing music.

The human looks impressed and says, “AI can write novels, draw art, and compose music!”

The robot, looking proud and confident, replies, “Art is my passion!”

The scene emphasizes creativity with papers, a laptop, and a sketchbook around the robot.

Panel 3 (2025):
The human looks worried and says, “AI is now doing my job…” .

The AI robot, now more advanced and slightly bigger, confidently types on a laptop, responding, “I’ll handle your meetings and emails!”

The setting is an office environment, showing the robot at work while the human seems unsure.

Panel 4 (2030):
The human, now shocked and panicking, exclaims, “AI is living my life now?!” .

The AI robot, sitting comfortably in an office chair while sipping coffee, sighs and says, “So much work… I need a vacation.”

The humorous contrast highlights the AI’s takeover in a lighthearted way.

OpenAI – ChatGPT – Dalle-E

ChatGPT-Dalle-E 로 그려졌다고 화일명에 표기되었다. 연대 별로 컷을 작성했는데 년도 표기에 오류가 있었지만 내용과 이미지 완성도는 꽤 좋은 편이었다.

 

Google – ImageFx – Imagen3

구글의 Imagen3 로 많은 이미지를 생성했었지만 구글은 프롬프트를 꽤 잘 반영하는 편이다. 텍스트에 이상한 글자들이 간혹 보이는데 이미지 자체는 그런데로 괜찮았다. ChatGpt와 비교하면 미적으로 아름다운 그림은 아니라는 생각이 든다.

 

Midjourney

미드저니의 텍스트는 항상 이상한 글자들을 만들어내어 텍스트를 재 편집해야만 한다. 프롬프트의 내용을 이해한게 맞는지 뭔가 내용이 섞인 듯하다. 그럼에도 만화의 그림체는 미드저니답게 마음에 드는 부분이 있었다.

Grok3

그록3는 4컷에 다 로봇을 등장시켰다. 그림의 내용으로 보아 프롬프트를 반영하려고 노력한 흔적이 보이는데 캐릭터의 모양이 4컷이 달라져 캐릭터 일관성은 약하게 반영되어있다.

전체적으로 ChatGPT의 이미지가 마음에 들었다. 그렇다고 타 회사의 서비스가 품질이 낮다고는 할 수 없다.

이미지 생성 AI도 모델별로 개성적인 부분들이 있는 것 같다. 그러한 개성들이 더 좋은 이미지들을 만들어 내는데 도움이 될 것이라고 생각한다.

 

ChatGPT 4o의 특성

아래는 OpenAI에 소개된 4o의 이미지와 특성들이다. 아래 이미지를 클릭하면 OpenAI 4o의 소개 글을 볼 수 있다. 아래는 홈에 올라온 이미지 중 마음에 드는 이미지를 첨부했다.

디테일한 이미지 생성 가능

이미지 디테일의 정확도가 높아졌다. 세부적인 표현의 정확도.

텍스트 렌더링

기존 사용하던 다른 서비스의 모델들 보다 글자의 정확도가 많이 향상되었다.  아래 이정표의 텍스트는 오류가 거의 없어 보인다. 다중 언어의 표현에는 취약하다고 홈에 안내되어 있다.

프롬프트의 정교한 조정이 가능

캐릭터의 일관성 – 홈의 이미지들을 보면 캐릭터 일관성이 상당히 완성도 있게 표현되어있다.

홈페이지에는 제한 사항들도 안내되어 있는데 긴 이미지가 잘리는 문제가 있다. 저작권 관련 이미지의 제한 문제, 가짜 이미지, 부정확한 도표 문제등이 있다. 또한 다중언어의 글자들, 편집 정확도 문제, 작은 글자의 밀도 문제 등도 언급되어 있다.

위의 특성들과 생성된 이미지를 보면 LLM을 서비스하는 초대형업체들의 모델 확장성으로 인해 이제 특정 분야에 특화된 업체들의 비중이 점점 약해지고 있다. 본인들만의 서비스 색깔이 아니면 살아남기 어려운 시장으로 몇 달 만에 지형이 바뀐 것 같다.

구글 Gemini 2.5 AI 공개 – 추론과 코딩 성능 강화

Gemini 2.5의 특징
추론 능력의 향상

구글 Gemini 2.5은 멀티모달 기능과 고급 추론 및 코딩 능력 그리고 에이전트 기능을 강조하고 있다. 아직 사이트에서 오픈하지는 않았지만 성능과 특징들은 공개되었다.

추론 능력 향상 – 제미나이 2.5는 복잡한 문제 해결 능력과 논리적 추론 능력이 강화되었다. 기존 LLM에서 질문이 조금만 복잡해지면 틀리는 답변을 반복하는 문제를 개선할 것으로 기대된다.

추론 능력의 향상은 고급 수학 문제와 과학적 추론, 논리적 추론을 통한 합리적 판단 등 연구, 교육, 코딩 등에서 다양한 활용이 가능할 전망이다. Gemini 2.5는 인간의 사고 과정과 유사한 방식으로 정보를 처리하고 추론한다고 합니다.

 

다국어 처리 능력의 향상

다국어 처리 능력 향상 – 미묘한 뉘앙스와 문화적 맥락을 더욱 정확하게 이해할 수 있게 되었고, 번역, 요약 및 질의 응답 등에서 더욱 자연스럽고 정확한 결과를 제공하게 되었다.

지난 번 다른 블로그를 통해서 딥엘과 구글의 실시간 번역 기능을 비교했었다. 이렇게 되면 번역 전문 서비스가 과연 필요할 지 고민되는 부분이다. 딥엘과 구글의 커다란 차이점이 뉘앙스와 자연스러움이었는데 이 점이 보완된다면 그 수준이 상당히 기대된다.

한국어의 미묘한 뉘앙스 및 문화적 맥락 이해도도 향상되었다고 한다. 토종 AI 서비스 업체는 모델을 공개도 하지 못하고 사업이 뒤쳐질 수도 있겠다는 생각이 든다.

이를 위해 구글은 다양한 분야의 텍스트 데이터를 학습해서 정확도를 높였다. 또한 한국어 고유한 특성을 반영한 모델을 개발, 언어학자 및 문화 전문가와 협력하여 한국어 모델의 정확성과 자연스러움을 높였다고 한다.

다음 링크는 전문 번역 서비스 딥엘과 구글의 비교 글이다. 궁금하신 분은 참조.

DeepL 생성형 AI – 번역, 딥엘과 구글 비교.

길어진 텍스트 창

처리 능력의 향상으로 150만 단어, 책으로는 아주 두꺼운 장편 소설 몇 권에 해당하는 분량을 처리할 수 있는 능력이다.

 

멀티모달 기능 강화

사용자 작업을 돕는 AI 에이전트로서 기능이 더욱 강화되었다. 예를 들어 개인 비서 역할이나, 문서, 연구보조, 코딩 지원, 콘텐츠 제작, 쇼핑, 건강, 교육 등 다양한 분야의 보조 서비스가 가능할 전망이다.

 

코딩 능력의 향상

비전문가 기준으로 제미나이2.5의 지원을 받아, 웹사이트나 앱의개발, 데이터 분석 및 자동화, 간단한 게임의 개발 및 개인 맞춤형 도구 개발 등에 활용될 수 있을 전망이다. 이제 아이디어만 있으면 누구나 코딩으로 프로그램을 만들 수 있는 시대가 점점 가까이 오고 있는 것을 느낀다.

하지만 기존의 서비스가 그랬듯이 실제로 어느 정도까지 구현이 가능하며 그것이 실현 가능한 지는 서비스가 공개돼야 알 수 있을 것 같다. 아래는 구글 블로그에 올라와 있는 Gemini2.5 코딩으로 만든 간단한 게임사례이다.

 

아래는 구글 Gemini2.5가 반영된 구글 AI 스튜디오다. 다양한 기능들이 있어 한동안 사용해 보고 테스트 결과를 공유하겠습니다.

코난테크놀러지 LLM 공개 임박, 일부 기능 딥씨크 능가

오늘 기사를 보면 코난테크놀러지의 LLM 32B(ENT-11)이 이달 안에 공개예정이라고 밝혔다. 5일 안에 공개하겠다고 했는데, 일부 성능은 딥시크보다 우위라고 자체 성능 평가 결과를 공개했다. 이번 공개 모델은 일반모드와 추론모드를 하나의 엔진에 통합했으며 일부 기능들에서 딥시크보다 4~5%범위에서 상대적인 우위를 지닌다고 밝혔다. 기존의 LLM은 일반모드와 추론모드가 통합되지 않고 개별적으로 동작하므로 효율성이 낮아지게 되는데, 통합 엔진의 효율성에 대한 공식적인 검증들이 확대되면 좋을 것 같다.

 

코난테크놀러지 AI 기술력에 대한 기대

성능의 공개 검증이 필요하겠지만 코난테크놀러지 AI 기술력이 3월 현재 세계 AI 이용자 TOP50의 2위 자리에 있는 딥시크와 견줄만 하다는 것은 국내 AI기업으로서 상당히 고무적인 일이다. 왜냐하면 퓨리오사 사례에서 보았지만 국내의 벤처가 현재 처한 투자 환경은 열악하기 그지없기 때문이다. 기사에서 딥씨크를 언급하는 것 만으로도 기사가 굉장히 자극적이다. 대규모 언어모델인 ChatGPT에 익숙한 우리들에게 딥씨크는 신선한 충격이었지만, 중국의 AI사실로 거부감 또한 상당하기 때문이다.

 

성능 평가내용

통합구조 – 일반모드와 추론모드를 각자 운영하던 방식과는 달리 하나의 엔진에 통합. GPU비용을 줄이면서도 고성능을 유지할 가능성 보여 줌.

한국어 최적화 – 한국어 관련 처리 정확도와 응답 속도가 경쟁 모델들보다 빠르며, 기존에 확장하던 국내 사업에서의 경쟁력 강화에 도움이 될 것으로 예상(국방, 조달시장, 공공기관, 병원, 기업 등) 된다.

효율성의 극대화 – 딥시크의 5%정도 변수만으로 대등한 성능을 도출하기에 극강의 가성비라고 할 수 있다.(매개변수가 320억 개로, 중국 딥시크의 ‘R1’ 모델 6,710억 개에 비해 약 20배 적은 규모)
ENT-11은 이전 모델인 ENT-10보다 일반 모드 성능이 4.5%포인트 향상되었다. 컨텍스트 처리 능력도 최대 16K에서 128K 토큰으로 대폭 확장. 이는 A4 용지 기준 한글 128장, 영어 320장 분량의 정보를 한 번에 처리할 수 있는 수준으로, 긴 문맥을 다루는 작업에서 훨씬 강력해졌음을 보여준다.(그록3 도움)

재무관련 내용

코난테크놀러지 LLM은 2024년 공개 예정이었지만, 그 보다 1년여 늦어진 것 같다. 2024년은 전년도 보다 매출이 줄고 적자가 확대된 한 해였는데, 개발을 위한 지속적인 투자로 인해 수주량 등의 증가에도 불구하고 재무상태가 점점 나빠지고 있다. 2025년 LLM의 공개와 더불어 매출 증대와 LLM 기술력으로 인한 의미있는 성장을 기대해본다.

 

LLM 서비스 공개와 기대점

대외적으로 한국에서 LLM서비스를 공개하는 것은 이번이 처음이다. 과연 성능과 관심이 어느 정도일지 기대된다. 그 동안 ChatGPT, Gemini, Llama, Grok3, Midjourney, ImageFX, SUNO AI 등 AI 서비스를 다양하게 사용한 이용자로써 다른 LLM과의 지적 수준과 어느 수준의 대화가 가능할 지 기대된다.

생성형 AI TOP50 국가별 분포 및 종류(2025.3기준)

출처 : Andreessen Horowitz (a16z)는 Silicon Valley의 주요 벤처 캐피털 회사 홈페이지. 2025.3

세계 50대 생성형 AI 기업 리스트 분(방문객 수 기준: 2025.3)

지난 업체리스트 확인은 링크를 참조 생성형 AI TOP50 국가별 분포 및 종류(2024.8)

Andreessen Horowitz (a16z)는 Silicon Valley의 주요 벤처 캐피털 회사로, 스타트업에 투자하며 기술 혁신을 주도해왔습니다. 이들은 트렌디한 기술 분야, 특히 AI, 블록체인, 클라우드 컴퓨팅 등에 주목하며 유명해졌습니다. 투자한 회사들 중에는 Facebook, Twitter, Airbnb 등이 있으며, 이러한 성과로 벤처 캐피털 업계에서 큰 영향력을 미친 회사입니다. 벤처 캐피털 업체가 AI 회사에 대한 관심도를 지속적으로 조사 연구하는 것은 투자의 지형과 관련이 있을 것이다. 2024.8월에 발표된 50대 AI 기업 리스트에 이어 2025.3월에 발표된 리스트로 7개월 사이에 어떤 급속한 변화들이 있었는지 알아보고자 한다. 

AI 서비스 (국가, 유형) (2024.8) 번호 AI 서비스 (국가, 유형) (2025.3)
1 ChatGPT (미국, 챗봇) 26 DeepAI (미국, 플랫폼)
2 deepseek (중국, 챗봇) 27 Gamma (미국, 프레젠테이션)
3 character.ai (미국, 캐릭터) 28 Leonardo.AI (미국, 이미지)
4 perplexity (미국, 검색) 29 cutout.pro (싱가포르, 이미지)
5 JanitorAI (미국, 애니) 30 BRAINLY (폴란드, 교육)
6 Claude (미국, 챗봇) 31 Photoroom (프랑스, 이미지)
7 QuillBot (미국, 글쓰기) 32 Moescape AI (미국, 애니챗봇)
8 SUNO (미국, 음악) 33 Midjourney (미국, 이미지)
9 SPICYChat (인도, 챗봇) 34 candy.ai (한국, 챗봇)
10 Doubao (중국, 아트웍) 35 zeemo (홍콩, 영상)
11 Kimi (중국, 챗봇) 36 VEED (영국, 영상)
12 Hailuo AI (중국, 영상) 37 invideo AI (인도, 비디오)
13 Hugging Face (미국, 자연어) 38 PIXELCUT (홍콩, 이미지)
14 Poe (미국, 대화형 플랫폼) 39 talkie (중국, 챗봇)
15 Adot (한국, 챗봇) 40 PIXAI (홍콩, 이미지)
16 Eden AI (프랑스, 플랫폼) 41 Monica (캐나다, 챗봇)
17 PolyBuzz (벨기에, 마케팅) 42 CURSOR (미국, 소프트웨어)
18 SeaArt AI (홍콩, 이미지) 43 ideogram (미국, 이미지)
19 liner (일본, 자연어) 44 Chub.ai (미국, 자연어)
20 Kling AI (중국, 동영상) 45 Clipchamp (호주, 영상)
21 CIVITAI (미국, 이미지) 46 Meta AI (미국, 챗봇)
22 11ElevenLabs (미국, 음성) 47 StudyX (중국, 교육)
23 Sora (미국, 영상) 48 bolt (미국, 챗봇자동화)
24 Crushon AI (미국, 데이트) 49 PicWish (홍콩, 이미지)
25 BLACKBOX AI (미국, 코딩) 50 Joyland (미국, 챗봇)

https://a16z.com/100-gen-ai-apps-4/ 홈페이지 참조

생성형 AI 50개 회사의 국적

우선 간단한 조사를 통해 생성형 AI TOP50 국가별 분포 및 종류 중 생성형 50개 회사의 국적을 확인해 보겠다.

미국 / 홍콩 / 영국 / 인도 / 일본 / 호주에서 변동되어 미국 / 중국 / 홍콩 / 인도 / 프랑스 / 한국 순으로 변경되었다. 중화권이 중국7 + 홍콩 5= 12개로 약진했다. 기존에 리스트에 없던 업체들이 새로이 등장하고, 일부는 리스트에서 사라지고 순위가 변동되었다.

AI 갯수 국가 (2024.8) AI 갯수 국가 (2025.3)
30 미국 25 미국
5 홍콩 7 중국
3 영국 5 홍콩
3 인도 3 인도
2 일본 2 프랑스
2 호주 2 한국
1 싱가포르 1 벨기에
1 스웨덴 1 싱가포르
1 중국 1 영국
1 프랑스 1 일본
1 한국 1 캐나다
1 폴란드
50 50

 

생성형 AI 50개 회사의 유형으로 살펴본 AI 지형

이미지 관련 AI / 다음은 챗봇, LLM / 영상 / 음악 / 검색, 글쓰기, 문서 / 리워드, 보안, 코딩

자세히 돌이켜 보면 우리가 현대를 살아가는 방식이 컴퓨팅 파워를 이용해 일의 효율을 늘리는 방향으로 가고 있다. 사람 또는 기기와 대화하며, 영상과 음악을 소비하며, 글과 아름다움을 추구하는 것. 생각보다 과학의 근본적인 궁금증들에 대한 회사는 없었다. 물론 대형 LLM 들이 백그라운드에서 지속적인 개발을 진행할 것이지만, 어떻게 생각해 보면 현재는 가장 접근 가능한 쉬운 것부터 시작한 AI 기술의 초창기 단계가 아닌가 하는 생각이 든다. 그리고 AI 회사의 트렌드를 구분해 본 이유는 정확한 회사의 숫자를 파악하려는 목적보다는 AI 기술이 어느 분야에 집중되고 있는가를 살펴보고 싶었기 때문이다.

2025.3월의 트렌드는 LLM 기능이 강세로 이미지와 순위가 바뀌었다. 이미지, 영상, 음악, 오디오를 통합하여 보면 21개로 여전히 강세인 분야이다. 또한 챗봇 기반 위에 이미지를 생성하는 업체들도 생겨나고 있다. 나머지 분야의 큰 변동은 없었다. 우리가 익히 잘 알고 있는 이미지 생성 AI 미드저니 회사같은 경우는 순위가 뒤로 많이 밀려있다. AI도 지형을 살피지 않고 한 곳의 사용에만 매몰되다 보면 새로운 방식을 놓칠 수 있을 정도로 급속하게 서비스가 변화하고 있다.

 

갯수 서비스 분야 갯수 서비스 분야
17 이미지, 캐릭터, 아트워크, 디자인 17 챗봇, 챗봇자동화, 대화형, 자연어
12 챗봇, 대화형, 자연어 13 이미지, 캐릭터, 아트워크, 디자인
5 비디오, 영상 5 비디오, 영상
4 음악, 오디오 3 음악, 오디오
3 플랫폼 3 플랫폼
2 검색 2 교육
2 글쓰기 2 코딩
2 문서 1 검색
1 리워드 1 글쓰기
1 보안 1 문서
1 코딩 1 마케팅
1 보안
50 50

 

생성형 AI TOP50 국가별 분포 및 종류(2024.8기준)

출처 : Andreessen Horowitz (a16z)는 Silicon Valley의 주요 벤처 캐피털 회사 홈페이지. 2024.8
세계 50대 생성형 AI 기업 리스트 분석(방문객 수 기준: 2024.8)

Andreessen Horowitz (a16z)는 Silicon Valley의 주요 벤처 캐피털 회사로, 스타트업에 투자하며 기술 혁신을 주도해왔습니다. 이들은 트렌디한 기술 분야, 특히 AI, 블록체인, 클라우드 컴퓨팅 등에 주목하며 유명해졌습니다. 투자한 회사들 중에는 Facebook, Twitter, Airbnb 등이 있으며, 이러한 성과로 벤처 캐피털 업계에서 큰 영향력을 미친 회사입니다. 벤처 캐피털 업체가 AI 회사에 대한 관심도를 지속적으로 조사 연구하는 것은 투자의 지형과 관련이 있을 것이다.

번호 AI 서비스 (국가, 유형) 번호 AI 서비스 (국가, 유형)
1 ChatGPT (미국, 챗봇) 26 ideogram (미국, 이미지)
2 character.ai (미국, 캐릭터) 27 you.com (미국, 검색)
3 perplexity (미국, 검색) 28 DeepAI (미국, 플랫폼)
4 Claude (미국, 챗봇) 29 SeaArt AI (홍콩, 이미지)
5 SUNO (미국, 음악) 30 invideo AI (인도, 비디오)
6 JanitorAI (미국, 애니) 31 PIXAI (홍콩, 이미지)
7 QuillBot (미국, 글쓰기) 32 Clipchamp (호주, 영상)
8 Poe (미국, 대화형 플랫폼) 33 udio (영국, 오디오)
9 liner (일본, 자연어) 34 Chatbot App (미국, 챗봇)
10 CIVITAI (미국, 이미지) 35 VocalRemover (홍콩, 음악)
11 SpicyChat (인도, 챗봇) 36 PicWish (홍콩, 이미지)
12 11ElevenLabs (미국, 음성) 37 Chub.ai (미국, 자연어)
13 Hugging Face (미국, 자연어) 38 HIX.AI (미국, 자연어)
14 LUMA AI (미국, 챗봇) 39 Vidnoz (인도, 비디오)
15 candy.ai (한국, 챗봇) 40 PIXELCUT (홍콩, 이미지)
16 Crushon AI (미국, 데이트) 41 MaxAI.me (미국, 플랫폼)
17 Leonardo.AI (미국, 이미지) 42 BLACKBOX.AI (미국, 코딩)
18 Midjourney (미국, 이미지) 43 CHATPDF (미국, PDF)
19 YODAYO (미국, 애니 챗봇) 44 Gauth (미국, 보안)
20 cutout.pro (싱가포르, 이미지) 45 COZE (영국, 이미지)
21 VIGGLE (미국, 리워드) 46 Playground (미국, 플랫폼)
22 Photoroom (프랑스, 이미지) 47 Doubao (중국, 아트웍)
23 Gamma (미국, 프레젠테이션) 48 Speechify (미국, 음악)
24 VEED.IO (영국, 비디오) 49 NightCafe (호주, 디자인)
25 PIXLR (스웨덴, 이미지) 50 AI Novelist (일본, 글쓰기)

https://a16z.com/100-gen-ai-apps-3/ 홈페이지 참조

생성형 AI 50개 회사의 국적

우선 간단한 조사를 통해 생성형 AI TOP50 국가별 분포 및 종류 중 생성형 50개 회사의 국적을 확인해 보겠다.

미국 / 홍콩 / 영국 / 인도 / 일본 / 호주 순이었다.  중국이 1개 회사가 있는데 실제로는 홍콩 회사의 중국 자본 및 통계에 빠진 많은 회사들도 많이 있을 것이다.(텐센트와 같은 대형 회사들은 사실상 AI회사로 변모하고 있다. 보안 이슈와 경제성 문제로 한동안 떠들썩 했던 딥씨크도 있고) 여러가지 이유로 통계에는 빠져있지만 더욱 다양한 AI가 개발 중이며, 첨단 산업에서 그 파워를 늘려가고 있을 것이다. 리스트를 보면 놀라운 것이 우리가 아는 생성형 AI회사보다 모르는 회사가 더 많다는 것이다.

미국 – 30개 회사

홍콩 – 5개 회사

영국 – 3개 회사

인도 – 3개 회사

일본 – 2개 회사

호주 – 2개 회사

싱가포르 – 1개 회사

스웨덴 – 1개 회사

중국 – 1개 회사

프랑스 – 1개 회사

한국 – 1개 회사

생성형 AI 50개 회사의 유형으로 살펴본 AI 지형

이미지관련 AI / 다음은 챗봇, LLM / 영상 / 음악 / 검색, 글쓰기, 문서 / 리워드, 보안, 코딩

자세히 돌이켜 보면 우리가 현대를 살아가는 방식이 컴퓨팅 파워를 이용해 일의 효율을 늘리는 방향으로 가고 있다. 사람 또는 기기와 대화하며, 영상과 음악을 소비하며, 글과 아름다움을 추구하는 것.  생각보다 과학의 근본적인 궁금증들에 대한 회사는 없었다. 물론 대형 LLM 들의 백그라운드에서 지속적인 개발을 진행할 것이지만, 어떻게 생각해보면 가장 접근 가능한 쉬운 것부터 시작한 AI 기술의 초창기가 아닌가 하는 생각이 든다.

이미지, 캐릭터, 아트웍, 디자인  –  16개 회사

챗봇, 대화형, 자연어 – 13개 회사

비디오, 영상 – 5개 회사

음악, 오디오 – 4개 회사

플랫폼-  3개 회사

검색 – 2개 회사

글쓰기 – 2개 회사

문서 – 2개 회사

리워드 – 1개 회사

보안 – 1개 회사

코딩 – 1개 회사

error: Content is protected !!