중국발 AI 딥시크(Deep Seek)의 저비용 충격, NVIDIA 주가 폭락
설날 연휴 동안 뜨겁게 쏟아진 AI 관련 뉴스가 있습니다. 바로 중국에서 만들었다는 AI 딥시크, Deep Seek 인데요, 일단은 한국에서의 이렇다할 AI 서비스가 없는 가운데 중국이 미국의 대항마로 급부상하고 있다는 소식에 저는 충격을 좀 먹었습니다.
천조국 형님들이나 가능할 것 같았던, 거대 자본 투입이 필요한 AI 분야에서 뉴스까지 탈 정도로 충격적인 소식이었는데요, 이로 인해 상대적으로 고비용 구조로 지목되고 있는 ChatGPT 등의 미국발 AI 모델들에 대해서 의구심을 가져오면서 주가가 5%까지 눈에 띄게 빠져버렸습니다.
과연 중국발 AI DeepSeek는 어떤 내용일지, 기록으로 정리해두고자 합니다.
딥시크(DeepSeek)는 무엇?
일단 딥시크의 홈페이지는 아래와 같습니다.
로고는 도커(Docker)와 Naver Whale이 겹쳐 떠오르는 고래 모양입니다.
아래 연합뉴스의 기사를 참고하시면, 딥시크를 만든, 량원펑이라는 CEO와 함께 DeepSeek의 개발과정을 설명해주고 있습니다.
보기 좋게 위 기사에서 표를 가져와 보았습니다.
아래는1월 말, 딥스크 소식 이후로의 NVIDIA 주가 폭락 구간입니다.
아래 JTBC 뉴스영상도 참고해보세요.
딥시크(Deep Seek)의 저비용 구조
ChatGPT o1과 비교를 해볼 때, 똑 같은 시험성적을 낼 수 있게 되기 까지, GPT o1에 비해 1/20 정도로 돌리는 비용이 저렴하다고 합니다. 즉, 동일한 수준의 결과를 내는데 ChatGPT로 1만원을 내고 있었다면, Deep Seek는 500원을 내고 해결이 가능해진다는 이야기가 됩니다. 1만원 내고 쓰던 걸, 500원에 가능하다니 일단 솔깃할 수 밖에 없겠습니다.
AI를 학습시크는 비용도 상대적으로 워낙 저렴한 수준입니다. 대량의 GPU 사용을 생략할 수 있어서 약 80억 정도가 들었다고 합니다. 딥시크 뉴스가 터지기 바로 일 주일 전 즈음, 이런 기사가 떴었습니다.
챗GPT 개발사인 오픈 AI와 소프트뱅크 그리고 오라클이 한 데 뭉쳐 새로운 AI 기업은 "스타게이트"를 설립한다는 발표였는데, 투자비용이 5천억 달러, 약 720조 정도 규모입니다.
미국에서는 이렇게 돈뭉치를 모아서 투자를 한다고 하는 시점에서 DeppSeek 이슈가 터졌으니, 돈에 민감함 미국이 술렁이지 않을 수가 없는 상황이 되어버린 것이죠.
딥시크는 어떻게 저비용 구조로 가능했을까?
발표된 내용에 따르면, DeepSeek는 AI에 필수라고 생각되어오던 GPU의 사용을 최소화 하고, 소프트웨어를 통해 당면 이슈를 극복하는 방식으로 접근했다고 합니다. 그리고 이 말이 뻥이 아님을 증명이라도 하듯, 소스코드를 오픈소스로 공개해버렸습니다!
아래는 깃헙에 공해되어 있는 DeepSeek의 R1 모델 소스 코드입니다.
이렇게 오픈 소스로 공개를 했다는 말은, 누구던지 Local PC나 Web에서 공짜로 AI를 돌릴 수 있다는 말이 됩니다. 뭐 이러한 정책적 결정은 Facebook(Meta)의 LLM모델인 LLMA의 기조와 비슷하다고도 볼 수 있겠습니다.
한편, 이렇게 저비용 학습 구조가 가능했던 이유는, DeepSeek 만의 강화학습 과정을 통해 '혼자 생각을 하는' 모델을 만들었다고 합니다. 그리고 정확도를 향상하기 위해서 답변 수준이 부족하면 renection을 하고, DeepSeek를 재학습시키는 과정을 거쳤다고 합니다.(뭔가 복잡하게 들리죠?)
초보자들을 위한 수준에서 글을 정리하다보니, 혹시라도 더 깊은 이해가 필요하신 고수분들께서는 아래 내용을 참고하시면 더욱 좋을 것 같습니다.
DeepSeek과 관련된 FAQ 내용 입니다. 앞에서 다룬 이슈를 좀 더 전문적으로 다루고 있습니다.
우리는 일단, 딥시크(Deep Seek) 사용해보기
일단, 선두주자인 ChatGPT의 영향으로 대부분의 AI 서비스는 채팅 구조로 되어 있습니다. 뭔가 물어보고 답변을 받는다는 직관적인 인터페이스 임에는 틀림없어 보입니다.
이미 ChatGPT를 사용해보셨다면, 여러 가지 질문을 입력해서 테스트를 해보세요.
저는 파이썬으로 1부터 10까지 덧셈을 하는 간단 프로그램 작성을 주문해보았습니다. 욜~
아무튼 요즘은 정말 다양한 AI 서비스들이 쏟아져 나오는 것 같습니다. 당분간 이 녀석도 꾸준히 사용을 해봐야 겠다는 생각이 들더군요.
DeepSeek를 둘러싼 개인정보 보호 이슈
중국발 애플리케이션들에서 사람들이 항상 찜찜하게 생각하는 것이, 백도어 등을 이용한 개인정보 수집과 관련된 내용일 것입니다. 개인정보 이슈가 안 터지는 곳이 없죠. 최근에는 TikTok과 관련해서도 미국은 개인정보 이슈를 빌미로, 틱톡을 금지시키고 퇴출을 시켰던 사례가 있습니다.
아무래도 미국의 입장에서는 경제적 적대국 관계인 중국의 서비스가 미국을 휩쓸면서 사용자들의 정보를 획득할 수 있다는 것이 여간 찜찜하지 않을 것 입니다.
아래는 개인정보 관련한 금일자 이탈리아발 뉴스입니다.
DeepSeek를 둘러싼 정보 사전검열 이슈
한편 딥시크의 경우에는 아무래도 중국 당국의 '검열' 이슈가 클 수 밖에 없으니, 정치적으로 민감한 질문 등은 애매하게 대답을 하도록 사전검열을 한다는 이슈가 함께 떠 오르고 있습니다.
뉴스에서는 천안문 사태에 대해서는 대답을 회피한다고 했는데, 아래는 한국어로 물어봐서 답변을 한 것인지는 잘 모르겠습니다.
그리고, 대만의 자치국 인정 이슈에 대해서도 물어보았습니다.
이 녀석도 그 사이 많이 똑똑해진 것 같습니다. 직접적으로 대답이 아주 능구렁이인데요?
마치며
IT분야에서 오래도록 일을 해오고 있는 입장에서, 하루가 다르게 이런 신기술이 쏟아져 나오는 것에는 큰 흥미를 가지고 있습니다. 정치적, 사회적 이슈를 차치하고 우선은 다양하게 사용을 해보면서 빠르게 신기술의 활용에 올라타는 것도 경쟁력 확보에 도움이 되는 것은 사실이니까요.
DeepSeek 가 아직은 여러 가지 이슈로 시끌벅적인 상태이긴 하지만, 진행상황을 지켜보면서 필요한 부분은 활용을 하는 것이 여러 모로 효율적이지 않을까 하는 생각입니다.
물론 개인정보보호 이슈는 계속 관심을 가지고 살펴봐야할 이슈가 될 수 있을 것입니다.
(그래도 어디선가 10원에 팔리고 있을 저의 휴대폰 번호를 생각하면 눈물이....ㅠ.ㅠ)
오늘도 즐거운 코딩생활, 즐코딩.
KINcoding.
'AI' 카테고리의 다른 글
[IIS] http:// 요청을 https:// 로 Redirection 해주기 - ft. ChatGPT 도움 (1) | 2023.02.15 |
---|---|
ChatGPT3 도움 받아서 갤러리 오버레이 버튼 만들기 (0) | 2023.02.05 |
Chat-GPT를 AI를 이용하여 코딩에 도움 받기 (0) | 2023.02.01 |
[AI] ChatGPT 사용해보기(ft. 코딩 초보자에 도움을?) (0) | 2022.12.19 |
댓글