본문 바로가기
AI

AI 그림, 사람 손가락 못 그리는 이유

by -Joy- 2023. 4. 15.

Midjourney와 빙 이미지 크리에이터 등 그림을 그려주는 AI 그림 사이트를 써보면 퀄리티가 꽤 괜찮은데 사람의 손가락만큼은 잘 못그리는 것 같습니다. 한 손에 손가락이 스무개씩 달리기도 하고 허공에 떠있는 다른 손과 깍지를 끼고 있기도 합니다. 손이 뭔지 모르는 건가 싶기도 한데, 왜 그런걸까요?

 

 

면접 합격자가 HR 담당자와 악수를 하는 모습을 그려달라고 한 프롬프트에 대한 빙 이미지 크리에이터의 출력물, 손이 조금 이상함 (출처: 빙 이미지 크리에이터, 2023.04.11)
면접 합격자가 HR 담당자와 악수를 하는 모습을 그려달라고 했습니다 (출처: 빙 이미지 크리에이터, 2023.04.11)

 

손은 굉장히 복잡하게 생겼습니다

먼저 그들에게 직접 물어보았습니다. 인공지능은 왜 사람 손 그리기를 어려워하나요?

인공지능은 왜 사람 손 그리기를 어려워하는지 챗GPT에게 직접 물어보았습니다.
인공지능이 사람의 손가락을 그리는 것이 어려운 이유는 손가락이 매우 복잡한 형태와 질감을 가지고 있기 때문입니다. 피부, 손톱 및 주름과 같은 빛의 상호 작용의 미묘한 부분을 포착하려면 고급 모델링 및 렌더링 기술이 필요합니다 1.

그러나 이는 인공지능이 이미 사람의 얼굴을 정확하게 렌더링하는 데 능숙하다는 사실과 모순됩니다. 얼굴은 손보다 더 복잡한 구조일 것입니다. 그러나 인공지능은 심지어 손가락의 수조차 정확하게 얻지 못합니다 2.

얼굴은 모델링하기가 상대적으로 더 쉽습니다. 왜냐하면 움직이는 부분이 적고 표면 질감이 더 균일하기 때문입니다 2. 인간의 뇌도 얼굴 표정과 특징에 매우 익숙하여 인공지능 연구자들에게 중요한 과제가 되었습니다.

따라서 인공지능이 사람의 손가락을 그리는 것이 어려운 이유는 손가락의 복잡한 형태와 질감 때문입니다.
인공지능이 손가락을 그리는 것을 어려워하는 이유는 컴퓨터 비전의 한계 때문입니다. 손가락을 그리는 것은 복잡한 모양과 움직임을 가지고 있기 때문에 이를 이해하고 인식하는 것은 컴퓨터 비전이 아직까지 어려운 문제 중 하나입니다. 또한, 손가락을 그리는 행위는 다양한 각도와 빛의 조건에서 이루어질 수 있기 때문에 이러한 다양한 상황을 고려해야 하기 때문입니다. 그러나 최근에는 딥러닝과 같은 인공지능 기술의 발전으로 컴퓨터 비전 분야에서도 높은 정확도를 가진 인공지능 모델이 개발되고 있어, 손가락 그리기와 같은 복잡한 도형 인식도 점차 가능해지고 있습니다.
인공지능이 사람의 손가락을 그리는 것을 어려워하는 이유는 인공지능이 사람처럼 직관적으로 그림을 그리는 것이 아니라, 데이터를 기반으로 패턴을 학습하기 때문입니다. 인공지능은 사람의 손가락을 그리는 것을 이해하기 위해서는 많은 데이터와 학습이 필요합니다. 또한, 사람의 손가락을 그리는 것은 매우 복잡한 동작이기 때문에, 인공지능이 이를 학습하는 것이 어려울 수 있습니다. 인공지능은 인간의 능력을 모방하려는 기술이지만, 아직은 인간의 능력을 완전히 대체할 수는 없기 때문에 이러한 한계가 존재합니다

여러 인공지능 분들의 자문을 구해본 결과를 정리해 보면 아래와 같습니다.

  • 손이라는 신체 기관은 실제로 구조가 복잡합니다. 형태와 피부 질감도 복잡한데다 손가락의 길이와 너비도 저마다 제각각입니다. 거기에 중수골과 손목 관절의 움직임까지 고려해야 하는데 이 모든 것이 완벽하게 조화되게 그리는 것은 실로 어려운 일입니다.
  • AI가 쉽게 인식하고 그려낼 수 있는 손 모양의 '표준'이라는 것이 존재하지 않습니다. 사람 얼굴의 경우 대체로 두 눈과 코 하나와 입 하나의 위치가 어느 정도 표준 편차 안에서 움직입니다. 사람의 머리에는 관절이 따로 있는 것도 아니라서 눈과 입의 움직임을 빼고는 딱히 움직이는 부위도 없습니다. 그에 반해 손이라는 기관은 사람이 어떤 제스처를 취하는지, 바디 랭귀지로 어떤 표현을 하는지, 손가락으로 어떤 숫자를 표현하는지, 손이 어느 사물의 위에 위치해있는지 등에 따라 자세가 아예 달라집니다. 손의 형태, 움직임, 손목이 접힌 각도, 접힌 손가락 개수, 접혀있거나 펴져있는 각 손가락의 각도 등이 계속 달라지는 것입니다.
  • 손톱이나 손가락 관절, 피부 주름, 손금 등은 각도와 조명, 빛의 방향 등에 따라 그림자도 다르게 집니다. 인공지능이 그림을 그릴 때 이러한 미묘한 부분을 포착하고 표현하지 않으면 사람의 눈에는 그저 어색하고 이상하게 보이게 되는 것입니다.

 

빙 이미지 크리에이터 사용법 글 바로가기 버튼

 

 

손은 사람이 그리기에도 어렵습니다

손을 그리는 것은 실제로 사람이 하기에도 어려운 일이지 않을까 합니다. 인공지능이 손 그리기를 어려워하는 이유와는 다른 이유겠지만 일단 손을 그리는 데에는 손이 많이 갑니다. 손은 여러 개의 손가락이 달려있고 각 손가락은 여러 마디로 나뉘어져 있습니다. 손은 또한 수많은 근육과 인대, 힘줄, 혈관 등으로 구성되어 있어 각도가 조금만 달라지면 손등 위의 굴곡도 같이 달라집니다. 다른 신체 기관들과 비교해보면 크기가 큰 것도 아닌데, 손을 그리는 사람 입장에서는 이 작은 면적안에 빛과 그림자를 굉장히 다채롭게 그려내야만 합니다.

 

손에는 사람의 특징과 캐릭터를 나타내는 요소도 많이 들어갑니다. 멋을 부리는 사람이면 손톱의 길이나 색깔을 신경쓰기도 하고, 마른 사람은 손등 위에 살이 별로 없어 힘줄과 인대가 더 잘 드러나기도 합니다. 손등이나 손가락에 문신이 있는 사람도 있고, 헤나를 그리는 사람도 있고, 반지를 끼는 사람도 있습니다. 직업에 따라 손가락의 두께와 색깔이 달라지기도 합니다. 어쩌면 손을 그리는 문제는 인공지능의 지능 문제라기 보다는 손이라는 신체 기관이 가진 해부학적 및 문화적 편차가 워낙 방대하기 때문일 수도 있겠습니다.

 

AI 그림 서비스들의 기술 발전을 기대해 봅니다

미드저니와 달리 둘다 작년 7월 경에 정식 출시되었습니다. 두 서비스 모두 아직 출시된지 채 1년이 되지 않았습니다. 빙 이미지 크리에이터는 지난 달에 생겼습니다. 물론 이들이 이미 사람이 그리는 수준의 (저같은 사람과 비교해보면 저보다 훨씬 높은 수준의) 그림을 척척 그려주어 화제가 되고 있었긴 하지만, 어쩌면 아직 돌도 안 지난 아기들에게 너무 많은 걸 요구한 건 아닐까 라는 생각도 듭니다. 저한테 사람 손을 자연스럽게 그리라고 해도 쩔쩔 매겠다 싶을 정도로 손은 굉장히 복잡한 신체 기관인데 말입니다.

 

데이터를 기반으로 패턴을 학습하는 인공지능의 입장에서는 위에서 언급한 다양한 경우의 수를 따져, 사용자가 요구한 포즈 안에서 손까지 가장 자연스럽게 연출해준다는 것이 굉장히 어려운 일일 수 있겠습니다. 어쩌면 현재까지는 인공지능이 학습한 데이터의 양이 사람의 손을 그려내기에는 충분하지 않았다고 할 수도 있습니다. 사람의 얼굴을 자연스럽게 그려내기까지 100장의 사람 얼굴 데이터를 필요로 했다면 손의 경우 손이 표현해낼 수 있는 모든 제스쳐, 각각의 손가락이 굽혀질 수 있는 모든 각도에 따른 데이터를 각각 100장씩 필요로 했을텐데 그렇지는 않았던 것이겠습니다.

 

물론 인공지능 기술은 지금 이 순간에도 발전하고 있습니다. 제가 이 글을 쓰는데 들인 시간은 아마 인공지능이 나무위키 문서 전체를 한 번 훑을 수 있는 시간일 수도 있습니다. 그만큼 이 AI들은 날이 갈수록 진화에 진화를 거듭하고 있기에, 앞으로 지속적인 학습과 데이터의 다양성을 통해 기술이 점차 개선된다면 사람의 손을 그리는 작업도 점차 정교해질 거라고 봅니다.

 

 

 

 

 

챗GPT vs. 빙 (Bing), 어떤 걸 써야할까

출시된지 20년이 넘도록 검색 시장에서 점유율 3% 수준의 저조한 성과를 냈던 마이크로소프트가 챗GPT의 개발사인 오픈AI와 손을 잡고 인공지능을 장착한 검색 엔진 빙(Bing)을 공개한지도 몇 주가

chatgptjoy.tistory.com

 

댓글