글로벌 1위 기업 시니어 머신러닝 사이언티스트가 말하는 “GNN”

머신러닝 사이언티스트 필수 역량인

‘딥러닝 뉴럴 네트워크 GNN’의 모든 것

글 미리보기 

  • Intro
  • 머신러닝에 매료된 남자
  • 진정한 열정이 있다면, 자격이 충분하죠 
  • GNN의 오늘과 내일 
  • GNN, 머지않아 혁명을 일으킬 분야입니다

>> 로페즈 박사의 ‘딥러닝 뉴럴네트워크 GNN’ 강의 바로가기 


Intro

인공신경망이 사물을 지각 또는 판단하고, 갖가지 신호를 인식한 끝에 의미를 이해하고 추론하는 과정은 ‘딥러닝’과 연관이 있습니다. 우리가 ‘바나나’라고 인식하는 것을, 기계는 수많은 입력값에 근거하여 결과물을 추론하는 하나의 규칙에 따라 판단합니다. 예를 들어 ‘기다랗고 노란 과일’이라는 정의에 따라 그것을 판별하죠. 하지만, 바나나에도 종류가 여러 가지가 있습니다. 껍질이 벗겨진 바나나, 초록색 바나나, 노란색 바나나 등. 그렇다면 이 많은 바나나의 모습을 기계는 어떻게 하나같이 ‘바나나’라고 판단할 수 있는 걸까요?

AI 알고리즘은 자기만의 시스템을 구축하여 스스로 사물을 판단하고 인식합니다. 마치 사람처럼 사물을 인식하죠. 분명 기계인데, 그것이 어떻게 가능할까요? 해답은 바로 ‘무수히 많은 데이터를 반복 훈련 학습하는 것’ 에 있습니다. 바나나에 대한 데이터를 수천, 아니 수 천만 가지 주입한 끝에 메커니즘이 확장되고, 마침내 기계는 바나나 그림자만 보고도 그것이 ‘바나나’임을 알게 되는 거죠. 그러한 작업을 연구하고, 주도하여 결과물을 도출하는 사람이 바로 머신러닝 사이언티스트입니다.

요즘, 전 세계 머신러닝 사이언티스트들 사이에서 핫하게 떠오르고 있는 알고리즘이 있습니다. 바로 딥러닝 뉴럴네트워크 GNN(Graph Neural Network)입니다. GNN은 코로나로 인한 팬데믹의 영향으로 최근 2년간 급격히 성장한 주제입니다. 지식 그래프, 연관 검색어, 소셜 미디어의 연결, 코로나 확장 그래프 등 한마디로 ‘요즘 뜨는 검색 방식’은 모두 GNN이 더 잘 해결할 수 있다고 해요. 

글로벌 FAANG 기업 중 한 회사에서 시니어 머신러닝 사이언티스트로 일하고 있는 ‘하비에르 알론조 로페즈 박사’는 GNN 전문가로서, 매일같이 GNN을 다루며 살아가고 있습니다. 그가 머신러닝 사이언티스트가 된 이유는 무엇인지, 또 그가 생각하는 GNN은 어떤 것인지 들어보았습니다.

머신러닝에 매료된 남자 

Q. 박사님의 업무에 대해 자세히 알고 싶습니다. 머신러닝 사이언티스트는 정확히 어떤 일을 하나요? 미국에서 머신러닝 사이언티스트라는 직업의 인지도나, 위치는 어떤지도 궁금합니다. 

A. 데이터 사이언티스트와 머신러닝 사이언티스트를 명확히 분류하긴 힘듭니다. 일반적으로 ‘머신러닝 사이언티스트’가 새로운 머신러닝 모델과 알고리즘을 모델링하고 생성하는 데 더욱 집중하는 편입니다.

반면에 데이터 사이언티스트는 일반적으로 훨씬 더 광범위하고 덜 구체적인 정의를 가지고 있습니다. 제 경험에 따르면 비즈니스 분석에 더 가까운 데이터 사이언티스트부터, 머신러닝 사이언티스트에 훨씬 더 가까운 데이터 사이언티스트에 이르기까지 여러 유형의 데이터 사이언티스트가 있습니다. 그사이에 가설 테스트, 머신러닝, SQL 등과 같은 광범위한 기술을 다루는 전문가들이 있습니다. 

저는 응용 머신러닝 사이언티스트 관리자입니다. 이 일을 하기까지 저는 학계에서 산업계로 옮겨왔습니다. 왜냐하면 제가 정말로 집중하고 싶은 것이 ‘비즈니스 문제 해결을 위한 머신러닝’이었기 때문입니다. 그래서 제 작업은 주로 비즈니스 문제를 해결하기 위해, 최첨단 머신러닝 솔루션을 적용하여 최선의 조치를 의사결정 하는 데 중점을 두고 있습니다. 이것은 제가 머신러닝 및 딥 러닝에 대한 연구와 그 적용을 알고 있어야 함을 의미합니다. 그러나 또한 그 연구 아이디어를 ‘생산 준비 시스템’ 쪽으로 옮겨오는 방법을 알고 있어야 합니다.

> The Red: 딥러닝 뉴럴네트워크 GNN 실습 자료

Q. 박사님께서는 원래 꿈이 ‘머신러닝 사이언티스트’였나요? 아니라면, 원래 어떤 직업을 꿈꾸셨는지 궁금합니다. 또, 현재 직업에 만족하시는지도 궁금합니다.

A. 어렸을 때부터 머신러닝에 관심이 있었던 것은 아닙니다. 머신러닝에 대한 관심은 대학 시절부터 시작되었습니다. 저는 교육을 받은 컴퓨터 과학자입니다. 기본적으로 소프트웨어 엔지니어이죠. 학사 기간에 저는 머신러닝 및 인공 지능에 관한 몇 가지 과정에 참석했고, 이 주제에 매료되었습니다. 그땐 솔직히 요즘처럼 멋있지 않았습니다. 그러나 저는 기계가 데이터로부터 학습할 수 있다는 사실에 놀라울 정도로 매료되었습니다. 그래서 석사와 박사 과정에서 저는 좀 더 실용적인 측면에서 이 분야에 집중했습니다.

지금, 저는 그때의 결정에 대해 아주 만족합니다. 저는 정말 멋진 프로젝트를 할 수 있었고, 그 주위에서 경력을 쌓을 수 있었고 여전히 그것에 대해 매일 배우고 있습니다.

> The Red: 딥러닝 뉴럴네트워크 GNN 실습 자료

진정한 열정이 있다면, 자격이 충분하죠 

Q. 박사님의 강의를 듣고 ‘머신러닝 사이언티스트’를 꿈꾸는 수강생도 분명 있을 텐데, 그들에게 해주고 싶은 말이 있나요? 

A. 누군가에게 진로에 관한 조언할 때, 항상 조심스러울 수밖에 없습니다. 제가 결정할 수 있는 것이 아닌, 상대방이 결정해야 할 문제이기 때문이죠. 그럼에도 몇 가지 조언을 해드릴 수는 있습니다. 머신러닝 및 인공지능에 대한 진정한 열정이 있어야 경력을 쌓을 수 있습니다. “오늘날 핫한 분야라서”라든가, “관련된 높은 보상 때문에” 이 분야를 선택한다면 곤란합니다.

대부분 작동하지 않는 모델을 구축한다고 가정해야 하므로 이 작업은 어렵습니다. 그것에 대한 통계가 있는지는 모르겠지만 우리가 구축한 모델의 80%는 실패하고 10~20%만 성공한다고 말하고 싶습니다. 그런 답답한 통계를 처리할 수 있어야 합니다. 이쪽으로 계속 커리어를 쌓고 싶다면 이 분야에서 대량의 고품질 데이터가 핵심입니다. 따라서 머신러닝, 딥러닝 모델 및 아키텍처를 배우는 것 외에도 데이터 엔지니어링 및 데이터 정리 학습에 시간을 할애하십시오. 이를 통해 향후 작업 시간을 절약할 수 있습니다.

GNN의 오늘과 내일 

Q. 그렇다면 GNN이 실제 산업 현장에서 어떻게 활용되는지도 궁금한데요. 주로 어떤 업무에 가장 밀접하게 연관되어있나요? 

A. GNN 분야는 NLP, SNS, 추천 시스템, 컴퓨터 비전 등 다양한 분야에 접목되어 있습니다. 대표적으로 Facebook의 ‘친구 관리’, ‘넷플릭스’의 추천 알고리즘 등 많은 글로벌 기업에서 활용되고 있는 강력한 기술이죠. 저는 Geo AI 전문가로서, GNN을 활용하여 지도를 생성하는 업무를 진행하고 있습니다. 참고로 말하자면, 여러분이 보시는 온라인 지도의 15% 이상은 딥러닝으로 생성되는 것입니다. 이것을 가능케 하는 것 중 하나가 바로 ‘GNN’ 이죠. 이렇게 매일같이 GNN을 사용하며 경험과 저만의 노하우를 쌓았습니다. 

GNN은 결코 혼자서 공부하기 쉬운 분야가 아닙니다. 하지만, 머신러닝 그리고 딥러닝과 함께하는 사람이라면 GNN을 반드시 공부해야 합니다. 저의 수업에서는 Message Passing부터 시작하여 GNN에 대한 기초적 이해를 바탕으로 Graph Embedding을 깊이 있게 다룹니다. 이어서 GCN, GRN 등을 살펴본 뒤 NLP, 추천 시스템 등 다양한 GNN 응용 분야까지 알아갈 수 있습니다. 저와 같이 차근차근 계단을 밟아가며 실력을 향상시키고 싶은 사람에게 이 강의를 추천해 드립니다.    

>> 로페즈 박사의 ‘딥러닝 뉴럴네트워크 GNN’ 강의 바로가기 

Q. 박사님께서 진행해주신 강의 ‘딥러닝 뉴럴네트워크 GNN’의 비하인드 스토리가 궁금합니다. 박사님의 강의를 듣는 수강생들이 특히 ‘이것만은 꼭 기억하면 좋겠다’ 싶을 만큼 중요한 내용이 있을까요? 

A. 제 수업을 들을 학생들은 두 가지를 얻어가게 됩니다. 첫째, GNN이 어떻게 작동하는지 이해하고 둘째, GNN이 문제를 해결하는 데 언제 유용할지 식별할 수 있는 것입니다.

물론, 우리는 GNN의 기초와 그것을 구현하는 방법을 다룰 것입니다. 그러나 훗날 학생들이 GNN이 어떤 당면한 문제에 대한 적절한 솔루션으로 다가오는 날이 오면 이 과정은 완전히 가치가 있게 느껴질 것입니다.

여기에 추가하자면 GNN의 유연성과 표현 가능성 수준을 고려할 때 딥 러닝의 미래에는 GNN이 점점 더 널리 보급될 것으로 예상합니다. GNN은 CNN의 자연스러운 진화 형태입니다.

GNN, 머지않아 혁명을 일으킬 분야입니다

Q. 다른 어떤 직종보다 머신러닝 사이언티스트라는 직업이 가지는 가장 큰 장점은 무엇이고, 또 가장 어려운 점은 무엇이라고 생각하시는지 궁금합니다. 

A. 대부분의 업계가 머신러닝 및 딥러닝을 모든 분야에 적용할 수 있는 방법을 탐구하고 있다는 점에서 머신러닝 사이언티스트는 강점이 있습니다. 이는 모든 산업 분야에 다양한 기회가 있음을 의미합니다. 따라서 관심 있는 산업이나 분야(우주에서 자율 주행 자동차, 공급망, 농업 등에 이르기까지)가 무엇이든 머신러닝을 적용할 수 있습니다.

이 시대에 머신러닝 사이언티스트가 되는 데 있어 가장 어려운 부분은 ‘우리 분야에서 일어나고 있는 모든 새로운 발전을 추적하는 것’이라고 생각합니다. 언젠가는 컴퓨터 비전, NLP, 추천 시스템 등 특정 작업 영역을 선택하여 전문화하고 집중해야 합니다. 물론 자신을 일반화하려고 노력할 수는 있지만 해당 분야가 발전함에 따라 모든 것을 다 잘하기는 어려울 것입니다.

Q. 마지막으로, 박사님께 GNN은 어떤 의미인지 알고 싶어요. 매일같이 GNN과 함께하는 입장에서 의미가 특별할 것 같습니다. 

A. 저에게 GNN은 지난 몇 년 동안 집중해 온 ‘새로운’ 관심 분야입니다. GNN은 CNN의 자연스러운 진화라고 생각합니다. 데이터 간 연결을 표현하는 유연성과 표현 가능성을 감안할 때 컴퓨터 비전에서 소셜 네트워크 또는 NLP, 트래픽 관련 문제에 이르기까지 여러 분야에 걸쳐 적용할 수 있을 것으로 생각합니다. 머신러닝의 일부 응용 분야에 혁명을 일으키리라 생각하기 때문에 GNN이 특별하다고 말할 수 있습니다.

로페즈 박사의 ‘딥러닝 뉴럴네트워크 GNN’ 강의 바로가기