언론 속의 투썬
[로그人] 연세대 서길수 교수·방영석 교수 생성형 AI 잘 쓰려면 정확한 큐 줘야
작성자담당자
작성일2023.09.12
조회수372
신고하기
‘생성형 인공지능(AI)’이 세상을 바꾸고 있다고 한다. 하지만 대부분은 챗GPT를 재미로 ‘몇 번 대화해 본’ 정도의 체험기로만 경험했을 것이다. 그럼에도 여전히 ‘생성형 AI’는 삶을 바꾸고, 업무의 방식을 바꾸고, 기업을 바꾼다고 강조하고 있다.
에듀테크 시장에서도 프롬프트 엔지니어링과 같은 생성형 AI를 위한 교육 콘텐츠가 쏟아져 나오고 있다. 분명 무언가 변화를 느끼지만 어디서부터, 어떻게 시작해야 할지 막연하다. 기업의 경우는 더욱 막막하다. 데이터가 중요하다고 하지만 어떤 데이터가 중요하고, 어떻게 활용해야 하는지 방향을 잡지 못한다.
사실 이러한 막연함에 있어서는 ‘경험을 해봐야 한다’는 조언이 가장 현실에 가깝다. ‘생성형 AI를 활용한 데이터 애널리틱스’를 강의하는 서길수 교수(연세대학교)와 방영석 교수(연세대학교)는 생성형 AI에게 질문하고 답변 받는 과정을 계속해나가면서 스스로가 그 도구를 제대로 사용하는 방법을 알아야 한다고 말한다. 그리고 데이터에 주목하라고 강조한다.
‘생성형 AI 시대’에 분명한 것은 앞으로 생성형 AI를 사용할 줄 알아야 한다는 것이다. 마치 30년 전 인터넷을 사용할 줄 알아야 한다고 강조했던 것처럼 말이다. 우리가 무엇을 알아야 하고 무엇을 준비해야 하는지에 대해 서길수 교수, 방영석 교수와 자유로운 논의를 나눴다. 이하는 일문일답으로 정리한 논의들이다.
― 생성형 AI, 어떻게 생각하나.
서길수 교수 "처음에 챗GPT에 간단한 질문들을 던져봤더니 대답을 잘했다. 어려운 질문을 해볼까 해서 기말시험 문제를 물어봤다. 나름 개인적으로는 고민과 연구를 많이 해서 만들어놓은 질문이었다. 여러 기업의 사례를 비교할 수 있어야 하고, 왜 IT가 경영에 중요한지를 설명을 해줘야 되는, 난이도가 있는 문제였기 때문에 답을 제대로 하지 못할 것이라고 생각했다. 하지만 너무 완벽하게 답해서 크게 놀랐다.
그 순간 챗GPT는 세상을 바꿀 수도 있겠다는 직감이 들었다. 우선은 챗GPT를 수업에도 활용할 수 있겠다 싶어서 데이터베이스와 디자인씽킹에 활용하고 있다."
방영석 교수 "제가 담당하는 수업이 비즈니스 데이터를 분석해서 의사 결정을 할 수 있도록 하는 인사이트를 찾아내는 과정이다.
보통 이런 수업을 하게 되면 학생들이 한 달 정도는 파이썬과 같은 툴을 중심으로 배우게 된다. 이 툴을 제대로 배우지 못하면 인사이트를 가지고 있는 학생이라 할지라도 원하는 결과물을 얻을 수 없는 구조이기 때문이다. 하지만 챗GPT가 나오면서 프로그래밍이라던가, 특정 통계적 스킬을 배우는 데 들인 시간을 대체할 수 있게 됐다."
― 생성형 AI 사용에 어려움을 느끼는 사람이 아직은 많은 것 같다.
서길수 교수 "막상 사용해보면 그렇지 않다. TAM(Technology Acceptance Model)이라는 기술수용모델 이론이 있다. 사람들이 어떤 기술을 받아들일 때 필요한 조건이 무엇인가를 연구한 모델인데, 딱 두 가지 조건만 있으면 가능하다는 것이다. 얼마나 쉬운가, 얼마나 유용한가이다. 생성형 AI 모델이 TAM에 부합한다고 생각한다."
― 생성형 AI를 잘 활용하기 위한 좋은 방법은 없나.
방영석 교수 "챗GPT는 대형언어모델(LLM)이다. 언어모델은 빔서치(Beam Search)라는 방법을 쓰게 된다. 결국 LLM은 빔을 잘 제시해줘야 원하는 결과값을 얻을 수 있다는 말인데, 이를 챗GPT를 활용하는 데 적용하면 프롬프트에 명확하고 구체적인 질문을 던져야 한다는 것이다.
가령 레시피대로 요리를 하는 것처럼 특정 데이터 분석을 위해서는 그에 맞는 방법대로 물어봐야 한다는 말이다. 바꿔 말하면 코딩 스킬이나 통계적 지식보다는 사용자가 현업에서 가지고 있는 인사이트를 기반으로 물어볼 수 있는 기술이 더 중요해질 것이다. 물론 나중에는 데이터 분석 레시피가 나올 것 같다."
서길수 교수 "데이터 분석을 위한 대표적인 언어가 SQL이다. 챗GPT를 손쉽게 사용할 수 있는 상황에서 SQL의 모든 것을 과거처럼 배울 필요는 없지만 언어의 구조, 특성 등 기본적인 이해를 할 수 있으면 보다 전문적인 결과값을 얻을 수 있다. 투썬AI스쿨에서 10월부터 진행할 강좌에서 데이터베이스와 SQL 등을 강의하는 것도 그런 이유에서다."
* 투썬AI스쿨은 AI 대중화를 위해 아카데미, 세미나, 스터디 등을 마련하고 있는 교육기업이다. 오는 10월부터는 서길수 교수, 방영석 교수 등이 "생성 AI 활용 데이터 애널리틱스"에 대해 10주간 강의할 예정이다.
― 기업에서 사용하는 경우라면 전문적이어서 좀더 어려울 것 같다.
방영석 교수 "개념 정도(가령 기업의 데이터 분석에 적용되는 기술)는 알아야 한다. 그리고 계속해서 큐를 줘야 한다. 예를 들어 시계열 예측을 하는 경우 아리마(ARIMA) 모형으로 분석하고자 한다면 이 모형이 무엇이고 어떻게 쓰이는지 정도의 기본 지식을 알고 있어야 "아리마 모델을 적용해서 분석해줘"라고 질문할 수 있다는 것이다.
다른 예를 들어보면, 그룹 간 비교를 한다고 했을 때 ‘T-검정’을 쓸 것인지 ‘카이제곱검정’을 쓸 것인지 정도는 알아야 구체적이 방향을 제시해서 질문할 수 있고, 원하는 결과에 최대한 가까운 답변을 얻을 수 있다.
궁극적으로는 GPT에 분류모형(데이터를 주면 어떤 분석이 필요한지 구분해주는 모형)을 적용해서 기업들(사용자)이 데이터만 입력하면 알아서 적합한 모형과 가장 의미있게 분석하는 방법 및 결과값을 제공해 줄 것이다. 하지만 현재는 AI와 소통할 수 있는 능력을 길러야 할 때이다."
― 기업이 AI를 잘 활용하는 데 있어 데이터가 중요하다는 것은 알고 있다.
하지만 어떤 데이터가 중요한지 어떻게 처리(수집·가공·분석)해야 하는지 막연한 부분이 있다.
서길수 교수 "이 역시 생성 AI를 활용할 수 있다. 사실 데이터에 있어 공통된 사항은 있을 수 없다. 기업들이 가지고 있는 데이터는 모두 다르기 때문이다. 가령 우리 회사는 어떤 비즈니스 영역에 있고, 어떤 서비스를 주로 어떤 고객에게 제공하고 있는지에 대해 정의 내려 준 다음 어떤 데이터가 필요한지를 계속 물어나가면 우리가 생각하지 못한 답변을 줄 수 있다. 생성형 AI는 좋은 컨설턴트가 될 수도 있다는 것이다."
방영석 교수 "기업은 데이터베이스에 최대한 모든 데이터를 보유하려고 한다. 하지만 그 데이터를 충분히 활용하지는 못하고 있다. 그 이유 중 하나는 데이터가 너무 많다는 것이다. 너무 많기 때문에 AI를 도입한다고 하더라도 이를 제대로 활용할 수 없다.
두 번째는 기술적 한계 때문에 엄두가 나질 않는다는 것이다. 지금은 GPT의 도움을 얻어 대화형으로 분석할 수 있고, 특히 유료를 이용할 경우 많은 애드인(Add-In) 도구들을 사용할 수 있다. 그 중 데이터 분석 애드인을 활용하면 데이터를 업로드 할 수 있고 이를 통해 챗GPT와 대화를 하면서 데이터 시각화, 기초통계, 가설 검정 등을 수행할 수 있다."
― 기업들이 AI를 사용하는 데 있어 주의해야 할 부분은 무엇인가.
방영석 교수 "신뢰성이다. 이를 위해서는 ‘설명 가능한 AI’가 필요하다. 데이터 양이 많아지게 되면 데이터베이스에서 변수가 많다보니 우연의 일치로 상관관계만 높게 나오는 경우가 있다. 대표적인 예시가 있다. 우연의 일치로 모짜렐라 치즈 소비량과 토목공학 박사학위 취득 간의 상관관계가 높게 나온 것이다. 이 상관관계대로라면 "토목공학 박사학위 취득을 높이기 위해 모짜렐라 치즈 소비를 촉진시켜야 한다"는 결론이 나오게 된다. 설명할 수는 없지만 데이터 분석 측면에서는 정확도 높은 결과다.
간혹 기업을 방문해서 데이터 분석을 살펴보면 관련 없는 변수를 넣는데, 왜 넣느냐고 물어보면 설명력(정확도)이 많이 올라가서 넣었다고 답한다. 실무자들도 잘 모른다는 것이다. 때문에 기업에서는 어떤 변수가 왜 들어가는지에 대한 정보는 가지고 있어야 한다."
― AI 시대에 앞장서 변화를 주도하라고 하셨다.
서길수 교수 "AI에 대한 인식을 우선 바꾸라는 메시지를 전달하고 싶다. 사람들이 AI에 대해 잘 모르기 때문에 두려운 것이다. 지금 AI는 미국 의사면허 시험도 통과했고, 로스쿨 시험, MBA(경영대학원) 시험도 통과했다. 법률 지식, 의료 지식, 경영 지식을 비롯한 거의 모든 분야의 지식을 가지고 있다. 어떻게 보면 우리가 부르면 언제든지 나타나는 지니같은 존재이고, 한 달에 20달러만 주면 24시간 내내 고용할 수 있는 보조직원이기도 하다.
그래서 기업이든, 개인이든 이를 어떻게 사용해야 할까를 심각하게 고민해보고 실제 사용할 수 있어야 한다. 이를 통해 생산성이 향상되는 것을 경험했을 때 새로운 세상이 열리는 것이다.
중요한 부분은 ‘경험’이다. 인터넷이 처음 보급되던 시절에 학교, 관공서 등 다양한 장소에 검보검색대가 설치돼 있었다. 왜 설치했을까. 사람들한테 경험을 주기 위해서였다. 수업 때도 생성형 AI를 사용해서 자신이 하고 있는 업무를 어떻게 혁신했는지에 대한 프로젝트를 내줬다. 한 팀은 코카콜라 신제품을 개발하는 프로젝트를 진행했는데 챗GPT에게 신제품 개발 프로세스를 얻어 알려준대로 실제 새로운 음료 개발까지 진행했더라. 챗GPT는 건강 음료를 신제품으로 개발하는게 시장에서 좋은 반응을 얻을 것이라고 제시해줬고, 레시피도 알려줬다. 실제 레시피대로 음료를 만들었는데 의외로 맛있었다. 그리고 음료 이름까지 지어주더라. 그런 식으로 경험해보면 새로운 세상은 분명 열릴 것이다."