투썬AI스쿨

로그인을 해주세요

[AI 지식 연구소] Chatgpt(챗gpt)를 활용한 프롬프트 전략 방법 - CoT(Chain-of-Thought) Prompting 편

안녕하세요.투썬AI스쿨입니다. 이번 게시글에서는CoT(Chain-of-Thought) Prompting에 대해자세히 알아보려고 합니다! Chain-of-thought prompting Chain-of-thought prompting 은언어모델이 추론을 할 수 있도록 논리적인 과정을프롬프트에 추가해서 질의하는 방식입니다. [ 다음 논문에서 소개되었습니다. Wei et al, Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. 2022] CoT 프롬팅은 중간 추론 단계를 통해 복잡한 추론 능력을 가능케합니다. 이 방법은 퓨샷프롬팅과 결합하면 응답하기 전에 추론이 필요한 더 복잡한 작업에서더나은 결과를 얻을 수 있습니다.CoT 프롬팅에서는 문제를 해결하는데 필요한 중간 추론 단계를 제공하여 작업을단계적으로 수행합니다. 이렇게 하면 모델이 각 단계를 이해하고 최종 결과를 추론하는데 도움이 됩니다.다음은 예시입니다. 그런데, 이렇게 추론에 대한 모든 과정을 언어 모델에게 작업 줄 때마다사람이 하기에는 번거로운 작업입니다. 그래서 논문 ' Kojima et al, Large Language Models are Zero-shot Reasoners. 2023 '을 통해논리적인 추론이 필요한 질문 뒤에 "Let's think step by step(단계 별로 생각해보자)"라는 질문을 추가하는 것 만으로도언어모델의 추론 능력을 끌어올릴 수 있다는 것을 알 수 있습니다.다음은 이에 대한 예시입니다.기존에 성공하지 못했었던 작업에 대해 올바른 과정을 통해단계별 추론을 하면서 정확한 답을 생성한 것을 확인할 수 있습니다. 지금까지 언어모델의 답변을 더 잘 이끌어내기 위한프롬프트 전략을 간단하게 살펴보았습니다. 제로샷 프롬팅은 특정 작업에 대한 예시나 데이터를 별도로 제공하지 않고도,대형 언어 모델이 특정 작업을 수행하는 능력을 의미합니다. 모델은 훈련 데이터에서 학습한 지식과 패턴을바탕으로 입력된 프롬프트를 해석하고 적절한 응답을 생성합니다. few-shot 프롬팅은 모델에게 특정 작업에 대한몇가지 예시를 제공함으로써 해당 작업에대한 컨텍스트를 이해하게 하는 방법입니다. 이러한 방식은 모델이 새로운 작업을 더 효과적으로 처리하게 해줍니다. 마지막으로, CoT 프롬팅에 대해 알아보았습니다. 이는 복잡한 추론을 가능케 하는기술로,특히 문제해결과정의 중간 단계를 명시적으로 제공함으로써작업을 단계적으로 이해하게 해줍니다. "단계별로 생각하자"와 같은 프롬프트를 추가하는 것만으로언어모델로 부터 더 정확한 답변을 얻을 수 있었습니다.이러한 프롬팅 방법들은 대형언어 모델의 성능을향상시키는데 중요한 역할을 합니다.이런 접근법들을 사용하면, 모델은 더 복잡한 작업을 더 잘 수행하고,더욱 신뢰성 있는 결과를 제공할 수 있게 됩니다. 이는 언어 모델이 우리의 일상 생활에서더욱 중요한 역할을 하는데 기여하게 될 것입니다. 혹시 궁금한 점이 있으시다면, aischool@twosun.com으로메일부탁드립니다. 감사합니다.

작성자월넛
작성일2023.08.08
조회수491

[AI 지식 연구소] Chatgpt(챗gpt)를 활용한 프롬프트 전략 방법 - Few-shot Prompting 편

안녕하세요.투썬AI스쿨입니다. 오늘은 인공지능 분야에서 많이 이야기되고 있는흥미로운 주제, '언어모델 활용법'의'퓨샷 프롬팅(Few-shot Prompting)'에 대해 이야기하려고 합니다. 인공지능은 이제 우리 삶의 많은 부분에서 활용되고 있으며,특히 언어 모델은 기계 번역부터 텍스트 분석, 챗봇 개발까지다양한 분야에서 활용되고 있습니다.'퓨샷 프롬팅' 기법은 인공지능 언어 모델이 어떻게 학습하는지,그 결과를 우리가 원하는 방향으로 유도할 수 있는지를 이해하는 데 큰 도움이 됩니다!퓨샷 프롬팅은 어떻게 언어 모델의 성능을 향상시킬 수 있는지함께 알아볼까요? few-shot Prompting 먼저 제로샷 프롬팅(Zero-shot Prompting)에 대해 알아보도록 하겠습니다.제로샷 프롬팅은 큰 언어모델,예를 들어 GPT-3 같은 모델이 "예시 없이" 어떤 작업을 수행하는 능력을 의미합니다.이런 모델들은 대량의 데이터에 대해 학습하며,지시사항을 따르는 방법을 터득합니다.따라서 아무런 예시를 제공하지 않아도 특정 작업을 수행할 수 있는 능력이 있습니다. 이를 '제로샷' 능력이라고 부릅니다.예를 들어, 우리가 모델에게 다음과 같은 작업을 지시한다고 생각해봅시다. 위의 지시사항에서 모델에게 텍스트와 해당 분류에 대한 예시를 제공하지 않았음에도,모델은 '감정'을 이해하고 텍스트를 적절하게 분류하였습니다. 이것이 바로 제로 샷 능력의 힘입니다.이와 같은 제로샷 학습을 향상시키는 방법으로는 '명령어 튜닝(Instruction Tuning)'이 있습니다.명령어 튜닝이란, 데이터셋에 대한 설명을 통해 모델을 미세조정하는 개념입니다. 또한, 'RLHF(Reinforcement Learning from Human Feedback)'이라는 방법이이를 확장하여 사용되어, 모델이 사람의 선호도에 더 잘 맞게 조정됩니다. 이런 최신의 발전이 바로 ChatGPT와 같은 모델들을 구동하는 기술입니다.이 방법들은 앞으로 더 자세하게 살펴볼 예정입니다.하지만 제로샷 방식이 작동하지 않는 경우도 있습니다.이럴 때는 '프롬프트'에 예시나 설명을 제공하여,'퓨샷 프롬팅'으로 이동하는 것이 좋습니다. 퓨샷 프롬팅이란 제로 샷 프롬팅이 충분히 작동하지 않는복잡한 작업에 대해 적용할 수 있는 기법입니다. 이 방법은 '프롬프트' 안에 데모나 예시를 제공함으로써모델의 성능을 향상시키는 데 도움을 줍니다.이런 예시들은 모델이 더 나은 반응을 생성하게 하기 위한 조건이 됩니다.이는 특히 파리 미터가 많은 언어 모델에서 잘 작동합니다.다음은 1개의 예시를 준 one-shot prompting의 예시입니다. 문장의 긍정/부정을 판단하는 작업을 위와 같이하나의 예시를 주면서 원하는 결과의 형태로언어 모델이 응답을 하는 것을 확인할 수 있습니다.하나 이상의 예시를 주면, 준 예시의 수 (n) 만큼n-shot 프롬프팅이라고 부릅니다. n-shot prompting을 묶어서 few-shot prompting 이라고 부릅니다.아래는 2-shot prompting 의 예시입니다.few-shot prompting의 재미있는 부분은아래와 같이 틀린 예시를 주더라도언어모델의 응답은 정확할 수 있다는 것입니다.예를들면, 위에서 긍정/부정 분류가 틀린 예를 주어도언어모델은 "수납공간도 넓어지고 정리가 깔끔하게 잘 되어있어서 만족합니다." 라는 문장을"긍정"으로 잘 분류해내는 것을 확인할 수 있습니다.이는다음 Rethinking the Role of Demonstrations: What Makes In-Context Learning Work? 이라는논문에서 소개되었습니다. Min et al. 2022 그러나 few-shot prompting 만으로 해결하기 어려운 경우도 있습니다.특히 논리, 수학적인 영역과 같이 추론 능력이 필요한 작업들은언어모델을 통해 정확한 답을 유도해내는 것이 어렵습니다.따라서 이와 같은 작업을 언어모델에게 줄 때는 다른 접근이 필요합니다.아래는 언어모델이 혼란을 겪는 예시입니다. 퓨샷 프롬팅(Few-shot Prompting)에 대해자세히 이해하셨나요?혹시 궁금한 점이 있으시다면, aischool@twosun.com으로메일부탁드립니다. 다음 게시글에서는CoT(Chain-of-Thought) Prompting에 대해자세히 알아보겠습니다. 감사합니다.

작성자월넛
작성일2023.08.08
조회수448

소개 이용약관 개인정보처리방침 환불규정 찾아오시는 길

투썬캠퍼스 | 투썬월드

주식회사 투썬캠퍼스 원격평생교육원 | 대표 : 이종현, 김종화
사업자등록번호 : 498-81-00322 | 통신판매업신고번호 : 제 2023-성남분당A-0486
주소 : (13494) 경기도 성남시 분당구 판교역로 221, 투썬캠퍼스(삼평동, 투썬월드빌딩) / 개인정보관리책임자 : 박병호
전화번호 : 070-4880-3938 | 전자우편 : aischool@twosun.com

Copyright (c) 주식회사 투썬캠퍼스 원격평생교육원 All Rights Reserved.

호스팅 제공자: 주식회사 맑은소프트

투썬월드 투썬캠퍼스

로그인을 해주세요

[AI 지식 연구소] Chatgpt(챗gpt)를 활용한 프롬프트 전략 방법 - CoT(Chain-of-Thought) Prompting 편

[AI 지식 연구소] Chatgpt(챗gpt)를 활용한 프롬프트 전략 방법 - Few-shot Prompting 편