일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- crawling
- powershell
- 시스템자동화
- 데이터 분석
- ansible
- GIT
- 5.0
- python
- apt
- zabbix
- tcp
- ELK
- 8.0
- GCP
- elasticsearch
- EC2
- module
- AWS
- sso
- API
- EKS
- Selenium
- Linux
- kibana
- ubuntu
- airflow
- Automation
- MySQL
- 자동화
- DB
Archives
- Today
- Total
Oops - IT
AI 답변 정확도 높이기 #1 (질문을 잘하자) 본문
반응형
개요
- 현재, ChatGPT 출시 이후, 많은 사람들이 일상이나 업무에 AI를 활용 중이다.
- 이미, 구글링에도 상단에 답변을 실제 게시물을 보여주기보다는 AI를 활용한 답변을 먼저 제시하고 있다.
- 이처럼, 이제 삶에 녹아들게 된 AI를 잘쓰고, 정확하게 활용하기 위해서는 AI에 대해서 잘 알고 사용해야 하고, 똑똑하게 사용할 줄 알아야한다.
그러면, AI를 어떻게 잘 사용하고, 답변의 정확도를 높일 수 있을 지 알아보자!!
정확도를 어떻게 높일 수 있을까?
- 사전 확인
- AI는 각자 자체적으로 개발하는 여러 Foundation Model을 기반으로 동작하고 있다.
- Foundation Model은 대규모 데이터로 사전 학습된 범용 인공지능 모델로 자연어 처리, 이미지 생성, 코드 생성 등 다양한 작업에 적용할 수 있는 원시 데이터 기반의 학습된 데이터 덩어리 입니다.
- 우리는 이러한 Foundation Model에게 원하는 데이터를 얻기 위해서는 질문을 하게되고, Foundation Model은 우리가 질문한 내용을 기반으로 그에 맞는 답변을 추론해서 전달 해주게된다.
- 정확도에 대해서..
- 그러면, 우리가 원하는 답변을 얻기 위해 연관되어 있는 내용이 간략하게 여기서 Foundation Model, 질문, 추론 이렇게 정리가 될 거 같습니다.
- 정확도를 높이기 위해서는 크게 이 3가지를 주의해서 확인이 필요합니다.
- 정확도를 그러면 어떻게하면 높일 수 있을까 단순하게 생각해보겠습니다.
- 첫번째로, 질문을 잘하면 되겠죠..? Foundation Model이 우리가 원하는 내용을 잘 답변 줄 수 있도록 상황을 정의하거나, 구체적인 답변의 샘플을 주거나 이런 방법으로 정확도를 높일 수 있을 거 같습니다.
- 두번째로, 추론 방식을 개선하면 좋을 거 같습니다. Foundation Model 자체적으로 왜 이런 답변을 주게되었는 지 생각하게 하고, 다시 한 번 질문을 한다거나, 답변의 정확도를 체크한다던가 하는 방법도 있을 거 같습니다.
- 세번째로, Foundation Model에 원하는 데이터가 부족하거나, 학습이 부족하다면 내가 원하는 답변을 얻기 위해 Foundation Model에 필요한 데이터를 추가하거나, 다시 Model을 나의 입맛에 맞게 다시 훈련하여 사용할 수도 있을 거 같습니다.
Prompting
- 그러면, 이중에서 가장 간단해보이는 첫번째 내용으로 접근해보겠습니다.
- AI를 활용할 때 질문 = Prompt를 의미하며, 정확도 높은 원하는 답변을 얻기 위해서는 질문을 잘하는 것 = 적절한 Prompting 기법을 활용해야합니다.
- 그러면 어떤 상황에서 어떻게 Prompt를 작성해야 답변의 정확도와 퀄리티를 높일 수 있을 지 Promp를 작성하는 법에 대해서 알아보겠습니다.
Prompting 기법
- ✅ 1. Zero-shot Prompting
- 정의: 아무 예시도 주지 않고 모델에게 직접 요청만 하는 방식.
- 예시:
- "서울의 날씨에 대해 알려줘."
- 장점: 빠르고 간단함.
- 단점: 복잡하거나 창의적인 작업에는 한계 있음.
✅ 2. One-shot Prompting- 정의: 단 하나의 예시를 제공해서 원하는 패턴을 학습하게 함.
- 예시:
- Q: 고양이는 몇 개의 다리를 가지고 있나요?
A: 고양이는 4개의 다리를 가지고 있습니다.
Q: 개는 몇 개의 다리를 가지고 있나요?
A: - 장점: 모델에 기대하는 형식을 일부 학습시킬 수 있음.
- 단점: 예시 하나로는 불충분할 수 있음.
✅ 3. Few-shot Prompting- 정의: 여러 개의 예시를 제공해 LLM이 문제 해결 패턴을 학습하도록 유도.
- 예시: 위 one-shot의 확장형. 예시 3~5개 이상 주는 경우가 많음.
- 장점: 복잡한 작업에도 좋은 성능을 냄.
- 단점: 길이가 길어질 수 있고, 토큰 비용이 증가함.
✅ 4. Chain-of-Thought Prompting (CoT)- 정의: 모델에게 중간 사고 과정을 명시적으로 표현하도록 유도.
- 예시:
- "문제를 단계별로 천천히 생각해서 풀어줘."
"Let's think step by step." - 장점: 논리적 추론 문제에서 정확도 상승.
- 단점: 응답이 길어지고 느려질 수 있음.
✅ 5. Role Prompting (역할 부여)- 정의: 모델에게 특정한 역할을 부여해 응답 톤과 방식 제어.
- 예시:
- "너는 지금부터 엄격한 문법 교사야. 문장을 철저히 검토해줘."
- 장점: 스타일이나 관점 제어에 효과적.
- 단점: 역할이 모호하면 기대한 응답이 안 나올 수도 있음.
✅ 6. ReAct Prompting (Reasoning + Acting)- 정의: 모델이 사고(Reasoning)와 행동(Acting)을 번갈아 수행하게 함.
- 예시: 검색이나 계산처럼 외부 툴을 연동하는 에이전트 시스템에서 사용.
- 장점: 복합 작업 자동화에 유용.
- 단점: 고급 시스템 구성 필요.
✅ 7. Self-Consistency Prompting- 정의: 동일한 질문에 대해 여러 번 생각하게 해서 그 중 가장 일관된 응답을 선택.
- 예시: CoT와 함께 사용되며 다수결 방식으로 답을 정함.
- 장점: 정답률 향상.
- 단점: 응답 여러 개 생성 필요 → 시간·비용 증가.
Prompting 기법에 따른 답변 차이
- ✅ 1. Zero-shot Prompting
- 프롬프트:
- 지구는 왜 둥근가요?
- 답변:
- 지구는 자전과 중력의 영향으로 인해 거의 구형에 가깝습니다. 중력은 모든 방향에서 중심으로 끌어당기기 때문에, 자전으로 인한 약간의 적도 팽창을 제외하면 구형이 됩니다.
- 특징: 짧고 정리된 설명. 논리 전개는 간결함.
✅ 2. One-shot Prompting- 프롬프트:
- Q: 달은 왜 밝게 보이나요?
A: 태양 빛을 반사하기 때문에 밝게 보입니다.
Q: 지구는 왜 둥근가요?
A: - 답변:
- 지구는 자전하면서 중력에 의해 중심으로 끌려 구형을 이루기 때문입니다.
- 특징: 예시 스타일을 따라감. 문장이 짧고 예시와 유사한 구조.
✅ 3. Few-shot Prompting- 프롬프트:
여러 과학적 질문과 답을 3개 보여준 후 마지막에 같은 방식으로 질문. - Q: 물은 왜 끓나요?
A: 온도가 상승하면 분자 운동이 활발해져 기체 상태로 변합니다.
Q: 번개는 어떻게 생기나요?
A: 대기 중의 전하 차이에 의해 방전이 일어나면서 발생합니다.
Q: 지구는 왜 둥근가요?
A: - 답변:
- 중력은 지구의 모든 방향에서 중심으로 끌어당기며, 이로 인해 지구는 자전하면서도 거의 완전한 구형을 유지합니다.
- 특징: 구조적이고 간결하며 과학적 설명에 더 집중.
✅ 4. Chain-of-Thought Prompting- 프롬프트:
- 지구가 왜 둥근지 단계별로 생각해보자.
Step by step: - 답변:
-
- 지구는 자전하는 천체입니다.
- 중력은 모든 질량을 중심으로 끌어당깁니다.
- 이런 중력의 작용으로 지구의 물질은 가능한 한 고르게 분포하게 됩니다.
- 그 결과, 지구는 구형이 됩니다. 단, 자전으로 인해 적도가 약간 더 팽창해 있습니다.
- 특징: 논리적이고 단계적인 설명. 사고 과정이 명확함.
✅ 5. Role Prompting- 프롬프트:
- 당신은 고등학생을 가르치는 물리 선생님입니다. 학생이 “지구는 왜 둥근가요?”라고 물었을 때 어떻게 설명하겠습니까?
- 답변:
- 좋아, 아주 좋은 질문이야. 지구는 자전하면서도 중력이 모든 방향에서 중심으로 끌어당기기 때문에 둥글게 되는 거야. 풍선에 물을 넣었을 때처럼, 물질이 가능한 한 균형 있게 퍼지는 거지. 다만 적도는 조금 더 넓어져 있단다.
- 특징: 톤이 친근하고 설명이 직관적. 대상에 맞춤형 응답 제공.
✅ 6. ReAct Prompting- 프롬프트 (에이전트 기반, 툴 사용 가능 시):
- 질문: 지구는 왜 둥근가요?
생각: 관련된 과학 이론을 검색해야겠어.
행동: [Google 검색: "지구가 둥근 이유"]
관찰: 중력과 자전에 의해 구형이 된다는 과학적 설명 확인.
답변: - 답변:
- 지구는 중력의 영향으로 가능한 모든 방향에서 물질이 중심으로 모이기 때문에 구형을 이룹니다. 자전으로 인해 적도가 조금 더 부풀어 있는 편평한 구형(타원체)이기도 합니다.
- 특징: 툴 사용 기반. 외부 정보 반영. 복합적인 사고 가능.
✅ 7. Self-Consistency Prompting- 프롬프트:
- “지구가 왜 둥근지”에 대해 여러 가지 생각을 해본 후, 가장 논리적인 답변을 선택하세요.
- 답변 1: 중력이 모든 방향에서 작용한다.
- 답변 2: 지구는 액체 상태였던 시절 자전에 의해 구형을 이뤘다.
- 답변 3: 적도는 더 넓지만 전체적으로는 구형이다.
- 최종 답변:
- 지구는 중력이 모든 방향에서 물질을 중심으로 끌어당기기 때문에 구형이 되며, 자전에 의해 적도가 다소 부풀어 있는 타원체입니다.
- 특징: 다양한 사고 경로 후, 일관성 높은 응답 선택. 정답률 상승.
요약 비교
Zero-shot 간단, 직관적 빠름 복잡한 문제에 취약 One-shot 예시 따라감 간결함 유연성 낮음 Few-shot 구조화된 설명 정확도↑ 토큰↑ CoT 단계별 추론 논리적 길어짐 Role 상황 맞춤형 톤 조절 맥락 중요 ReAct 툴 활용 가능 정확성↑ 시스템 필요 Self-Consistency 다각도 사고 정답률↑ 시간, 비용
- 참조
: https://blogs.nvidia.co.kr/blog/what-are-foundation-models/
파운데이션 모델이란 무엇인가? | NVIDIA Blog
1956년에 마일즈 데이비스 퀸텟(Miles Davis Quintet)은 프레스티지 레코드 사의 스튜디오에서 라이브 연주를 녹음하고 있었습니다.
blogs.nvidia.co.kr
반응형
'IT 상식' 카테고리의 다른 글
Virtual Box, Hyper-V 실행 설정 (0) | 2021.05.28 |
---|---|
TCP/IP 프로토콜 개요 (0) | 2021.01.04 |
DHCP 프로토콜 동작 원리 (0) | 2020.12.14 |
TCP 통신 중 TIME_WAIT 개념 (0) | 2020.12.10 |
파티션 형식 변경(MBR, GPT) (0) | 2020.12.04 |