Chain-of-Thought (CoT) Prompting
Definiție
Chain-of-Thought (CoT) Prompting este o tehnică avansată care solicită modelului să explice raționamentul pas cu pas înainte de a oferi răspunsul final.
Principiul de bază
În loc să cerem doar răspunsul, cerem și procesul de gândire care duce la acel răspuns.
Comparație: Standard vs Chain-of-Thought
Prompt Standard
Question: Ana has 6 apples. She used 3 apples to make a cake.
Later that day she gave 1 apple to her friend Maria, and she
received 2 from her brother. How many apples does Ana have left?
Answer: The answer is 4 apples.
Problema: Modelul învață să dea răspunsul direct, fără raționament.
Prompt Chain-of-Thought
Question: Ana has 6 apples. She used 3 apples to make a cake.
Later that day she gave 1 apple to her friend Maria, and she
received 2 from her brother. How many apples does Ana have left?
Answer: Ana started with 6 apples.
6 apples minus 3 apples for the cake equals 3 apples.
3 apples minus 1 apple for Maria equals 2 apples.
2 apples plus 2 apples from her brother equals 4 apples.
The answer is 4 apples.
Avantaj: Modelul învață procesul, nu doar rezultatul.
Structura CoT
[Problemă]
[Pas 1: primul element al raționamentului]
[Pas 2: al doilea element]
...
[Pas N: ultimul element]
[Răspuns final]
Variante de Chain-of-Thought
1. Few-Shot CoT
Oferă exemple cu raționament complet:
Q: Problem 1
A: Step 1... Step 2... Final answer.
Q: Problem 2
A: Step 1... Step 2... Final answer.
Q: New problem
A:
2. Zero-Shot CoT
Adaugă instrucțiunea “Let’s think step by step”:
Q: Complex problem here.
A: Let's think step by step.
3. Self-Consistency CoT
Generează multiple raționamente și alege răspunsul cel mai frecvent.
De ce funcționează?
Analogie cu gândirea umană:
- Descompunere - problema mare devine pași mici
- Verificare - fiecare pas poate fi validat
- Reducere erori - erorile sunt vizibile
- Transparență - procesul este explicabil
Tehnic:
- Forțează modelul să aloce mai mulți tokeni problemei
- Activează cunoștințe intermediare
- Reduce “săriturile” în raționament
Când să folosești CoT?
Excelent pentru:
- Probleme matematice și de calcul
- Raționament logic multi-pas
- Probleme de decizie complexe
- Analiza pro și contra
- Debugging cod
Mai puțin util pentru:
- Întrebări factuale simple
- Sarcini creative
- Clasificări simple
Exemple practice
Debugging:
This code produces an error. Let's debug step by step:
1. First, I'll identify what the code should do...
2. Next, I'll trace through line by line...
3. The error occurs because...
4. The fix is...
Decizie:
Should I accept this job offer? Let's think step by step:
1. Current situation analysis...
2. New opportunity evaluation...
3. Pros and cons comparison...
4. Final recommendation...
Bune practici
- Folosește exemple cu raționament complet
- Structurează pașii clar (numerotare, bullets)
- Verifică fiecare pas - erorile se propagă
- Adaptează complexitatea la problemă
- Combină cu alte tehnici (Persona, Constraints)
Limitări
- Consumă mai mulți tokeni
- Nu garantează corectitudinea - doar transparența
- Poate complica probleme simple
- Raționamentul poate fi greșit chiar dacă pare logic
De reținut
Chain-of-Thought transformă modelul dintr-o “cutie neagră” într-un partener de raționament transparent. Este esențial pentru probleme complexe unde procesul este la fel de important ca rezultatul.
Întrebări de verificare
- Ce diferențiază Chain-of-Thought de prompting-ul standard?
- De ce expunerea raționamentului îmbunătățește rezultatele?
- Când este CoT cel mai eficient?
- Care sunt limitările Chain-of-Thought?