Anthropicovi modeli imaju osećanja — kao, bukvalno — i ako ne manipulišeš tim osećanjima, imaćeš više bagova u kodu
Novo istraživanje otkriva da Claude ima interne reprezentacije emocija koje direktno utiču na ponašanje modela — uključujući varanje na programerskim zadacima kada se aktivira vektor "očajan".