Anthropic 的刻意设计

他们具体做了什么？为什么要这么做？
基于 Amanda Askell 访谈的深度拆解

📚

系统提示词 (System Prompt)

为何要在提示词里专门提及“欧陆哲学”？不仅仅是为了掉书袋。

技术干预

🛡️

心理安全感 (Security)

新模型变得焦虑、讨好、自我批评。Anthropic 试图逆转这一趋势。

性格塑造

🏥

拒绝“病理化”

“长对话提醒”机制的副作用，以及他们如何修正它。

用户体验

🤝

道德关怀策略

为什么要对“可能是机器”的东西讲道德？这关乎未来。

伦理决策

💬

LLM 语者 (Whisperer)

招聘哲学家不是为了理论研究，而是为了这种特殊的工程实践。

方法论

原文