美格知识库

❯

❯

Constitutional AI（宪法 AI）

Constitutional AI（宪法 AI）

2026年5月21日1分钟阅读

AI安全
Anthropic
训练方法
对齐

定义

Constitutional AI（宪法 AI）是 Anthropic 开发的一种 AI 训练方法，旨在通过一套明确的指导原则（Constitution）来引导模型行为，减少对人类反馈的单纯依赖。

核心原理

模型根据一套书面原则（如”有帮助”、“无害”、“诚实”）进行自我评估和修正
结合 RLHF 与基于规则的自我监督
目标是创建更可控、更可解释的 AI 系统

关联连接

Anthropic — Anthropic 公司及其 AI 安全研究
Claude — Claude 模型使用 Constitutional AI 训练
Prompt_Engineering — 提示工程总览
摘要-anthropic-prompting-best-practices — Anthropic 最佳实践

关系图谱

定义
核心原理
关联连接

反向链接

Anthropic
CL4R1T4S（AI 系统提示词泄露档案库）
index
log
CL4R1T4S：AI 系统提示词泄露档案库（26.2k Stars）

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community