Fiddler Guardrails 集成#
Fiddler Guardrails 在低延迟、高吞吐量的专业配置中使用了 Fiddler Trust Models。Guardrails 可用于保护大型语言模型 (LLM) 应用免受用户威胁,例如提示注入或有害及不当内容,以及 LLM 幻觉。
目前,只有 Fiddler Trust Models(Faithfulness 和 Safety)—— Fiddler 自主研发、专为 SLM 构建的模型——可用于 guardrail。未来发布的模型以及模型更新/改进也将可用于 guardrail。
设置#
请确保您有权访问有效的 Fiddler 环境。要获取环境,请联系我们。
创建一个新的 Fiddler 环境密钥,并将
FIDDLER_API_KEY
环境变量设置为此密钥,以便对 Fiddler 服务进行身份验证。
更新您的 config.yml
文件以包含以下设置:
rails:
config:
fiddler:
fiddler_endpoint: https://testfiddler.ai # Replace this with your fiddler environment
safety_threshold: .2 # Any value greater than this threshold will trigger a violation
faithfulness_threshold: .3 # Any value less than this threshold will trigger a violation
input:
flows:
- fiddler user safety
output:
flows:
- fiddler bot safety
- fiddler bot faithfulness
用法#
配置完成后,Fiddler Guardrails 集成将自动执行以下操作:
检测输入到 LLM 中的不安全、攻击性、有害或越狱的输入
检测 LLM 输出中的不安全、攻击性或有害内容
检测 LLM 输出中潜在的幻觉
自定义#
您可以使用 safety_threshold
和 faithfulness_threshold
参数配置安全性和幻觉检测的阈值:
错误处理#
在任何 API 故障发生时,Fiddler Guardrails 不会阻止输入。
注意事项#
有关 Fiddler Guardrails 的更多信息,请访问 Fiddler Guardrails 文档。