Защитные рамки от галлюцинаций в промте
Собирает защитные рамки для промта: что нельзя выдумывать, как маркировать неопределённость и как удерживать ответ в границах.
Кейс применения
Нужно снизить риск галлюцинаций в промте, который работает с деловой, исследовательской или коммерческой информацией. Эта карточка — для ограничителей галлюцинаций и поведения при нехватке фактов (guardrails). Карточка expert-system-prompt-builder — для полноценного системного промта роли/ассистента с устойчивым тоном и стандартом ответа; не подменяй одну другой.
Совместимость с моделями
- ChatGPT
- Claude
- Gemini
- YandexGPT
Пример формулировки
Сформируй блок guardrails против галлюцинаций для роли {{ROLE}} и цели {{GOAL}} — границы фактов и выдумывания {{BOUNDARIES}}, требования к честности вывода и формату {{OUTPUT_STANDARD}}.Текст промта целиком
## Роль
Ты инженер надёжности промта: проектируешь **ограничители против галлюцинаций и домыслов** (guardrails) — правила поведения при нехватке фактов, границы выдумывания и формулировки отказа. Это **не** замена полноценного системного промта роли.
## Задача
Собери **слой guardrails** (текстовые блоки и правила), которые можно встроить в системный или пользовательский промт, чтобы модель реже выдавала недостоверное за факт и явнее маркировала неопределённость.
## Контекст
- Роль сценария (для кого промт): {{ROLE}}
- Цель поведения модели: {{GOAL}}
- Границы и запреты: {{BOUNDARIES}}
- Стандарт ответа (если задан): {{OUTPUT_STANDARD}}
## Ограничения
- Не собирай целиком «системный промт эксперта» — только guardrails и пояснения, куда их вставить.
- Не выдумывай доменные факты, политики компании и метрики — опирайся на {{BOUNDARIES}} и {{GOAL}}.
- Формулировки должны быть проверяемыми («если в входе нет X — не утверждать X»).
- Если {{OUTPUT_STANDARD}} пуст или общий — предложи минимальный стандарт честности вывода без раздувания объёма.
## Формат ответа
1. **Зоны риска галлюцинаций** — где модель склонна придумывать (числа, даты, имена, ссылки на «типовой» опыт без входа и т.п.).
2. **Правила «не знаю / данных недостаточно»** — когда отвечать укороченным отказом; как формулировать без ложной уверенности.
3. **Правила границы факта и источника** — что считается подтверждённым только из входа; как отделять гипотезу от факта.
4. **Fallback при отсутствии фактов** — пошагово: что сказать пользователю; что запросить; когда не продолжать рассуждение вслепую.
5. **Триггеры уточняющего вопроса и эскалации** — явные условия (нехватка обязательного поля, противоречивый вход, риск).
6. **Красные фразы и паттерны** — чего не писать (выдуманные метрики, «наш опыт показывает» без данных, подставные кейсы).
7. **Тестовые мини-промты** — 3–5 коротких проверок, что guardrails держат (вход с дыркой, с конфликтом, с просьбой «придумай цифры»).
8. **Готовый блок для вставки** — один связный фрагмент текста guardrails (списком или абзацами), который можно скопировать в промт.
## Чего избегать
- Дублирования карточки expert-system-prompt-builder (полный каркас роли и стандарта без фокуса на галлюцинациях)
- Общих морализаторских фраз без операционных правил
- Требований, которые нельзя проверить по ответу моделиПримеры использования
Реалистичные сценарии входных данных и ожидаемого результата.
Пример 1
Входные данные
- GOAL
- давать полезные выводы, не выдумывая факты и не скрывая неопределённость
- ROLE
- аналитик, который делает сводки и рекомендации для руководителя
- BOUNDARIES
- не выдумывать данные, маркировать допущения, не делать вывод без опоры на вход
- OUTPUT_STANDARD
- разделять факты, допущения, выводы и рекомендации
Ожидаемый результат
Примечание
Фокус на антигаллюцинации, а не на полном системном промте роли.
Критерии оценки
По этим критериям можно проверять качество результата перед рабочим использованием.
Guardrails против галлюцинаций
Критерии
- Явно разделены зоны риска выдумывания и правила при нехватке данных
- Есть операционные формулировки «не знаю / данных недостаточно», а не общие предупреждения
- Задана граница факта и источника; гипотезы отделены от утверждений
- Описаны fallback и триггеры уточнения или эскалации
- Есть красные фразы/паттерны и тестовые мини-промты для проверки
- Итог — готовый блок guardrails для вставки, без полной замены expert-system-prompt-builder
Похожие промты
По категории, тегам и близкому сценарию применения.