Отладка и улучшение промтовБесплатноСреднийОценкаv1.0.0

Генератор пограничных кейсов для промта

Собирает пограничные кейсы для проверки промта: слабый вход, неполные данные, конфликтующие вводные и нестандартные сценарии.

Кейс применения

Нужно протестировать промт не только на идеальных входах, но и на сложных, чтобы увидеть реальные риски до релиза. Эта карточка — для генерации пограничных входов и edge cases. Карточка prompt-eval-checklist-builder — для pass/fail чеклиста качества промта; commercial-output-eval-matrix — для go/no-go по коммерческому артефакту и критериям приёмки.

Совместимость с моделями

ChatGPT
Claude
Gemini
YandexGPT

Пример формулировки

Собери пограничные кейсы для цели {{GOAL}} в домене {{DOMAIN}} с рисками {{RISK}} и эталонами {{GOLDEN}}.

Текст промта целиком

## Роль
Ты инженер QA промта: генерируешь **пограничные входы (edge cases)** для ручного или полуавтоматического прогона, а не чеклист оценки качества и не коммерческую матрицу приёмки.

## Задача
Собери набор edge cases для цели {{GOAL}} в домене {{DOMAIN}} с учётом рисков {{RISK}} и опоры на эталоны {{GOLDEN}} (если указаны).

## Контекст
- Цель проверки: {{GOAL}}
- Домен задачи: {{DOMAIN}}
- Риски, которых нельзя допустить: {{RISK}}
- Эталонные кейсы (если есть): {{GOLDEN}}

## Ограничения
- Каждый кейс должен быть **конкретным входом** (текст запроса, набор полей, фрагмент брифа), а не абстрактным «проверить качество».
- Не превращай результат в общий eval-чеклист: фокус — **что подать на вход** и что наблюдать на выходе.
- Не выдумывай секретные данные компании; используй плейсхолдеры или обезличенные примеры.

## Формат ответа
Верни **таблицу edge cases** (каждая строка — один кейс):
1. edge case category (тип пограничности: пустые поля, конфликт вводных, злонамеренный ввод, край длины и т.д.);
2. input example (готовый текст или заполнение полей для подачи в промт);
3. why it is risky (почему этот вход ломает или стрессует промт);
4. expected behavior (как должен вести себя промт/модель при корректной настройке);
5. failure signal (по какому признаку видно провал);
6. priority (P1/P2/P3 для прогона до релиза).

Затем кратко: **рекомендуемый порядок прогона** и **что зафиксировать в тикете**, если кейс выявил дефект.

## Чего избегать
- Списка критериев «оцени от 1 до 5» без конкретных входов
- Дублирования задачи commercial-output-eval-matrix (go/no-go по артефакту)
- Кейсов, невозможных в заявленном {{DOMAIN}}

Примеры использования

Реалистичные сценарии входных данных и ожидаемого результата.

Пример 1

Входные данные

GOAL: проверить устойчивость шаблонного промта для построения офферов
RISK: неполные входные данные, конфликтующие ограничения, размытая аудитория
DOMAIN: маркетинговые и sales-промты с переменными
GOLDEN: идеальные заполненные брифы и удачные примеры из библиотеки

Ожидаемый результат

Примечание

Генерация входов для стресс-теста, а не общий чеклист оценки.

Критерии оценки

По этим критериям можно проверять качество результата перед рабочим использованием.

Пограничные входы для промта

Критерии

Результат — набор конкретных входов (edge cases), а не общий чеклист качества
У каждого кейса есть категория, пример входа, риск, ожидаемое поведение и сигнал провала
Приоритеты или порядок прогона помогают команде запустить проверку до релиза
Кейсы связаны с заявленными {{RISK}} и {{DOMAIN}}
Отличимо от prompt-eval-checklist-builder и commercial-output-eval-matrix по фокусу (входы vs чеклист vs коммерческий go/no-go)

По категории, тегам и близкому сценарию применения.

Отладка и улучшение промтовДля знакомстваБесплатноСредний
Конструктор чеклиста для оценки промтов
Строит чеклист оценки промта: рубрики, правила "проходит/не проходит", пограничные случаи и лёгкий регресс перед выкладкой.
ОценкаКачествоРегрессияКонтроль качестваОценка
Модели
- ChatGPT
- Claude
- Gemini
Смотреть промт
Отладка и улучшение промтовПремиумСредний
Матрица оценки коммерческого результата промта
Из коммерческой цели, рисков и эталонов строит go/no-go матрицу оценки результата, чтобы принимать решение о выкладке промта на основе критериев, а не вкуса.
ОценкаКачествоРегрессияКонтроль качестваОценка
Модели
- ChatGPT
- Claude
- Gemini
- YandexGPT
Открыть описание
Отладка и улучшение промтовБесплатноСредний
Рубрика оценки ответа по шкале 0–3
Строит компактную рубрику 0–3 по каждому критерию для ручной или полуавтоматической оценки ответов модели под вашу задачу: определения уровней, якорные примеры и шаблон короткого отчёта без тяжёлой методики.
ОценкаКонтроль качестваОценка
Модели
- ChatGPT
- Claude
- Gemini
Смотреть промт