ZS предоставляет формальные конструкции для описания процессов рассуждения — не как жёсткие инструкции, а как композируемые когнитивные операции с переменными, управлением потоком и форматированием результатов.
Думайте об этом как о SQL для мышления: вы определяете какие когнитивные шаги предпринять, LLM решает как их выполнить.
Скрипты исполняются LLM в роли интерпретатора: модель читает файл .zobr,
выполняет операции шаг за шагом, отслеживает переменные, следует управлению потоком
и формирует структурированный вывод.
Плюс: переменные, управление потоком for/if/loop,
пользовательские функции (define), yield, импорт,
ссылки @last/@N.
ZS — это усилитель рассуждений, а не тест возможностей. Он не делает слабые модели сильными — он делает все модели структурированными. Выполнение ZS-скрипта моделью Haiku даёт более полезный результат, чем свободный ответ Haiku на тот же вопрос, потому что скрипт заставляет модель декомпозировать рассуждение, показывать ход мысли и форматировать выводы. Бенчмарк подтверждает: даже самая маленькая модель следует ZS-скриптам с 92.5% структурной точностью.
Когда структура рассуждения задана извне скриптом, задача модели смещается от организации мышления к наполнению контейнеров содержанием. Именно поэтому Sonnet достигает почти паритета с Opus (9.3 vs 9.4) — структурированные скрипты сжимают разрыв возможностей между уровнями моделей.
Закодируйте лучший аналитический процесс один раз как .zobr-скрипт,
затем применяйте к новым данным. Скрипт анализа политических новостей работает с любой статьёй.
Скрипт due diligence — с любой компанией. Паттерн рассуждения многоразовый —
меняется только содержание.
Пример: news-analysis.zobr прогоняет один и тот же 6-фазный пайплайн
(ground → стейкхолдеры → мотивы → разрыв нарратива → cui bono → слепые пятна)
по каждой статье, гарантируя, что ничего не упущено.
ZS-скрипты делают рассуждения аудируемыми. Вместо ответа-чёрного-ящика от LLM
вы получаете размеченные операции ([doubt], [contrast])
с видимым потоком переменных. Можно проверить, что модель действительно рассмотрела
контраргументы, а не просто сгенерировала односторонний вывод.
Критично для compliance, юридического анализа, медицинских рассуждений — везде, где нужно показать как достигнут вывод, а не только что это за вывод.
Бенчмарк показывает: разным задачам нужны разные модели. Используйте Haiku для структурных задач (обзоры, извлечение фактов) в 2.5× быстрее, Sonnet для большинства аналитических задач, Opus только для глубоких диалектических рассуждений. ZS-скрипты делают этот роутинг явным: один скрипт работает на любой модели.
Генерируйте скрипты через Sonnet (лучшая архитектура), исполняйте через Haiku в масштабе — валидные структурированные рассуждения за долю стоимости.
Когда агент в ходе разговора демонстрирует выдающееся рассуждение,
паттерн мышления можно дистиллировать в .zobr-скрипт —
многоразовый артефакт. Бенчмарк доказывает: все три модели способны генерировать
валидные параметризованные скрипты (задача 05: 0 ошибок у всех моделей).
Двойное назначение: люди пишут скрипты как задания для LLM,
агенты экспортируют свои рассуждения в файлы .zobr для повторного использования.
ZS экстернализирует структуру строгого мышления: survey перед утверждением, doubt своих собственных утверждений, contrast с сильнейшим контраргументом, synthesize — а не резюмировать. Студенты и аналитики могут освоить эти паттерны, читая и создавая скрипты.
Шаблон dialectical.zobr учит итеративному уточнению тезиса
лучше, чем параграф учебника о диалектике.
ZS-скрипты могут служить общими протоколами между агентами.
Один агент выполняет survey и ground,
другой — doubt и contrast,
третий synthesize результаты.
Скрипт определяет workflow; агенты наполняют операции.
Часть экосистемы федеративного со-мышления Black Zobr.
steelman и devils_advocate с prompt, доступ через точку (attack.damage_level), ветвление if/else..zobr-скрипт,
кодирующий паттерн рассуждения, и валидирует его через zobr-check. Тестирует качество содержания и генерации ZS-кода.
claude -p (headless-режим)--effort high для единообразной глубины мышленияevaluate-benchmark.zobr — ZS-скрипт, оценивающий результаты ZS (мета-оценка)15 запусков (5 задач × 3 модели), 0 сбоев. Общее время бенчмарка: ~48 минут.
| Задача | Измерение | Opus 4.6 | Sonnet 4.6 | Haiku 4.5 |
|---|---|---|---|---|
| 01 — Простой пайплайн | Структура | 10 | 10 | 9 |
| Содержание | 9 | 8 | 7 | |
| Итого | 9.5 | 9.0 | 8.0 | |
| 02 — Диалектика | Структура | 10 | 10 | 9 |
| Содержание | 9 | 9 | 6 | |
| Итого | 9.5 | 9.5 | 7.5 | |
| 03 — Функции | Структура | 10 | 10 | 9 |
| Содержание | 9 | 9 | 7 | |
| Итого | 9.5 | 9.5 | 8.0 | |
| 04 — Анализ новостей | Структура | 10 | 10 | 10 |
| Содержание | 9 | 9 | 7 | |
| Итого | 9.5 | 9.5 | 8.5 | |
| 05 — Рефлексия | Содержание | 9 | 9 | 7 |
| Генерация | 9 | 9 | 8 | |
| Итого | 9.0 | 9.0 | 7.5 |
Все три модели следуют ZS-скриптам с высокой точностью (9.25–10.0). Операции выполняются по порядку, переменные отслеживаются, управление потоком соблюдается. Разрыв в 0.75 балла — косметический, не семантический.
Разрыв Opus–Haiku достигает 3 баллов на задаче 02 (итеративное уточнение, доменные знания, эмерджентный синтез). Структурные задачи показывают меньший разрыв. ZS усиливает рассуждение там, где оно сложнее всего.
Структурированные скрипты сокращают разрыв возможностей между уровнями. Когда структура рассуждения задана извне, задача модели сводится к наполнению контейнеров содержанием — и Sonnet справляется почти так же хорошо.
Все три файла reflection.zobr проходят zobr-check с 0 ошибками. Способность к генерации масштабируется вместе с интерпретацией — нет «штрафа за генерацию». Генерация ZS-скриптов — практичный рабочий процесс.
| Сценарий | Модель | Почему |
|---|---|---|
| Структурные задачи (извлечение, классификация, survey) | Haiku | В 1.7× быстрее Opus; структурное соответствие ~идеальное |
| Диалектические рассуждения (doubt, contrast, reframe) | Opus | Наибольший разрыв в глубине на итеративных задачах |
| Анализ новостей / политический анализ | Sonnet Opus | Оба на экспертном уровне; Sonnet добавляет критику источника |
| Генерация скриптов | Sonnet | Самая сложная архитектура; полная универсальность |
| Массовая пакетная обработка | Haiku | В 2.5× быстрее Sonnet; валидные рассуждения в масштабе |
| Философия / глубокий анализ | Opus | Широчайшая база ссылок; самые оригинальные фреймворки |