Как это работает? Технические основы

Основы нейросетей

Упрощенно, в основе современных LLM лежит операция перемножения матриц. Модель — это граф с:

  • Входным слоем (ваш промт, контекст).
  • Множеством скрытых (промежуточных) слоев.
  • Выходным слоем (ответ модели).

wiki/Neural_network

Провайдеры и модели

Существует множество провайдеров: OpenAI (GPT), Anthropic (Claude), Google (Gemini), Meta (Llama), Mistral и многие другие. У каждого — своя линейка моделей разного размера и capability.

openrouter.ai/rankings

Характеристики моделей

  • Размер: Современные крупные модели имеют более триллиона параметров. Это позволяет им предсказывать не только следующее слово, но и сложные смысловые конструкции.
  • Контекстное окно: Определяет объем текста (в токенах), который модель может «увидеть» за раз. Критически важно для работы с большими кодовыми базами. Размер токена зависит от языка (~1 токен = 0.75 слова на англ., ~1-2 символа на русск.).
  • Размышляющие модели (Reasoning): Модели, которые учатся делать последовательные выводы, дополняя контекст своими «рассуждениями».

artificialanalysis

Подходы к работе с LLM

  1. Промтинг:
    • Zero-shot: Просто задать вопрос.
    • One-shot: Дать пример ответа.
    • Chain-of-thought: Попросить модель рассуждать шаг за шагом.
  2. Контекст-инжиниринг: Наиболее важен для разработки. Это искусство подачи модели релевантного контекста (вашего кода, документации, спецификации) для получения точного ответа. Важнее, чем идеальный промт.

prompt-engineering

context-engineering

Агенты

Агент — это LLM, помещенная в цикл принятия решений, с доступом к инструментам (Tools).

  • Агентная система сама решает, какой инструмент вызвать, вызывает его, получает результат и передает его обратно модели.
  • Именно агенты превращают LLM из «болтушки» в мощный инструмент для автоматизации разработки.

building-effective-agents