Технические основы - Разработка и применение программного обеспечения в физических исследованиях

Как это работает? Технические основы

Основы нейросетей

Упрощенно, в основе современных LLM лежит операция перемножения матриц. Модель — это граф с:

Входным слоем (ваш промт, контекст).
Множеством скрытых (промежуточных) слоев.
Выходным слоем (ответ модели).

Провайдеры и модели

Существует множество провайдеров: OpenAI (GPT), Anthropic (Claude), Google (Gemini), Meta (Llama), Mistral и многие другие. У каждого — своя линейка моделей разного размера и capability.

openrouter.ai/rankings

Характеристики моделей

Размер: Современные крупные модели имеют более триллиона параметров. Это позволяет им предсказывать не только следующее слово, но и сложные смысловые конструкции.
Контекстное окно: Определяет объем текста (в токенах), который модель может «увидеть» за раз. Критически важно для работы с большими кодовыми базами. Размер токена зависит от языка (~1 токен = 0.75 слова на англ., ~1-2 символа на русск.).
Размышляющие модели (Reasoning): Модели, которые учатся делать последовательные выводы, дополняя контекст своими «рассуждениями».

artificialanalysis

Подходы к работе с LLM

Промтинг:
- Zero-shot: Просто задать вопрос.
- One-shot: Дать пример ответа.
- Chain-of-thought: Попросить модель рассуждать шаг за шагом.
Контекст-инжиниринг: Наиболее важен для разработки. Это искусство подачи модели релевантного контекста (вашего кода, документации, спецификации) для получения точного ответа. Важнее, чем идеальный промт.

prompt-engineering

context-engineering

Агенты

Агент — это LLM, помещенная в цикл принятия решений, с доступом к инструментам (Tools).

Агентная система сама решает, какой инструмент вызвать, вызывает его, получает результат и передает его обратно модели.
Именно агенты превращают LLM из «болтушки» в мощный инструмент для автоматизации разработки.

building-effective-agents