llm

Public (or OSS)

LLaMa — языковая модель от Facebook: https://ai.facebook.com/blog/large-language-model-llama-meta-ai/

LMSYS Projects: https://lmsys.org/projects/

У LMSYS есть проект над LLM от Facebook (LLaMa) над векторами от Vicuna: https://github.com/lm-sys/FastChat#fine-tuning-vicuna-7b-with-local-gpus

Можно использовать в своих целях: пару месяцев обучения на корпусе (есть есть вычислительные мощности), проверка экспертов, дообучение. Если для себя, то можно взять уже готовые модели, например, Vicuna model

MoonshotAI, модель Kimi

Proprietary

OpenAI
- Модели: https://platform.openai.com/docs/models
  - gpt-4.1, gpt-5, gpt-5.1 и gpt-5-pro: text and image to text, самые дорогие
    4.1 — можно дообучать на примерах (fine-tuning)
    5-pro — супер рассуждающая
  - gpt-5-nano — самая дешевая и быстрая версия gpt-5. Подходит для тасков суммаризации и классификации
  - gpt-5-mini — подороже gpt-5-nano, хороша для хорошо сформулированных задач и точных промптов
  - gpt-oss-20b и gpt-oss-120b — две модели text-to-text с открытыми весами
    oss-120b сопоставима с o4-mini
Anthropic — Claude
- Claude 3 Opus: мощная и дорогая модель, для сложных задач
- Claude 3 Sonnet: сбалансированная модель, для масштабируемых сценариев
- Claude 3 Haiku: быстрая и компактная модель
- Есть свой пакет — pip install anthropic
Cohere: поддерживает порядка 10 языков, а не только английский
- Модели Command R / Command R+
Google — Gemini (ранее Bard) на основе языковой модели LaMDA
- Gemini 2.5 Pro: большое контекстное окно, что делает модель подходящей для задач обработки большого массива данных
- Gemini 2.5 Flash: облегченная версия Gemini 2.5 Pro
xAI — Grok 4
DeepSeek (на huggingface)
Alibaba — Qwen и QwQ
- Здесь можно попробовать Qwen и QwQ: https://huggingface.co/Qwen
- Qwen — основная модель общего назначения
- QwQ — reasoning-модель
Perplexity: https://docs.perplexity.ai/getting-started/pricing#sonar-models-chat-completions
- Модель Sonar и другие
Zhipu AI: https://z.ai
- Модель GLM: https://z.ai/blog/glm-4.5
- Можно попробовать через OpenRouter / huggingFace