llm
Public (or OSS)
LLaMa — языковая модель от Facebook: https://ai.facebook.com/blog/large-language-model-llama-meta-ai/
LMSYS Projects: https://lmsys.org/projects/
У LMSYS есть проект над LLM от Facebook (LLaMa) над векторами от Vicuna: https://github.com/lm-sys/FastChat#fine-tuning-vicuna-7b-with-local-gpus
Можно использовать в своих целях: пару месяцев обучения на корпусе (есть есть вычислительные мощности), проверка экспертов, дообучение. Если для себя, то можно взять уже готовые модели, например, Vicuna model
MoonshotAI, модель Kimi
Proprietary
OpenAI
Модели: https://platform.openai.com/docs/models
gpt-4.1, gpt-5, gpt-5.1 и gpt-5-pro: text and image to text, самые дорогие
4.1 — можно дообучать на примерах (fine-tuning)
5-pro — супер рассуждающая
gpt-5-nano — самая дешевая и быстрая версия gpt-5. Подходит для тасков суммаризации и классификации
gpt-5-mini — подороже gpt-5-nano, хороша для хорошо сформулированных задач и точных промптов
gpt-oss-20b и gpt-oss-120b — две модели text-to-text с открытыми весами
oss-120b сопоставима с o4-mini
Anthropic — Claude
Claude 3 Opus: мощная и дорогая модель, для сложных задач
Claude 3 Sonnet: сбалансированная модель, для масштабируемых сценариев
Claude 3 Haiku: быстрая и компактная модель
Есть свой пакет —
pip install anthropic
Cohere: поддерживает порядка 10 языков, а не только английский
Модели Command R / Command R+
Google — Gemini (ранее Bard) на основе языковой модели LaMDA
Gemini 2.5 Pro: большое контекстное окно, что делает модель подходящей для задач обработки большого массива данных
Gemini 2.5 Flash: облегченная версия Gemini 2.5 Pro
xAI — Grok 4
DeepSeek (на huggingface)
Alibaba — Qwen и QwQ
Здесь можно попробовать Qwen и QwQ: https://huggingface.co/Qwen
Qwen — основная модель общего назначения
QwQ — reasoning-модель
Perplexity: https://docs.perplexity.ai/getting-started/pricing#sonar-models-chat-completions
Модель Sonar и другие
Zhipu AI: https://z.ai
Модель GLM: https://z.ai/blog/glm-4.5
Можно попробовать через OpenRouter / huggingFace
Others
ByteDance:
Tencent:
Kolors: https://github.com/Kwai-Kolors — исследовательская команда Kuaishou/Kwai
Alibaba PAI: https://huggingface.co/alibaba-pai/models
Microsoft: https://huggingface.co/microsoft/models
Apple: https://huggingface.co/apple/models
Beijing Academy of AI: https://huggingface.co/BAAI/models
Shenzhen Institute of Data Economy (IDEA Research): https://huggingface.co/IDEA-CCNL/models
ETRI Vision Intelligence Lab: https://huggingface.co/etri-vilab/models
Last updated