llm

Public (or OSS)

LLaMa — языковая модель от Facebook: https://ai.facebook.com/blog/large-language-model-llama-meta-ai/

LMSYS Projects: https://lmsys.org/projects/

У LMSYS есть проект над LLM от Facebook (LLaMa) над векторами от Vicuna: https://github.com/lm-sys/FastChat#fine-tuning-vicuna-7b-with-local-gpus

Можно использовать в своих целях: пару месяцев обучения на корпусе (есть есть вычислительные мощности), проверка экспертов, дообучение. Если для себя, то можно взять уже готовые модели, например, Vicuna model

MoonshotAI, модель Kimi

Proprietary

  • OpenAI

    • Модели: https://platform.openai.com/docs/models

      • gpt-4.1, gpt-5, gpt-5.1 и gpt-5-pro: text and image to text, самые дорогие

        • 4.1 — можно дообучать на примерах (fine-tuning)

        • 5-pro — супер рассуждающая

      • gpt-5-nano — самая дешевая и быстрая версия gpt-5. Подходит для тасков суммаризации и классификации

      • gpt-5-mini — подороже gpt-5-nano, хороша для хорошо сформулированных задач и точных промптов

      • gpt-oss-20b и gpt-oss-120b — две модели text-to-text с открытыми весами

        • oss-120b сопоставима с o4-mini

  • Anthropic — Claude

    • Claude 3 Opus: мощная и дорогая модель, для сложных задач

    • Claude 3 Sonnet: сбалансированная модель, для масштабируемых сценариев

    • Claude 3 Haiku: быстрая и компактная модель

    • Есть свой пакет — pip install anthropic

  • Cohere: поддерживает порядка 10 языков, а не только английский

    • Модели Command R / Command R+

  • Google — Gemini (ранее Bard) на основе языковой модели LaMDA

    • Gemini 2.5 Pro: большое контекстное окно, что делает модель подходящей для задач обработки большого массива данных

    • Gemini 2.5 Flash: облегченная версия Gemini 2.5 Pro

  • xAI — Grok 4

  • Alibaba — Qwen и QwQ

    • Здесь можно попробовать Qwen и QwQ: https://huggingface.co/Qwen

    • Qwen — основная модель общего назначения

    • QwQ — reasoning-модель

  • Zhipu AI: https://z.ai

Others

ByteDance:

Tencent:

Kolors: https://github.com/Kwai-Kolors — исследовательская команда Kuaishou/Kwai

Alibaba PAI: https://huggingface.co/alibaba-pai/models

Microsoft: https://huggingface.co/microsoft/models

Apple: https://huggingface.co/apple/models

Beijing Academy of AI: https://huggingface.co/BAAI/models

Shenzhen Institute of Data Economy (IDEA Research): https://huggingface.co/IDEA-CCNL/models

ETRI Vision Intelligence Lab: https://huggingface.co/etri-vilab/models

Last updated