llm

Public (or OSS)

LLaMa — языковая модель от Facebook: https://ai.facebook.com/blog/large-language-model-llama-meta-ai/

LMSYS Projects: https://lmsys.org/projects/

У LMSYS есть проект над LLM от Facebook (LLaMa) над векторами от Vicuna: https://github.com/lm-sys/FastChat#fine-tuning-vicuna-7b-with-local-gpus

Можно использовать в своих целях: пару месяцев обучения на корпусе (есть есть вычислительные мощности), проверка экспертов, дообучение. Если для себя, то можно взять уже готовые модели, например, Vicuna model

Kimi

GPT OSS

Proprietary

Others

ByteDance:

Tencent:

Kolors: https://github.com/Kwai-Kolors — исследовательская команда Kuaishou/Kwai

Alibaba PAI: https://huggingface.co/alibaba-pai/models

Microsoft: https://huggingface.co/microsoft/models

Apple: https://huggingface.co/apple/models

Beijing Academy of AI: https://huggingface.co/BAAI/models

Shenzhen Institute of Data Economy (IDEA Research): https://huggingface.co/IDEA-CCNL/models

ETRI Vision Intelligence Lab: https://huggingface.co/etri-vilab/models

Last updated