Изменения

646 байт добавлено ,  1 месяц назад
Строка 40: Строка 40:  
Для хранения моделей  
 
Для хранения моделей  
   −
== Файлs GGUF ==
+
== Файлы GGUF ==
 
{{Основная статья|GGUF}}
 
{{Основная статья|GGUF}}
 
([[GGML Universal File]])<ref>[https://github.com/ggerganov/llama.cpp/blob/master/gguf-py/README.md]</ref> — это двоичный формат, который хранит как тензоры, так и метаданные в одном файле и предназначен для быстрого сохранения и загрузки данных модели<ref name="huggingface">{{cite web |title=GGUF |url=https://huggingface.co/docs/hub/gguf |website=huggingface.co |access-date=9 May 2024}}</ref>. Он был представлен в августе 2023 года проектом llama.cpp для лучшей обратной совместимости в связи с добавлением поддержки других архитектур моделей<ref name="Rajput" /><ref name="ibm-gguf-vs-ggml">{{cite web |last1=Mucci |first1=Tim |title=GGUF versus GGML |url=https://www.ibm.com/think/topics/gguf-versus-ggml |website=www.ibm.com |access-date=26 July 2024 |language=en-us |date=3 July 2024}}</ref>. Он заменил предыдущие форматы, использовавшиеся проектом, такие как [[GGML (формат файла)|GGML]]. Файлы GGUF обычно создаются путём конвертации моделей, разработанных с помощью другой [[библиотеки машинного обучения]], например, [[PyTorch]]<ref name="huggingface"/>.
 
([[GGML Universal File]])<ref>[https://github.com/ggerganov/llama.cpp/blob/master/gguf-py/README.md]</ref> — это двоичный формат, который хранит как тензоры, так и метаданные в одном файле и предназначен для быстрого сохранения и загрузки данных модели<ref name="huggingface">{{cite web |title=GGUF |url=https://huggingface.co/docs/hub/gguf |website=huggingface.co |access-date=9 May 2024}}</ref>. Он был представлен в августе 2023 года проектом llama.cpp для лучшей обратной совместимости в связи с добавлением поддержки других архитектур моделей<ref name="Rajput" /><ref name="ibm-gguf-vs-ggml">{{cite web |last1=Mucci |first1=Tim |title=GGUF versus GGML |url=https://www.ibm.com/think/topics/gguf-versus-ggml |website=www.ibm.com |access-date=26 July 2024 |language=en-us |date=3 July 2024}}</ref>. Он заменил предыдущие форматы, использовавшиеся проектом, такие как [[GGML (формат файла)|GGML]]. Файлы GGUF обычно создаются путём конвертации моделей, разработанных с помощью другой [[библиотеки машинного обучения]], например, [[PyTorch]]<ref name="huggingface"/>.
 +
 +
== Поддерживаемые модели ==
 +
{{div col|colwidth=15em}}
 +
* [[Llama]]
 +
* [[Llama 2]]
 +
* [[Llama 3]]
 +
* [[Mistral AI#Mistral 7B|Mistral 7B]]
 +
* [[Mistral AI#Mixtral 8x7B|Mixtral 8x7B]]
 +
* [[Mistral AI#Mixtral 8x22B|Mixtral 8x22B]]
 +
* [[DBRX]]
 +
* [[BERT (языковая модель)|BERT]]
 +
* [[GPT-2]]
 +
* [[BLOOM (языковая модель)|BLOOM]]
 +
* [[Gemini (языковая модель)|Gemma]]
 +
* [[Grok]]
 +
* [[Mamba (архитектура глубокого обучения)|Mamba]]
 +
* [[EleutherAI#Модели GPT|GPT-NeoX]]
 +
* [[T5 (языковая модель)|Flan T5]]
 +
* [[DeepSeek]]
 +
* [[IBM Granite]]
 +
{{div col end}}
    
== Примечания ==
 
== Примечания ==
 
[[Категория:Программное обеспечение для машинного обучения]]
 
[[Категория:Программное обеспечение для машинного обучения]]