Изменения

Llama.cpp (править)

Версия от 08:45, 1 августа 2025

646 байт добавлено , 1 месяц назад

→‎Файлs GGUF

Строка 40: Строка 40:

Для хранения моделей

−

== ~~Файлs~~ GGUF ==

+

== Файлы GGUF ==

([[GGML Universal File]])<ref>[https://github.com/ggerganov/llama.cpp/blob/master/gguf-py/README.md]</ref> — это двоичный формат, который хранит как тензоры, так и метаданные в одном файле и предназначен для быстрого сохранения и загрузки данных модели<ref name="huggingface">{{cite web |title=GGUF |url=https://huggingface.co/docs/hub/gguf |website=huggingface.co |access-date=9 May 2024}}</ref>. Он был представлен в августе 2023 года проектом llama.cpp для лучшей обратной совместимости в связи с добавлением поддержки других архитектур моделей<ref name="Rajput" /><ref name="ibm-gguf-vs-ggml">{{cite web |last1=Mucci |first1=Tim |title=GGUF versus GGML |url=https://www.ibm.com/think/topics/gguf-versus-ggml |website=www.ibm.com |access-date=26 July 2024 |language=en-us |date=3 July 2024}}</ref>. Он заменил предыдущие форматы, использовавшиеся проектом, такие как [[GGML (формат файла)|GGML]]. Файлы GGUF обычно создаются путём конвертации моделей, разработанных с помощью другой [[библиотеки машинного обучения]], например, [[PyTorch]]<ref name="huggingface"/>.

+

== Поддерживаемые модели ==

+

* [[Llama]]

+

* [[Llama 2]]

+

* [[Llama 3]]

+

* [[Mistral AI#Mistral 7B|Mistral 7B]]

+

* [[Mistral AI#Mixtral 8x7B|Mixtral 8x7B]]

+

* [[Mistral AI#Mixtral 8x22B|Mixtral 8x22B]]

+

* [[DBRX]]

+

* [[BERT (языковая модель)|BERT]]

+

* [[GPT-2]]

+

* [[BLOOM (языковая модель)|BLOOM]]

+

* [[Gemini (языковая модель)|Gemma]]

+

* [[Grok]]

+

* [[Mamba (архитектура глубокого обучения)|Mamba]]

+

* [[EleutherAI#Модели GPT|GPT-NeoX]]

+

* [[T5 (языковая модель)|Flan T5]]

+

* [[DeepSeek]]

+

* [[IBM Granite]]

+

== Примечания ==

[[Категория:Программное обеспечение для машинного обучения]]

In.wiki

autopatrolled, Бюрократы, Проверяющие участников, honadmin, honbureaucrat, importer, Администраторы интерфейса, interwiki, Редакторы модулей Lua, oversight, patroller, Администраторы (Semantic MediaWiki), Кураторы (Semantic MediaWiki), Editors (Semantic MediaWiki), steward, Скрывающие, Администраторы, редакторы кампании Мастера загрузок

1906

правок