Алгоритм Бройдена — Флетчера — Гольдфарба — Шанно с ограниченным использованием памяти
![]() |
Это незавершённая статья. Вы можете помочь проекту, исправив и дополнив её. |
Limited-memory BFGS (L-BFGS, LBFGS, LM-BFGS, BFGS с ограниченной памятью) — это алгоритм оптимизации из семейства квазиньютоновских методов, который аппроксимирует алгоритм Бройдена — Флетчера — Гольдфарба — Шанно (BFGS), используя ограниченный объем компьютерной памяти[1]. Это популярный алгоритм для оценки параметров в машинном обучении[2][3].
Реалиуемая алгоритмом задача — минимизировать по неограниченным значениям действительного вектора , где — дифференцируемая скалярная функция.
Как и исходный BFGS, L-BFGS использует оценку обратной матрицы Гессе для управления поиском в пространстве переменных, но тогда как BFGS хранит плотное приближение к обратному Гессиану (n — число переменных в задаче), L-BFGS хранит только несколько векторов, которые неявно представляют приближение. Из-за его результирующего линейного требования к памяти, метод L-BFGS особенно хорошо подходит для задач оптимизации со многими переменными. Вместо обратного Гессе Hk, L-BFGS сохраняет историю последних m обновлений позиции x и градиента ∇f(x), где, как правило, размер истории m может быть небольшим (часто m < 10 {\displaystyle m<10} {\displaystyle m<10}). Эти обновления используются для неявного выполнения операций, требующих произведения Hk-векторов.
ПримечанияПравить
- ↑ Liu, D. C.; Nocedal, J. (1989). "On the Limited Memory Method for Large Scale Optimization". Mathematical Programming B. 45 (3): 503–528. CiteSeerX 10.1.1.110.6443. doi:10.1007/BF01589116. S2CID 5681609.
- ↑ Malouf, Robert (2002). "A comparison of algorithms for maximum entropy parameter estimation". Proceedings of the Sixth Conference on Natural Language Learning (CoNLL-2002). pp. 49–55. doi:10.3115/1118853.1118871.
- ↑ Andrew, Galen. Scalable training of L₁-regularized log-linear models // Proceedings of the 24th International Conference on Machine Learning / Galen Andrew, Jianfeng Gao. — 2007. — ISBN 9781595937933. — doi:10.1145/1273496.1273501.