LLM-Pruner
این پروژه یک روش هوشمند برای کاهش حجم مدلهای زبان بزرگ (LLM) بدون از دست دادن زیاد دقت است. ️ کاربرد: کم کردن حجم و پیچیدگی مدلهای زبان بزرگ برای اجرای سریعتر و کارآمدتر روی دستگاههای با منابع محدود، مثل لپتاپ یا سرورهای کوچک. در چه شرایطی بهتره استفاده بشه؟ وقتی میخوای یک مدل بزرگ مثل Llama3 ...
