Zhen-Dong/Awesome-Quantization-Papers
این مجموعه جامعی از مقالات مرتبط با کوانتیزهکردن شبکههای عصبی در کنفرانسها و مجلات معتبر هوش مصنوعی است.
کاربرد:
کمک میکنه تا محققان و توسعهدهندگان به راحتی به آخرین پیشرفتها در زمینه کاهش دقت محاسباتی (مثل تبدیل وزنها به فرمتهای کمبیت) دسترسی داشته باشند و مدلهای هوش مصنوعی را برای دستگاههای کمتوان بهینه کنند.
در چه شرایطی بهتره استفاده شود؟
وقتی روی توسعه مدلهای سبک برای دستگاههای تلفن همراه، IoT یا هر سیستم embedded کار میکنی و نیاز داری بدون افت زیاد دقت، حافظه و مصرف انرژی رو کاهش بدی.
چند مثال از موارد استفاده:
- بهینهسازی مدلهای بزرگ مثل Transformer برای اجرا روی گوشی
- کاهش اندازه مدل برای استقرار در دستگاههای بدون اینترنت
- بهبود سرعت استنتاج در سیستمهای واقعی مثل خودروهای خودران
- ##Quantization
- ##NeuralNetworks
- ##ModelCompression
- ##EdgeAI
- ##DeepLearning
- ##AIResearch
- ##LowPrecision
- ##EfficientAI
- ##OnDeviceML
- ##TinyML
