وب‌سرویس مجید

پروژه awesome-quantization-papers

Zhen-Dong/Awesome-Quantization-Papers

این مجموعه جامعی از مقالات مرتبط با کوانتیزه‌کردن شبکه‌های عصبی در کنفرانس‌ها و مجلات معتبر هوش مصنوعی است.

کاربرد:

کمک می‌کنه تا محققان و توسعه‌دهندگان به راحتی به آخرین پیشرفت‌ها در زمینه کاهش دقت محاسباتی (مثل تبدیل وزن‌ها به فرمت‌های کم‌بیت) دسترسی داشته باشند و مدل‌های هوش مصنوعی را برای دستگاه‌های کم‌توان بهینه کنند.

در چه شرایطی بهتره استفاده شود؟

وقتی روی توسعه مدل‌های سبک برای دستگاه‌های تلفن همراه، IoT یا هر سیستم embedded کار می‌کنی و نیاز داری بدون افت زیاد دقت، حافظه و مصرف انرژی رو کاهش بدی.

چند مثال از موارد استفاده:

- بهینه‌سازی مدل‌های بزرگ مثل Transformer برای اجرا روی گوشی

- کاهش اندازه مدل برای استقرار در دستگاه‌های بدون اینترنت

- بهبود سرعت استنتاج در سیستم‌های واقعی مثل خودروهای خودران

  • ##Quantization
  • ##NeuralNetworks
  • ##ModelCompression
  • ##EdgeAI
  • ##DeepLearning
  • ##AIResearch
  • ##LowPrecision
  • ##EfficientAI
  • ##OnDeviceML
  • ##TinyML