CUDA-L2 سیستمی نوآورانه است که ترکیبی از مدلهای زبانی بزرگ (LLMs) و یادگیری تقویتی (RL) را برای بهینهسازی خودکار کرنلهای CUDA مربوط به ضرب ماتریس با دقت نصفه (Half-precision General Matrix Multiply یا HGEMM) به کار میگیرد. این سیستم به طور سیستماتیک مراحل بهینهسازی را با استفاده از الگوریتمهای یادگیری تقویتی انجام میدهد تا عملکرد ضرب ماتریس را که در بسیاری از کاربردهای محاسباتی حیاتی است، به شکل قابل توجهی افزایش دهد.
مزیت اصلی CUDA-L2 نسبت به کتابخانه استاندارد cuBLAS در این است که با بهرهگیری از مدلهای زبانی پیشرفته و مکانیزمهای یادگیری تقویتی قادر است به صورت خودکار و هوشمندانه پارامترهای کرنل را به گونهای تنظیم کند که بیشینه عملکرد را با توجه به منابع سختافزاری فراهم آورد. به این ترتیب، کاربردهای حوزههایی مانند یادگیری ماشین، محاسبات علمی و گرافیک کامپیوتری که به ضرب ماتریس گسترده نیاز دارند، میتوانند از این فناوری جدید بهره ببرند.
این پروژه نشان میدهد که ترکیب هوش مصنوعی در بهینهسازی برنامههای موازی و استفاده از یادگیری تقویتی باعث خلق رویکردهای نوینی در بهبود کارایی محاسبات ماتریسی شده است. کد و مستندات کامل این پروژه به صورت منبع باز در گیتهاب قابل دسترسی است و میتواند بستری برای توسعههای آینده در زمینه بهینهسازیهای هوشمند GPU باشد.
منبع خبر: مشاهده منبع خبر



