پردازش آرایهای در GPU

شیما خلیلی; غلام رضا کریمی; امیر رجب زاده

پردازش آرایهای در GPU

محل انتشار: کنفرانس بین المللی پژوهش های نوین در علوم مهندسی

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 893

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/506601

شناسه ملی سند علمی:

RKES01_252

تاریخ نمایه سازی: 21 شهریور 1395

چکیده مقاله:

پردازش عام منظوره 1 بر روی پردازنده های گرافیکی 2 را می توان یک نمونه از اجرایی نمودن مدل یک دستور چند نخی 3 دانست. این پردازنده ها دارای برون دهی زیاد هستند. معماری پردازنده ها ی گرافیکی به دلیل داشتن تعداد بسیار زیادپردازنده موازی از اهمیت خاصی در معماری های چند هسته ای برخوردار هستند، در واقع این نوع تراشه ها را دریایی از پردازنده های ساده می دانند که دارای میزان نسبتاکمی از حافظه و قسمت های کنترلی هستند که توانایی اجرای موازیهزاران نخ را دارد البته نحوه ی برنامه نویسی و تولید نرم افزار برای این پردازنده های نیازمند آگاهی از طریق اجرای نخ ها وگلوگاه های کارایی در برنامه های موازی است . تعیین تعداد نخ ها برای اجرای موازی و همچنین میزان حافظه مورد نیاز آن ها تاثیر مستقیمی بر میزان برون دهی و کارایی دارد. در این مقاله سعی شده که با استفاده از قابلیت پردازندههای گرافیکی بتوان دستورات آرایهای با زمانی کمتر از پردازندههای عام منظوره انجام داد که در واقع به این شکل که میتوان برنامهای را نوشت که قسمتی از آن به صورت سریالی و توسط CPU و قسمت دیگر آن به صورت موازی و توسط GPU اجرا شود و کامپایلر برنامه در هنگام کامپایل این موضوع را تشخیص می دهد و این موضوع میتواند برای اجراهای مجزا کمک کند

کلیدواژه ها:

پردازش عام منظوره ، پردازنده های گرافیکی ، نخ ، cuda

نویسندگان

شیما خلیلی

ایران، مرکزی، آشتیان، دانشگاه آزاد اسلامی واحد آشتیان، دانشکده مهندسی کانپیوتر،

غلام رضا کریمی

ایران، کرمانشاه، دانشگاه رازی، هئت علمی مهندسی برق الکتریک،

امیر رجب زاده

ایران، کرمانشاه، دانشگاه رازی، هئت علمی مهندسی کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Vokorokos. L, Ennert. M, Caنkosky. M, Radusovsky. J, " A ...
Allen. A, Edenfeld. D, Joyner. W.H, Kahng. A.B, Rodgers. M, ...
Keckler. S.W, Olukotun. K, and Hofstee. H.P, "On-Chip Networks for ...
Hong. S, Kim. H, "An analytical model for a GPU ...
Govender. N, Wilke. D.N, Kok. S, Els. R, "Development of ...
Lindholm. E, Nickolls. J, Oberman. S, Montrym. J, "NVIDIA Tesla: ...
Lopez-Novoa. U, Mendiburu. A, Miguel-Alonso _ J, _ A Survey ...
Rave. G.D, Jimenez -Hornero _ _ Ariza-Vi llaverde _ A.B, ...
Liu.Y, Maskell. D.L, Schmidt. B, "CUDASW++ optimizing S mi th-Waterman ...
Brodtkorb. A.R, Hagen. T.R, Saetra. M.L, "Graphics processing unit (GPU) ...
Goodnight. N, Wang. R, Humphreys. G, "Computation _ Programmable Graphics ...
Liu. W, Schmidt. B, Voss. G, Muller-Wittig. W, "Streaming Algorithms ...
Keckler. S.W, Dally. W.J, Khailany. B, Garland. M, " GPUs ...
Che. S, Boyer. M, Meng. J, Tarjan. D, Sheaffer. J.W, ...
Liu. W, Schmidt. B, Voss. G, Schroder. A, Muller-Wittig. W, ...
Vinco. S, Chatterjee. D, Bertacco. V, Fummi. F, "SAGA: SystemC ...

نمایش کامل مراجع