پنج سال پیش انویدیا (Nvidia) فرایند تولید سیستم جدیدی را در سطح ابررایانه ها (سوپرکامپیوتر) آغاز کرد. این ابررایانه برابر طرح های اولین ی انویدیا به حدی قدرتمند حیات که می توانست مدل های هوش مصنوعی را خودش بسازد و ایفا کند. از بین میزان هایی که ابررایانه ی انویدیا قرار حیات توانایی ساخت و اجرای موجودی را داشته باشد می توانیم به نمونه خودروی خودران اشاره کنیم. این ابررایانه در جوهر داشتن این غلبه باید می توانست به تقریبا تمامی محققانی که در حوزه ی یادگیری عمیق (Deep Learning) مشغول به فعالیت هستند خدمت رسانی کند. انویدیا پس از تولید چند سلسله از DGX Pod توانست تحصیل های بسیار ارزشمندی را در اساس ی تولید سیستم هایی که دارای قطعات ماژولار و مقیاس پذیر هستند یاد بگیرد.
فرایند تولید با وجود تمامی مشکلات، روند نسبتا خوبی را طی می کرد. در همین وقت بود که دنیاگیری ویروس کرونا، دنیا را درنوردید.
انویدیا بخاطر تولید ابررایانه ی خود با چالش های متعددی دست و پنجه نرم می کرد و دنیاگیری ویروس کرونا باعث شد فرایند تاسیس ابررایانه باطراوت تر از قبل شود. انویدیا بوسیله نعوظ کلی برای پیش برد فعالیت هایش با چالش هایی جدید مواجه شده بود و این بار تولید سلین (Selene)، نسل چهارم رایانه های سری DGX SuperPOD را سخت تیز از قدیم تخیل می کرد. کاهش احصائیه نیروهای کار و اعمال محدودیت ها و قرنطینه، اوضاع را مرموز نمدار کرد؛ اما این چالش ها نتوانستند فعالیت های تیم سبز را متلاطم کنند. انویدیا توانست در اعتبار تنها سه ونیم هفته، جهیز سلین را به طور تمام بسازد. انویدیا با تیم های دونفره توانست ابررایانه ی سلین را تو سه ونیم هفته تولید درنگ
ابررایانه ای که انویدیا در سه ونیم هفته تولید کرد امروزه در بین ۱۰ ابررایانه ی لایق دنیا حضور دارد و از آن به عنوان نوک تیز ترین سیستم صنعتی در سراسر ایالات متحده ی آمریکا یاد می شود. به علاوه بررسی ها مدال می دهد سلین امروزه تند ترین وسیله MLPerf تجاری گیتی به حساب می آید.
فرایند ساخت سلین تو بحبوحه ی دنیاگیری کووید ۱۹ به وضوح مزیت های تعبیر نقشه کشی سیستم را مدال داد. این اتفاق مدلل کرد مسیری که مهندسان انویدیا بخاطر پیدایش سلین پیش گرفته بودند، بسیار هوشمندانه بوده است. روشی که انویدیا به حکم گرفت بخاطر مواقع ضروری بسیار پرکاربرد است.
مایک هیوستون یک معمار بزرگ است که مدیر تیم سیستم های ساخته شده توسط انویدیا به شمار می آید. هیوستون داخل گفت و گو با خبرنگاران اطلاع دادن کرد: «مرام حقیقی ما در ابتدا این بود پیاده سازی سیستم را با سرعت متجاوز بالایی ادا دهیم؛ آن احترام سریع که بتوانیم به محققان خود امکان دهیم به سرعت فرایند حکم با آن را آغاز کنند. انویدیا نخستین خریدار مایه های ما به شمار می آید؛ بوسیله همین دلیل، ما کامل تلاش خویشتن را برای اثبات توانایی مان بوسیله کار بستیم تا تامین شویم دستگاه به خوبی کار می نرم».
هیوستون در امتداد ی سخنان خود به آغاز دوران شیوع ویروس کرونا رمز کرد و گفت: «با فرا رسیدن دنیاگیری، می خواستیم مایه را بخاطر اجرا رسیدگی روی کووید ۱۹ گونه اندازی کنیم. مرام مان این حیات به برخی از شرکای تجاری مان نظیر Argonne National Labs که از SuperPOD استفاده می کند امکان دهیم فرایند رسیدگی روی بیماری متاخر را آغاز کنند».
ابررایانه ی سلین امروزه داخل یکی از دیتاسنترهای مدل انویدیا در نزدیکی مقر حقیقی این شریک در سیلیکون ولی قرار دارد. داخل سلین از ۲۸۰ سیستم DGX v100 استفاده شده که مجموعا بوسیله ۲٬۲۴۰ هسته ی گرافیکی تنسور (Tensor) ترجمه می شوند. در ابررایانه ی انویدیا از ۴۹۴ سوئیچ ملناکس (Mellanox) به همراه هفت پتابایت حافظه ی تمام فلش کاربرد شده است.
سلین از بهار امسال آغازبه حکم کرده و از آن زمان تاکنون توانسته به عارض هفتگی هزاران شهریه را (گاهی اوقات بوسیله رخ بی قراری زمان) به انجام برساند. سلین می تواند کارهایی نظیر تجزیه و تحلیل داده های درک قدر یا بهای چیزی مصنوعی و وظایف سنتی حوزه ی یادگیری ماشین و رایانش با غلبه پشته (HPC) را انجام دهد. مایک هیوستون داخل امتداد ی سخنان خود گفت: «سلین صرفا دستگاهی در مملکت ی فهم بدلی نیست. سلین را می نبوغ یکی از بهینه مایه های HPC در سراسر دنیا بوسیله حساب آورد. سلین یکی از بهترین مایه های یادگیری ماشین گیتی است و در گروه ی بهترین دستگاه های فهمیدن مصنوعی جای می گیرد». درون ابررایانه ی Selene از مجموعا ۲٬۲۴۰ هسته ی گرافیکی تنسور کاربرد شده است
به طور معمول بوسیله عزیمت تاسیس سیستمی داخل سطح ابررایانه ها، ده ها مهندس باید ماه ها تلاش کنند تا قطعات را به خشکی امدن هم قرار دهند و فرایند گونه اندازی رایانه را انجام دهند. انویدیا بوسیله اراده ساخت سلین بوسیله استراتژی جالبی روی آورد و از آویشن های دونفره استفاده کرد. هر یک از این آویشن ها برای رعایت قوانین بور گذاری اجتماعی، از یکدیگر استثنا شده بودند و به صورت جداگانه وظیفه ی مجری گشایی قطعات جهیز های DGX v100 و قرار اعطا کردن آن ها در ابررایانه را برعهده داشتند.
مهندسان انویدیا توانستند یومیه ۶۰ سیستم DGX v100 را قوطی گشایی و قطعات آن را به پیکره ی سلین نقل مکان کنند؛ این، بیشترین مقیاس قطعاتی وجود که برگ مورداستفاده توسط آن ها دستور ی پیاده سازی در سلین را می قسط. بین تیم های تشکیل شده توسط انویدیا بور ای ۶ فوتی (۱٫۸ متر) وجود داشت و همین فاصله، کابل کشی را به کار محنت تغییر می کرد. ادمین های سیستم به قیافه مجازی در آن لاگین می کردند تا از راه دور بتوانند درستیِ فرایند کابل کشی را تأیید کنند.
تیم های انویدیا داخل بین خودشان ماژول های متشکل از ۲۰ قطعه را تحسین کردند که با سوئیچ های نسبتا نازک و سهل درکنار بی قراری قرار پژمرده بودند. این قطعات میزان پذیر را می توان به تدریج موردبررسی و آزمایش قرار عدل تا فرایند پیاده سازی آن ها در جهیز بازپسین بوسیله درستی ایفا بگیرد. انویدیا پیش از تکثیر کردن ماژول بعدی، ماژول فعلی را به دقت موردبررسی قرار می عدالت تا مشکلی بود نداشته باشد. انویدیا با استفاده از ولکرو (Velcro) فرایند برش، تنظیم طول و کنارهم قرار دادن کابل ها را ارتکاب می داد. هیوستون تو این مبنا می گوید: «کل سیستم به گونه ای طراحی شده که بسیار بیش سریع پیاده سازی شود. وقتی که قطعات را خبردار و برق را وصل کردید، فرایند پیاده سازی به سرعت انجام می گیرد. ما درون طرز مان تو اعتبار چهار ساعت توانستیم هر بخش از مایه که قطعاتش سرهم شده بودند را راه اندازی کنیم».
ربات Trip؛ ابزاری اختصاص برای کارکنان انویدیا به منظور نظارت روی ابررایانه ی سلین
سلین پیاده شدن پایه ی نوعی معماری باز که انویدیا با مشتریانش به اشتراک می گذارد ساخته شده است. افزون بر Argonne National Lab، انویدیا شرکای دیگری نظیر دانشگاه فلوریدا دارد. مقامات دانشگاه فلوریدا گفته اند که می خواهند ازطریق معماری موردبحث انویدیا سریع ترین رایانه ی فهمیدن قلابی دانشگاهی را تولید کنند. همدستی هایی نظیر لاکهید مارتین (Lockheed Martin) و مایکروسافت همچنین مشغول استفاده از DGX SuperPODهای انویدیا هستند. هیوستون می گوید هدف اصلی معماری انویدیا این است که بتوان آن را بوسیله سادگی در تمامی دیتاسنترها پیاده سازی کرد؛ از دیتاسنتر انبازی های مخابراتی محزون تا دیتاسنترهای HPC.
مایک هیوستون حرف هایش را ادامه می دهد: «داخل سازمان های مرزوبوم ی HPC و شرکت های تحقیقاتی مرزوبوم ی درک قدر یا بهای چیزی مصنوعی نیاز شدیدی به مایه های قدرتمند و سریع العمل و قابل اتکا دریافتن می شود». هیوستون می گوید بوسیله لطف معماری موردبحث انویدیا زمان زیادی از شرکت ها تلف نمی شود. ابررایانه ی سلین می تواند با گوناگون وظایف سنگین سازوار شود و آن ها را بوسیله انجام برساند. همان نعوظ که اشاره کردیم سلین ساختاری به بی آرامی مستمر دارد. انویدیا می گوید زمان بیش زیادی را صرف امر روی واژه طراحی سلین کرده تا بتوان آن را به سادگی پیاده سازی کرد و گسترش عدالت. هیوستون می گوید که آن ها داخل قبیله های پیشین معماری شان تدریس های ارزشمند اضافی درباره ی گشادگی پذیری ابررایانه ها یاد گرفته اند. او و تیمش برای گشادگی دستگاه مجبور بودند سیم کشی زیادی انجام دهند و بخاطر پیش سرما سریع پروژه به رویکردی جدید احتیاج داشتند.
تیم سازنده ی سلین قطعه های مختلف جهیز محتوی پردازنده، ذهن و قطعات مدیریتی را داخل مجموعه های مختلف تقسیم بندی کردند. آن ها داخل ابررایانه ی سلین به ازای هر پردازنده ی گرافیکی از دو کارت رابط شبکه بهره گرفتند. با این SuperPOD، انویدیا ظرفیت و توان عملیاتی حافظه ی رم و حافظه های ذخیره سازی به حزن پیوسته را افزایش داد. در فرایند تاسیس سیستم از اتوماسیون همچنین بهره اندوهناک شد. برای مثال سلین به منظور برقراری ارتباط با کارکنان انویدیا از کانال اسلک استفاده می یواش تا گزارش هایی بسان ایجاد شاق در کابل ها را بدهد. سلین همچنین می تواند قطعاتی را که دچار مشکل شده اند ایزوله یواش تا کار خود را بدون مشکل ادامه دهد.
انویدیا از ربات خاص ای با اشتهار Trip که متعلق به شرکت Double Robotics است مصرف می نرم. کارکنان انویدیا ازطریق Trip می توانند از نحو دور و به لطف میکروفون و دوربین ربات، روی سلین نظارت کنند.بیشتر بخوانید:کاربران چینی: آیفون عاری وی چت، یک زباله الکترونیکی گرانقیمت استفاکس کان: دوره ای که گره به عنوان کارخانه تولیدی گیتی شناخته می شد تمام شده استشیائومی درون می 10 اولترا از نمایشگر TCL استفاده کرده استهرآنچه درباره باتری قلمی باید بدانیدآنالوگ دربرابر دیجیتال؛ تباین این دو فناوری صوتی در چیست؟
فرایند تولید با وجود تمامی مشکلات، روند نسبتا خوبی را طی می کرد. در همین وقت بود که دنیاگیری ویروس کرونا، دنیا را درنوردید.
انویدیا بخاطر تولید ابررایانه ی خود با چالش های متعددی دست و پنجه نرم می کرد و دنیاگیری ویروس کرونا باعث شد فرایند تاسیس ابررایانه باطراوت تر از قبل شود. انویدیا بوسیله نعوظ کلی برای پیش برد فعالیت هایش با چالش هایی جدید مواجه شده بود و این بار تولید سلین (Selene)، نسل چهارم رایانه های سری DGX SuperPOD را سخت تیز از قدیم تخیل می کرد. کاهش احصائیه نیروهای کار و اعمال محدودیت ها و قرنطینه، اوضاع را مرموز نمدار کرد؛ اما این چالش ها نتوانستند فعالیت های تیم سبز را متلاطم کنند. انویدیا توانست در اعتبار تنها سه ونیم هفته، جهیز سلین را به طور تمام بسازد. انویدیا با تیم های دونفره توانست ابررایانه ی سلین را تو سه ونیم هفته تولید درنگ
ابررایانه ای که انویدیا در سه ونیم هفته تولید کرد امروزه در بین ۱۰ ابررایانه ی لایق دنیا حضور دارد و از آن به عنوان نوک تیز ترین سیستم صنعتی در سراسر ایالات متحده ی آمریکا یاد می شود. به علاوه بررسی ها مدال می دهد سلین امروزه تند ترین وسیله MLPerf تجاری گیتی به حساب می آید.
فرایند ساخت سلین تو بحبوحه ی دنیاگیری کووید ۱۹ به وضوح مزیت های تعبیر نقشه کشی سیستم را مدال داد. این اتفاق مدلل کرد مسیری که مهندسان انویدیا بخاطر پیدایش سلین پیش گرفته بودند، بسیار هوشمندانه بوده است. روشی که انویدیا به حکم گرفت بخاطر مواقع ضروری بسیار پرکاربرد است.
مایک هیوستون یک معمار بزرگ است که مدیر تیم سیستم های ساخته شده توسط انویدیا به شمار می آید. هیوستون داخل گفت و گو با خبرنگاران اطلاع دادن کرد: «مرام حقیقی ما در ابتدا این بود پیاده سازی سیستم را با سرعت متجاوز بالایی ادا دهیم؛ آن احترام سریع که بتوانیم به محققان خود امکان دهیم به سرعت فرایند حکم با آن را آغاز کنند. انویدیا نخستین خریدار مایه های ما به شمار می آید؛ بوسیله همین دلیل، ما کامل تلاش خویشتن را برای اثبات توانایی مان بوسیله کار بستیم تا تامین شویم دستگاه به خوبی کار می نرم».
هیوستون در امتداد ی سخنان خود به آغاز دوران شیوع ویروس کرونا رمز کرد و گفت: «با فرا رسیدن دنیاگیری، می خواستیم مایه را بخاطر اجرا رسیدگی روی کووید ۱۹ گونه اندازی کنیم. مرام مان این حیات به برخی از شرکای تجاری مان نظیر Argonne National Labs که از SuperPOD استفاده می کند امکان دهیم فرایند رسیدگی روی بیماری متاخر را آغاز کنند».
ابررایانه ی سلین امروزه داخل یکی از دیتاسنترهای مدل انویدیا در نزدیکی مقر حقیقی این شریک در سیلیکون ولی قرار دارد. داخل سلین از ۲۸۰ سیستم DGX v100 استفاده شده که مجموعا بوسیله ۲٬۲۴۰ هسته ی گرافیکی تنسور (Tensor) ترجمه می شوند. در ابررایانه ی انویدیا از ۴۹۴ سوئیچ ملناکس (Mellanox) به همراه هفت پتابایت حافظه ی تمام فلش کاربرد شده است.
سلین از بهار امسال آغازبه حکم کرده و از آن زمان تاکنون توانسته به عارض هفتگی هزاران شهریه را (گاهی اوقات بوسیله رخ بی قراری زمان) به انجام برساند. سلین می تواند کارهایی نظیر تجزیه و تحلیل داده های درک قدر یا بهای چیزی مصنوعی و وظایف سنتی حوزه ی یادگیری ماشین و رایانش با غلبه پشته (HPC) را انجام دهد. مایک هیوستون داخل امتداد ی سخنان خود گفت: «سلین صرفا دستگاهی در مملکت ی فهم بدلی نیست. سلین را می نبوغ یکی از بهینه مایه های HPC در سراسر دنیا بوسیله حساب آورد. سلین یکی از بهترین مایه های یادگیری ماشین گیتی است و در گروه ی بهترین دستگاه های فهمیدن مصنوعی جای می گیرد». درون ابررایانه ی Selene از مجموعا ۲٬۲۴۰ هسته ی گرافیکی تنسور کاربرد شده است
به طور معمول بوسیله عزیمت تاسیس سیستمی داخل سطح ابررایانه ها، ده ها مهندس باید ماه ها تلاش کنند تا قطعات را به خشکی امدن هم قرار دهند و فرایند گونه اندازی رایانه را انجام دهند. انویدیا بوسیله اراده ساخت سلین بوسیله استراتژی جالبی روی آورد و از آویشن های دونفره استفاده کرد. هر یک از این آویشن ها برای رعایت قوانین بور گذاری اجتماعی، از یکدیگر استثنا شده بودند و به صورت جداگانه وظیفه ی مجری گشایی قطعات جهیز های DGX v100 و قرار اعطا کردن آن ها در ابررایانه را برعهده داشتند.
مهندسان انویدیا توانستند یومیه ۶۰ سیستم DGX v100 را قوطی گشایی و قطعات آن را به پیکره ی سلین نقل مکان کنند؛ این، بیشترین مقیاس قطعاتی وجود که برگ مورداستفاده توسط آن ها دستور ی پیاده سازی در سلین را می قسط. بین تیم های تشکیل شده توسط انویدیا بور ای ۶ فوتی (۱٫۸ متر) وجود داشت و همین فاصله، کابل کشی را به کار محنت تغییر می کرد. ادمین های سیستم به قیافه مجازی در آن لاگین می کردند تا از راه دور بتوانند درستیِ فرایند کابل کشی را تأیید کنند.
تیم های انویدیا داخل بین خودشان ماژول های متشکل از ۲۰ قطعه را تحسین کردند که با سوئیچ های نسبتا نازک و سهل درکنار بی قراری قرار پژمرده بودند. این قطعات میزان پذیر را می توان به تدریج موردبررسی و آزمایش قرار عدل تا فرایند پیاده سازی آن ها در جهیز بازپسین بوسیله درستی ایفا بگیرد. انویدیا پیش از تکثیر کردن ماژول بعدی، ماژول فعلی را به دقت موردبررسی قرار می عدالت تا مشکلی بود نداشته باشد. انویدیا با استفاده از ولکرو (Velcro) فرایند برش، تنظیم طول و کنارهم قرار دادن کابل ها را ارتکاب می داد. هیوستون تو این مبنا می گوید: «کل سیستم به گونه ای طراحی شده که بسیار بیش سریع پیاده سازی شود. وقتی که قطعات را خبردار و برق را وصل کردید، فرایند پیاده سازی به سرعت انجام می گیرد. ما درون طرز مان تو اعتبار چهار ساعت توانستیم هر بخش از مایه که قطعاتش سرهم شده بودند را راه اندازی کنیم».
ربات Trip؛ ابزاری اختصاص برای کارکنان انویدیا به منظور نظارت روی ابررایانه ی سلین
سلین پیاده شدن پایه ی نوعی معماری باز که انویدیا با مشتریانش به اشتراک می گذارد ساخته شده است. افزون بر Argonne National Lab، انویدیا شرکای دیگری نظیر دانشگاه فلوریدا دارد. مقامات دانشگاه فلوریدا گفته اند که می خواهند ازطریق معماری موردبحث انویدیا سریع ترین رایانه ی فهمیدن قلابی دانشگاهی را تولید کنند. همدستی هایی نظیر لاکهید مارتین (Lockheed Martin) و مایکروسافت همچنین مشغول استفاده از DGX SuperPODهای انویدیا هستند. هیوستون می گوید هدف اصلی معماری انویدیا این است که بتوان آن را بوسیله سادگی در تمامی دیتاسنترها پیاده سازی کرد؛ از دیتاسنتر انبازی های مخابراتی محزون تا دیتاسنترهای HPC.
مایک هیوستون حرف هایش را ادامه می دهد: «داخل سازمان های مرزوبوم ی HPC و شرکت های تحقیقاتی مرزوبوم ی درک قدر یا بهای چیزی مصنوعی نیاز شدیدی به مایه های قدرتمند و سریع العمل و قابل اتکا دریافتن می شود». هیوستون می گوید بوسیله لطف معماری موردبحث انویدیا زمان زیادی از شرکت ها تلف نمی شود. ابررایانه ی سلین می تواند با گوناگون وظایف سنگین سازوار شود و آن ها را بوسیله انجام برساند. همان نعوظ که اشاره کردیم سلین ساختاری به بی آرامی مستمر دارد. انویدیا می گوید زمان بیش زیادی را صرف امر روی واژه طراحی سلین کرده تا بتوان آن را به سادگی پیاده سازی کرد و گسترش عدالت. هیوستون می گوید که آن ها داخل قبیله های پیشین معماری شان تدریس های ارزشمند اضافی درباره ی گشادگی پذیری ابررایانه ها یاد گرفته اند. او و تیمش برای گشادگی دستگاه مجبور بودند سیم کشی زیادی انجام دهند و بخاطر پیش سرما سریع پروژه به رویکردی جدید احتیاج داشتند.
تیم سازنده ی سلین قطعه های مختلف جهیز محتوی پردازنده، ذهن و قطعات مدیریتی را داخل مجموعه های مختلف تقسیم بندی کردند. آن ها داخل ابررایانه ی سلین به ازای هر پردازنده ی گرافیکی از دو کارت رابط شبکه بهره گرفتند. با این SuperPOD، انویدیا ظرفیت و توان عملیاتی حافظه ی رم و حافظه های ذخیره سازی به حزن پیوسته را افزایش داد. در فرایند تاسیس سیستم از اتوماسیون همچنین بهره اندوهناک شد. برای مثال سلین به منظور برقراری ارتباط با کارکنان انویدیا از کانال اسلک استفاده می یواش تا گزارش هایی بسان ایجاد شاق در کابل ها را بدهد. سلین همچنین می تواند قطعاتی را که دچار مشکل شده اند ایزوله یواش تا کار خود را بدون مشکل ادامه دهد.
انویدیا از ربات خاص ای با اشتهار Trip که متعلق به شرکت Double Robotics است مصرف می نرم. کارکنان انویدیا ازطریق Trip می توانند از نحو دور و به لطف میکروفون و دوربین ربات، روی سلین نظارت کنند.بیشتر بخوانید:کاربران چینی: آیفون عاری وی چت، یک زباله الکترونیکی گرانقیمت استفاکس کان: دوره ای که گره به عنوان کارخانه تولیدی گیتی شناخته می شد تمام شده استشیائومی درون می 10 اولترا از نمایشگر TCL استفاده کرده استهرآنچه درباره باتری قلمی باید بدانیدآنالوگ دربرابر دیجیتال؛ تباین این دو فناوری صوتی در چیست؟
- ۹۹/۰۵/۲۵