شرکت Amazon Web Service که به اختصار AWS نیز نامیده میشود، اخیرا به منظور پیشبرد دانش هوش مصنوعی (AI) در محیطی آرام و تعاملی به انجمن Deep Learning در Open Neural Network Exchange پیوسته است. لازم به ذکر است که فیسبوک و مایکروسافت از پیشگامان این حرکت بودهاند.
AWS به عنوان بخشی از این همکاری، پکیج Python خود با نام ONNX-MxNet که به صورت Open Source میباشد را به عنوان چارچوب Deep Learning ارائه داده که Interface برنامه نویسی برنامههای کاربردی در چندین زبان مختلف شامل Python ،Scala و نرمافزار آماری منبعباز R را فراهم میآورد.
فرمت ONNX به Devoloperها این امکان را میدهد تا مدلها را برای چارچوبهای دیگری همچون PyTorch، Microsoft Cognitive Toolkit یا Caffe2، AWS Deep Learning Engineering Manager Hagay Lupesko و Software Developer Roshani Nagmote ساخته و آموزش دهند. همچنین Developerها میتوانند این مدلها را به MXNet منتقل نموده و آنها را به منظور استنتاج به اجرا درآورند.
تابستان امسال فیسبوک و مایکروسافت به منظور پشتیبانی از یک مدل مشترک تعاملپذیر برای پیشرفت هوش مصنوعی، ONNX را راهاندازی نمودند و مایکروسافت تکنولوژیهای خود مانند Cognitive Toolkit، Caffe2 و PyTorch را جهت پشتیبانی از ONNX اختصاص داد.
بنا به گفتهی مایکروسافت، Cognitive Toolkit و دیگر چارچوبها، ایجاد و اجرای نمودارهای محاسباتی که نشانگر شبکههای عصبی میباشند را برای توسعه دهندگان تسهیل مینماید. لازم به ذکر است که نسخههای ابتدایی کد ONNX و برخی مستندات آن در Github قابل دسترسی میباشند. همچنین ماه گذشته AWS و مایکروسافت از برنامههای خود برای ارائه Gluon به عنوان یک Interface جدید در Apache MXNet خبر دادند که با استفاده از آن Developerها میتوانند مدلهای Deep Learning را ساخته و آموزش دهند.
Aditya Kaul، مدیر تحقیقاتی شرکت Tractica اظهار داشت: Gluon افزونهای میباشد که حاصل شراکت مایکروسافت و AWS بوده و در حال رقابت با Google Tensorflow میباشد اما حذف گوگل از این بازار کاملا قابل پیشبینی بوده و به زودی AWS و مایکروسافت بر این بازار مسلط خواهند شد. گرچه که Tensorflow به صورت Open Source میباشد ولی این ویژگیِ چندان چشمگیری نیست و باعث همکاری سایر رقبا برای رقابت با Google میگردد.
Apache MXNet اخیرا نسخهی 0.12 از MXNet را معرفی نموده است که عملکرد Gluon را توسعه میدهد تا مطابق با خواسته AWS تحقیقات جدید را میسر سازد. از جمله ویژگیهای جدید این نسخه، Dropout متغیر است که Developerها را قادر میسازد تا برای کاهش Overfitting شبکههای عصبی تکرار شونده، تکنیک Dropout را اعمال نمایند.
همچنین AWS اعلام نموده است که قابلیتهای Convolutional RNN، Long Short-Term Memory و (GRU (Gated Recurrent Unit، به مجموعههای داده این امکان را میدهند تا با استفاد از توالی زمانی و ابعاد فضایی مدلسازی شوند.
روش Framework-Neutral
Paul Teich به عنوان یکی از تحلیلگران ارشد شرکت تحقیقاتی Tirias اعتقاد دارد که روش Framework-Neutral، راهکاری عالی برای ارائه نتیجهگیری و بدون در نظر گرفتن اینکه کدام چارچوب مدل را ایجاد نموده میباشد و اساسا به عنوان راهکاری برای ارائه استنتاج در نظر گرفته میشود.
توسعه دهندگان Cloud همچون AWS، مایکروسافت و سایرین، از جانب مشتریان تحت فشار میباشند تا جهت پیشرفت هوش مصنوعی بتوانند در حالی که تکنولوژیها را بر روی یک شبکه آموزش میدهند همزمان آنها را بر روی شبکهای دیگر ارائه کنند.
لازم به ذکر است که تعاملپذیری چارچوب نکتهی مثبتی بوده و به Developerها کمک مینماید تا اطمینان یابند مدلی که بر روی MXNet، Caffe و یا CNTK میسازند، دارای قابلیت تعاملپذیری میباشند.
Paul Teich درمورد اینکه این قابلیت چگونه میتواند در دنیای واقعی نیز مورد استفاده قرار گیرد بیان نمود: تکنولوژیهایی همچون ترجمه زبان طبیعی و یا تشخیص صدا لازم است که با تکنولوژی تشخیص صدای Alexa همراه بوده و به محیط توسعهدهنده ارائه شود.