پردازش اطلاعات قبل از استفاده از آنها، یکی از چالشهای اساسی پیش روی محققان در اجرای بارهای کاری (Workload) مربوط به یادگیری ماشینی (Machine Learning) که یکی از انواع هوش مصنوعی است، محسوب میگردد. شرکت گوگل اخیرا از سرویس مبتنی بر Cloud جدید خود برای تسهیل این امر رونمایی نموده است.
این محصول که Google Cloud Dataprep نام دارد، در ابتدا الگوها، اتصالها و اختلالات مربوط به دادهها که میتواند شامل منابع گمشده و یا تکراری باشند را به صورت خودکار و بدون اختصاص کد شناسایی مینماید؛ سپس با تبدیل این قوانین به فرمت Apache Streams، میتوان برای پردازش دادهها از محصولاتی همچون Google Cloud Dataflow و یا سرویس پایگاه دادهی BigQuery استفاده نمود.
سرویس Cloud Dataprep جهت آماده نمودن دادهها برای “یادگیری ماشینی” ایجاد شده است و نکته قابل توجه در رابطه با این سرویس آن است که خود آن نیز به منظور تعیین مفیدترین قوانین برای مشتریان از یادگیری ماشینی استفاده میکند. به زودی، این نرمافزار در نسخه بتا عرضه خواهد شد.
در سرویس BigQuery بهبودهای بسیاری ایجاد شده است که از جمله میتوان به امکان استفاده از برنامهی Commercial Datasets اشاره کرد. با استفاده از این برنامه که در حال حاضر نسخه Betaی آن موجود میباشد، کاربران میتوانند اطلاعات مورد نیاز خود را از AccuWeather، Dow Jones، Xignite، HouseCanary و Remine دریافت نموده و آن را جهت پردازش بیشتر، مستقیما بهBigQuery ارسال نماید.
از دیگر قابلیتهای جدید سرویس BigQuery میتوان به امکان ایجاد Query بر روی دادههای ذخیرهشده در پایگاهدادهی Cloud Bigtable (محصول NoSQL شرکت Google برای دادههای دارای تاخیر کم) نام برد. به این ترتیب کاربران میتوانند با نوشتن یک SQL Query، به اطلاعات Bigtable و BigQuery دست یابند و این در حالی است که در گذشته برای جستجوی اطلاعات Bigtable نیاز به نوشتن برنامهای مجزا بود.
به زودی سازمانهای تبلیغاتی قادر خواهند بود دادهها را از Google Adwords،DoubleClick Campaign Manager، DoubleClick for Publisher و YouTube به BigQuery ارسال نمایند تا در فرآیندهای آنالیز و یا سایر برنامههای کاربردیِ حوزهی Big Data مورد استفاده قرار گیرند. این ویژگی احتمالا تعداد زیادی از سازمانهای تبلیغاتی را به استفاده از Google Cloud سوق میدهد و باعث می شود شرکت گوگل از شرکتهای آمازون و مایکروسافت پیشی بگیرد.
طبق اعلام گوگل، پایگاه دادهی SQL مبتنی بر Cloud این شرکت، درحالحاضر علاوه بر MySQL به پشتیبانی از PostgreSQL نیز میپردازد. لازم به ذکر است که شرکت گوگل علاوه بر ویژگیهای ذکر شده، تغییراتی نیز در قیمت و پشتیبانی از قابلیت Custom Runtime در AppEngine ایجاد کرده است.