بسیاری از سازمانها به دنبال این هستند که به جای انتشار فراوان داشبورد و گزارش، روی دادههای خود بیشتر کار کنند. اعمال رویکردهای تحلیلی پیشرفته مانند یادگیری ماشین، یکی از عرصههای ضروری دانش برای هر متخصص دادهای است. با این که ضرورتی ندارد مدیران پایگاه داده یا به اختصار DBAها، دادهشناس هم باشند، باید درک عمیقی از تکنولوژیهای در دسترس یادگیری ماشین داشته باشند و بدانند که چطور باید با همکاری متخصصان دامینهای دیگر، از این تکنولوژیها استفاده کنند.
آن دسته از افرادی که با SQL Server کار میکنند، میتوانند با قابلیتهای عالی یادگیری ماشین در SQL Server 2019 آشنا شوند. در مرکز این قابلیتها، راهکاری به نام Big Data Clusters وجود دارد که امکان ایجاد کلاسترهای مقیاسپذیر SQL Server، Apache Spark و کانتینرهای HDFS را که در Kubernetes اجرا میشوند، در اختیار کاربر قرار میدهد.
با وجود چنین قابلیتهایی، انعطافپذیری روشهای دسترسی به داده و دادههای رابطهای به صورت Side-By-Side، بیشتر خواهند شد. میتوان از طریق کلاستر، به پرسوجوی داده از منابع دیگر پرداخت. همچنین میتوان Big Data را در HDFS تحت کنترل SQL Server ذخیره نمود. بدین ترتیب در پایان روز، بیشتر دادهها برای یادگیری ماشین، هوش مصنوعی و دیگر تسکهای تحلیلی پیشرفته در دسترس خواهند بود و عملکرد سریعتر و آسانتری خواهند داشت.
بیشتر بخوانید: دسترسی به بهترین عملکرد Big Data با استفاده از Big Data Clusters در SQL 2019
یادگیری ماشین در SQL Server 2019 دارای قابلیتهای توسعهیافته به صورت Built-In است و مواردی را که مکررا درخواست میشوند و به کاربرد R و Python برای یادگیری ماشین مرتبط هستند، اضافه میکند. برای مثال، این سرور امکان نصب SQL Server Machine Learning Services بر Linux را فراهم میکند. همچنین در این سرور از کلاسترهای Failover به دلیل قابلیت اطمینان بیشتر، پشتیبانی میشود و قابلیتهای Scripting جدید و بهبودیافته در آن، گزینههای جدیدی برای ایجاد و توسعه مدلها در اختیار کاربر قرار میدهد.
تلفیق Python و پایگاه داده SQL Server، کاربر را قادر میسازد تا تسکهای پیشرفته یادگیری ماشین را به جای جابهجایی، نزدیک به داده اجرا کند. میتوان با برنامههای کاربردی Production که از روشهای دسترسی به داده SQL Server استفاده میکنند، به نگرشهایی که از Python Runtime حاصل میشوند، دست یافت.
همچنین میتوان با افزودن مدلسازی مبتنی بر پارتیشن، به هنگام استفاده از دادههای پارتیشنبندیشده، به جای استفاده از یک مدل بزرگ، تعداد زیادی داده کوچک را مرتب کرد. اگر کاربر دادههایی قابل دستهبندی بر اساس ویژگیهای دموگرافیکی یا منطقهای داشته باشد، میتواند با کمک پارتیشنبندی، بدون نیاز به تجزیه مجموعههای داده، بر مدلهای خود تقسیمبندی بیشتری داشته باشد.
از آن جایی که مرز بین DBA و دادهشناس همچنان کمرنگ و کمرنگتر میشود، از بیشتر کاربران انتظار میرود تا این نوع راهکارها را بشناسند و آنها را مدیریت کنند. مایکروسافت صراحتا اهمیت یادگیری ماشین و نیاز به بهکارگیری آسانتر آن در انواع مختلف داده را تایید میکند و در عین حال، به مزایای عملکرد و مدیریتپذیری استفاده از SQL Server نیز معتقد است.
بیشتر بخوانید: مزایای استفاده از SQL Server 2019