تکامل خط لوله داده هوشمند


به نظر می رسد پتانسیل هوش مصنوعی (AI) و یادگیری ماشین (ML) از نظر توانایی تولید و هدایت منابع جدید مشتریان، محصولات، خدمات، عملیات، محیط ها و ارزش های اجتماعی تقریباً نامحدود است. اگر سازمان شما قرار است در آینده در اقتصاد رقابت کند، هوش مصنوعی باید در هسته عملیات تجاری شما قرار گیرد.

مطالعه‌ای که توسط Kearney با عنوان «تأثیر تجزیه و تحلیل در سال 2020» انجام شد، سود و تأثیرات کسب‌وکار دست‌نخورده را برای سازمان‌هایی که به دنبال حقیقت برای تسریع در علم داده (AI / ML) و سرمایه‌گذاری‌های مدیریت داده هستند، نشان می‌دهد:

  • اگر کاوشگرها به عنوان رهبران مؤثر باشند، می توانند سود را تا 20 درصد افزایش دهند
  • اگر فالوورها به اندازه لیدرها مؤثر باشند، می توانند سود خود را تا 55 درصد افزایش دهند
  • اگر عقب مانده ها به عنوان رهبر موثر باشند، می توانند سود را تا 81 درصد افزایش دهند

تأثیر تجاری، عملیاتی و اجتماعی می تواند خیره کننده باشد به جز یک چالش مهم سازمانی – داده ها. اندرو نگ، پدرخوانده هوش مصنوعی، موانع مدیریت داده ها و داده ها را برای توانمندسازی سازمان ها و جوامع برای درک پتانسیل هوش مصنوعی و ML برجسته کرده است:

“مدل ها و کد برای بسیاری از برنامه ها مشکلاتی هستند که حل شده اند. اکنون که مدل ها به یک نقطه خاص پیشرفت کرده اند، ما باید داده ها را نیز کار کنیم.” – Andrew Ng

داده ها در قلب آموزش مدل AI و ML قرار دارند. و داده‌های قابل اعتماد و با کیفیت بالا که از طریق یک خط لوله کارآمد و مقیاس‌پذیر گردآوری شده‌اند به این معنی است که هوش مصنوعی می‌تواند این نتایج هیجان‌انگیز تجاری و عملیاتی را فعال کند. همانطور که یک قلب سالم به اکسیژن و جریان خون قابل اطمینان نیاز دارد، جریان داده های تمیز، دقیق، غنی شده و قابل اعتماد نیز که برای ماشین های AI/ML ضروری است، نیاز دارد.

به عنوان مثال، یک CIO تیمی متشکل از 500 مهندس داده دارد که بیش از 15000 پروژه استخراج، تبدیل و بارگذاری (ETL) را مدیریت می‌کنند که مسئول کسب، انتقال، جمع‌آوری، استانداردسازی و همگام‌سازی داده‌ها در 100 مخزن داده (داده) با هدف خاص هستند. مارت، انبار داده، دریاچه داده و دریاچه داده). او این وظایف را در سیستم‌های عامل و سازمان‌های رو به مشتری تحت قراردادهای سطح خدمات (SLA) انجام می‌دهد تا از تعداد زیادی از مصرف‌کنندگان داده‌های متنوع پشتیبانی کند. من فکر می کنم که روب گلدبرگ یک معمار داده می شد (شکل 1).

شکل 1: معماری داده Rube Goldberg

کاهش ساختار معماری اسپاگتی یک برنامه استاتیک ETL یکباره، با هدف ویژه، برای جابجایی، تمیز کردن، همگام‌سازی و اصلاح داده‌ها تا حد زیادی از «زمان برای بینش» مورد نیاز سازمان‌ها برای بهره‌برداری از ویژگی‌های اقتصادی منحصربه‌فرد داده‌ها، «با ارزش‌ترین منبع» جلوگیری می‌کند. در جهان ” با توجه به اقتصاد دان.

ظهور خطوط لوله داده هوشمند

هدف از خط لوله داده، خودکارسازی و مقیاس‌بندی وظایف جمع‌آوری، تبدیل، حرکت و یکپارچه‌سازی داده‌های رایج و تکراری است. یک استراتژی خط لوله داده به درستی ساخته شده می‌تواند فرآیندهای مربوط به جمع‌آوری، تمیز کردن، اصلاح، افزودن و انتقال داده‌ها به سیستم‌ها و برنامه‌های پایین‌دستی را تسریع و خودکار کند. از آنجایی که حجم، تنوع و سرعت داده های من همچنان در حال افزایش است، نیاز به خط لوله داده های مقیاس پذیر خطی در محیط های ابری و ترکیبی ابری من برای عملیات تجاری من به طور فزاینده ای حیاتی است.

خط لوله داده به مجموعه ای از فعالیت های پردازش داده اطلاق می شود که منطق عملیاتی و تجاری را برای انجام منبع یابی، تبدیل و بارگذاری داده های پیشرفته تر ترکیب می کند. خط لوله داده می‌تواند بر اساس یک برنامه زمان‌بندی، در زمان واقعی (جریان‌گذاری)، یا توسط قوانین یا شرایط از پیش تعریف‌شده فعال شود.

علاوه بر این، منطق و الگوریتم‌هایی را می‌توان در خط لوله داده برای ایجاد خطوط لوله داده «هوشمند» ایجاد کرد. خط لوله هوشمند یک دارایی اقتصادی قابل استفاده مجدد و قابل گسترش است که می تواند به یک سیستم منبع اختصاص داده شود و تبدیل داده های مورد نیاز برای پشتیبانی از داده های منحصر به فرد و الزامات تحلیلی برای یک سیستم یا برنامه هدف را انجام دهد.

همانطور که یادگیری ماشین و AutoML رایج تر می شوند، کانال های داده به طور فزاینده ای هوشمند می شوند. خط لوله داده می تواند داده ها را بین ماژول های پیشرفته غنی سازی و تبدیل انتقال دهد، جایی که شبکه های عصبی و الگوریتم های یادگیری ماشین می توانند تبدیل و غنی سازی داده های پیشرفته تری ایجاد کنند. اینها شامل تقسیم بندی، تجزیه و تحلیل رگرسیون، خوشه بندی، و ایجاد شاخص های پیشرفته و امتیازات روند هستند.

در نهایت، می‌توان هوش مصنوعی را در خط لوله داده ادغام کرد تا بتواند بر اساس سیستم منبع، تبدیل داده‌ها و غنی‌سازی مورد نیاز، و الزامات تجاری و عملیاتی در حال تکامل سیستم و برنامه هدف، به یادگیری و انطباق ادامه دهد.

به عنوان مثال: یک خط لوله داده هوشمند در مراقبت های بهداشتی می تواند گروهی از کدهای گروه مربوط به تشخیص مراقبت های بهداشتی (DRG) را تجزیه و تحلیل کند تا از سازگاری و کامل بودن ارسال های DRG اطمینان حاصل کند و تقلب را کشف کند زیرا داده های DRG توسط خط لوله داده از منبع منتقل می شود. سیستم تحلیلی

ارزش تجارت را درک کنید

افسران ارشد داده و تحلیلگران داده به چالش کشیده می شوند تا ارزش کسب و کار را از داده ها حذف کنند – برای اعمال داده ها در تجارت به منظور ایجاد تأثیر مالی قابل اندازه گیری.

توانایی دریافت داده‌های باکیفیت و قابل اعتماد به مصرف‌کنندگان داده‌های مناسب در زمان مناسب برای تسهیل تصمیم‌گیری‌های دقیق‌تر و دقیق‌تر، یک تمایز اصلی برای شرکت‌های غنی از داده امروزی خواهد بود. سیستم اسکریپت نویسی ELT Rube Goldberg و مخازن ویژه تجزیه و تحلیل محور مختلف آن مانع از توانایی سازمان برای دستیابی به این اهداف می شود.

در مورد خط لوله داده هوشمند بیشتر بدانید خط لوله داده های سازمانی مدرن (کتاب الکترونیکی) توسط Dell Technologies در اینجا.

این محتوا توسط Dell Technologies تولید شده است. این توسط تحریریه MIT Technology Review نوشته نشده است.


تمامی اخبار به صورت تصادفی و رندومایز شده پس از بازنویسی رباتیک در این سایت منتشر شده و هیچ مسئولتی در قبال صحت آنها نداریم