داده کاوی و اشتباهات رایج در استفاده از آن

امروزه همه کمپانی‌ها از استارتاپ‌ها تا شرکت‌های بزرگ و جا افتاده از تحلیل اطلاعات استفاده می‌کنند. اگر دغدغه‌ها و مسائل مربوط به امنیت و هوش مصنوعی را نادیده بگیریم، ۵ اشتباه وجود دارد که کمپانی‌ها در هنگام تحلیل اطلاعات خود مرتکب آن‌ها می‌شوند.

۱.ابتدا ابزار را تهیه می‌کنند و سپس به دنبال مسائل هستند!
برای تحلیل داده ابزارهای مختلفی وجود دارد که با استفاده از آن‌ها می‌شود کارهای مختلفی انجام داد. کمپانی‌ها برعکس عمل می‌کنند: آن‌ها ابتدا ابزار را انتخاب می‌کنند و سپس به دنبال مسائلی متناسب با آن ابزار هستند. بنابراین برای این که گام به گام با علم داده حرکت کنند، به دنبال هر پایگاه داده‌ای با مقادیر زیادی داده هستند تا بتوانند از آن‌ها حداکثر استفاده را ببرند.

بیشتر بخوانید پیش نیاز های داده کاوی

برای مثال: شما با توجه به ابزاری که تهیه کرده‌اید می‌توانید الگوهایی را تحلیل کنید که زمان دیرکرد کارکنان را تحلیل می‌کند. اما این مورد در نهایت هیچ مسئله‌ای را حل نخواهد کرد و کارکنان قطعا علاقه‌ای به این نظارت اضافه نخواهند داشت. از طرفی اطلاعات مشتریان و تحلیل رفتار آن‌ها برای کسب و کار بسیار ارزشمندتر خواهد بود و باید زمان زیادی را صرف تحلیل این دست اطلاعات کرد.

۲.استفاده از بهترین ابزار به جای ارزان‌ترین ابزار
همیشه بهترین ابزار، مناسب‌ترین ابزار برای کسب وکار شما نیست. اگر می‌توانید از ابزارهای ارزان‌تر و ساده‌تر استفاده کنید، نیاز نیست که زمان و هزینه زیادی را برای یک ابزار صرف کنید.

وقتی صحبت از منبع ذخیره‌سازی داده است، از منابع مختلفی مانند دیتابیس SQL، انبار داده، دیتابیس NoSQL، دریاچه داده (Data Lake) و … وجود دارد. هرکدام از این‌ها کاربردها و هزینه‌های مختلفی دارند. برخی اوقات کمپانی‌ها ترجیح می‌دهند که برای گزارشات پاور بی آی از انبار داده استفاده کنند چون انبار داده (Data Warehouse) محل مناسبی برای داده‌های ساختاریافته است. این طرز فکر درست است اما اگر فقط ۱۰ جدول در دیتامارت خود دارید، پایگاه داده SQL این کار را با هزینه کمتری برای شما انجام خواهد داد. گاهی اوقات هزینه زیاد به تنهایی موجب نابودی پروژه شما خواهد شد.

۳.قرار دادن دپارتمان‌های هوش تجاری و تحلیل داده به عنوان زیرمجموعه مالی/بازاریابی/ IT
برای اینکه سازمان شما از نظر داده به خوبی عمل کند، دپارتمان تحلیل داده نباید زیرمجموعه بخش دیگری باشد. این دپارتمان باید در کنار سایر بخش‌ها فعالیت کند. اگر این بخش زیرمجموعه IT باشد، فقط روی قسمت فنی متمرکز است و نمی‌تواند در توسعه محصولات و درآمدزایی کمپانی نقشی داشته باشد.

اگر زیرمجموعه بخش مالی باشد، بیش از اندازه روی قسمت هزینه و درامد تمرکز دارد و از نوآوری فاصله می‌گیرد و از پروژه‌های غیرانتفاعی دوری می‌کند. اگر زیر مجموعه بازاریابی باشد، یک بخش خیالی است که فقط به نظریه پردازی پرداخته و نتایج مطلوب را به دست نمی‌آورد. توانایی بالایی فنی، افراد نوآور که به دنبال بهره‌وری بالا هستند و عملکرد خوب در زمینه تحلیل داده به یک اندازه نیاز است.

۴.جدا کردن تیم‌های علم داده و مهندسی داده، یا یکی کردن تیم‌های مهندسی داده و دانشمندان داده
برخی از مدیران دوست دارند که این دو گروه با مهارت‌های کاملا مختلف را در یک گروه قرار دهند. اگر هر چه هر دو مثل هم به نظر می‌رسند باید در دو تیم جدا باشند. مهندسین داده (Data Engineers) متخصصین IT هستند که در حوزه‌های عملی فعالیت می‌کنند. تحلیل‌گران و دانشمندان داده به صورت بصری عمل می‌کنند و از آمار و ریاضیات بیشتر استفاده می‌کنند. ممکن است که شما یک فرد را داشته باشید که هر دو این کارها را انجام می‌دهد اما هنگامیکه پروژه‌ها توسعه پیدا کردند، این افراد می‌بایست دیر یا زود متخصص شوند.

تیم‌های مهندسی داده و علم داده می‌بایست تا جاییکه ممکن است با یکدیگر کار کنند. هر دو این افراد را باید یک نفر مدیریت کند، در یک اتاق مشترک کار کنند و دسته یکسانی از ایمیل‌ها را دریافت کنند. مهندسین داده باید ببینند که از کار آن‌ها استفاده می‌شود و آن‌ها بهبودهایی را که به نفع دانشمندان داده است، شناسایی می‌کنند. دانشمندان داده زمان زیادی از مهندسین داده را ذخیره می‌کنند.

۵.از دست دادن داده های خوب ، در همه جا پتانسیل‌های از دست رفته زیادی وجود دارد. سازمان‌هایی که به خوبی داده محور نشده اند، فرصت‌های زیادی را از دست می‌دهند. مدیریت به شدت مشغول فعالیت‌هایی است که ارزش داده‌های آن نادیده گرفته می‌شود. باید همواره نظارتی بر ظرفیت‌های تحلیلی کمپانی وجود داشته باشد. شناسایی داده‌های کارامد کار سختی نیست. به این راهکارها توجه کنید:

داده های رفتارهای مشتریان

هر چیزی که برای تقسیم بندی، پروفایل بندی و خوشه‌بندی مشتریان کمک کند، داده خوب است. از این داده ها برای بهبود کمپین‌های بازاریابی، تکرار فروش، یکپارچه سازی فروش و حتی هدف گذاری‌ های جدید در فروش استفاده می‌شود.

داده‌های رفتار تامین کنندگان

کمپانی‌ها معمولا داده های تامین کنندگان خود را به اندازه داده‌های مشتریان تحلیل نمی‌کنند و این داده‌ها را از دست می‌دهند. ارتباط خوب داشتن فقط با تامین کنندگان کلیدی بی ارزش است.

اندازه گیری‌ها/ داده های سنسور/ داده های صنعتی

داده هایی که برای نظارت‌هی روزانه و فعالیت‌ها در عملیات ها استفاده می‌شود، می‌تواند برای تعمیرات قابل پیش‌بینی (predictive maintenance) نیز استفاده شود. تعمیرات قابل پیش‌بینی، ستاره درخشان تحلیل‌های پیشرفته است. اگر از این مورد استفاده نمی‌کنید، زمان این است که از الگوریتم‌های یادگیری ماشین استفاده کنید و شاهد کاهش هزینه‌های نگهداری و تعمیرات باشید.

عملکرد فروش

نرخ بازگشت سرمایه باید برای همه مهم باشد. بررسی کمپین‌ها برای همه حیاتی است. در این راستا استفاده از ابزارهای مصورسازی بسیار مهم است.

وضعیت موجودی / انبار

هر داده ای از وضعیت موجودی از پتانسیل بالایی برای بهینه سازی برخوردار است و برای پیش بینی تقاضا و جلوگیری از ضررهای ناشی از کمبود موجودی کارایی دارد.

منبع وبسایت https://towardsdatascience.com

ویراستار ، تنظیم و تهیه کننده : محمد امین کردفروشانی / مرجع کالج صنایعشو
توجه: کپی از مطالب و فایل ها تنها با درج لینک این وبسایت و رعایت  قانون کپی رایت پایگاه و پیگیری حقوق مولف مجاز است.