مفاهیم داده کاوی

مفاهیم داده کاوی

مفاهیم داده کاوی
در ایم پست قصد داریم به تعریف مفاهیم داده کاوی که یکی از علوم نوظهور در حوزه فناوری اطلاعات است بپردازیم. داده کاوی یا همان Data Mining پل ارتباطی میان علم آمار،علم کامپیوتر،هوش مصنوعی،الگوشناسی،فراگیری ماشین و بازنمایی بصری داده می باشد. داده کاوی فرآیندی پیچیده جهت شناسایی الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده می باشد،به طریقی که این الگو ها و مدلها برای انسانها قابل درک باشند.

داده ها اغلب بسیار حجیم می باشند و به تنهایی قابل استفاده نیستند، بلکه دانش نهفته در داده ها قابل استفاده می باشد. بنابراین بهره گیری از قدرت فرآیند داده کاوی جهت شناسایی الگوها و مدلها و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش نهفته در داده ها و نهایتا تبدیل داده به اطلاعات، روز به روز ضروری تر می شود.

داده کاوی استخراج اطلاعات مفهومی، ناشناخته و به صورت بالقوه مفید از پایگاه داده میباشد.

داده کاوی علم استخراج اطلاعات مفید از پایگاه های داده یا مجموعه داده ای می باشد.

داده کاوی استخراج نیمه اتوماتیک الگوها، تغییرات،وابستگی ها، نابهنجاری ها و دیگر ساختارهای معنی دار آماری از پایگاه های بزرگ داده می باشد.

داده کاوی در پایگاه های داده کوچک نیز بسیار پرکاربرد است و از نتایج و الگوهای تولید شده بوسیله آن در تصمیم گیری های استراتژیک تجاری شرکتهای کوچک نیز می توان بهره های فراوان برد. کاربرد داده کاوی در یک جمله را این گونه می توان بیان کرد : ” داده کاوی اطلاعاتی می دهد، که شما برای گرفتن تصمیم هوشمندانه ای درباره مشکلات سخت شغلتان به آنها نیاز دارید”.

در داده کاوی معمولا به کشف الگوهای مفيد از ميان داده ها اشاره می شود . منظور از الگوی مفيد ، مدلی در داده ها است که ارتباط ميان يک زير مجموعه از داده ها را توصيف مي کند و معتبر ، ساده ، قابل فهم و جديد است .

در متون آکادميک تعاريف گوناگونی برای داده کاوی ارائه شده اند . در برخی از اين تعاريف داده کاوی در حد ابزاری که کاربران را قادر به ارتباط مستقيم با حجم عظيم داده ها می سازد معرفی گرديده است و در برخی ديگر ، تعاريف دقيقتر که درآنها به کاوش در داده ها توجه می شود موجود است . برخی از اين تعاريف عبارتند از :

  • داده کاوی عبارت است از فرايند استخراج اطلاعات معتبر ، از پيش ناشناخته ، قابل فهم و قابل اعتماد از پايگاه داده های بزرگ و استفاده از آن در تصميم گيری در فعاليت های تجاری مهم.
  • اصطلاح داده کاوی به فرايند نيمه خودکار تجزيه و تحليل پايگاه داده های بزرگ به منظور يافتن الگوهای مفيد اطلاق مي شود .
  • داده کاوی يعني جستجو در پايگاه داده ها برای يافتن الگوهايی ميان داده ها .
  • داده کاوی يعني استخراج دانش کلان ، قابل استناد و جديد از پايگاه داده های بزرگ .
  • داده کاوی يعني تجزيه و تحليل مجموعه داده های قابل مشاهده برای يافتن روابط مطمئن بين داده ها .

 

همانگونه که در تعاريف مختلف داده کاوی مشاهده می شود ، تقريبا در تمامی تعاريف به مفاهيمی چون استخراج دانش ، تحليل و يافتن الگوی بين داده ها اشاره شده است .         

داده كاوی معمولا به عنوان جستجو ،آناليز كردن ، باقيمانده از مقدار زيادی از داده برای يافتن ارتباط ،الگو ها يا هر همبستگي آماری معني داری ، تعريف مي شود.با پيدايش كامپيوتر ، پايگاه داده بزرگ و اينترنت ، آسانتر مي توان ميليون ، بيليون و حتي تريليون قسمت های از داده را جمع كرد كه می تواند از روی قاعده آناليز انجام داد و به جستجوی ارتباطات و پيدا كردن راه حل در مشكلات مختلف كمك كرد. به علاوه صاحبان مشاغل بزرگ در بيشتر خريد و فروش از داده كاوی در پيدا كردن الگو ها و ارتباطات توان مشتری استفاده مي كنند.سازمان های بزرگ و سازمان آموزشی نيز از داده كاوی برای فهميدن همبستگي پر معنا كه مي تواند در جامعه ما توسعه يابد ، استفاده می شود.

نکته:  همانگونه که در تعاريف مختلف داده کاوی مشاهده مي شود، تقريبا در تمامی تعاريف به مفاهيمی چون استخراج دانش ، تحليل و يافتن الگوی بين داده ها اشاره شده است.

” داده کاوی فرآيندی است که طی آن با استفاده از ابزار های  تحليل داده به دنبال کشف الگوها و ارتباطات ميان داده هاي موجود که ممکن است منجر به استخراج اطلاعات جديدی از پايگاه داده گردند، می باشد.”

در داده کاوی از بخشی به نام تحليل اکتشافی داده ها استفاده می شود که در آن بر کشف اطلاعات نهفته و ناشناخته از درون حجم انبوه داده ها تاکيد مي شودبنابراين می توان گفت در داده کاوی تئوريهای پايگاه داده ها، هوش مصنوعی، يادگيری ماشين و علم آمار را در هم می آميزند تا زمينه کاربردی فراهم شود.

بايد توجه داشت که اصطلاح داده کاوی زمانی به کار برده مي شود که با حجم بزرگی از داده ها در حد گیگابایت يا ترابايت، مواجه باشيم که از این نظر یکی از بزرگترین بازارهای هدف، انبارجامع داده ها، مراکز داده وسیستم های پشتیبانی تصمیم برای بدست آوردن تخصص هایی در صنایعی مثل شبکه های توزیع مویرگی، تولید،مخابرات، بیمه و… می باشد.

نکته: در تعاریفی که از داده کاوی ارائه شد به اصطلاح “فرایند” اشاره شد. حتی در بعضی محیط های حرفه ای این نظر وجود دادرد که داده کاوی شامل انتخاب و بکارگیری ابزارهای مبتنی بر کامپیوتر برای حل مسائل فعلی و بدست آوردن یک راه حل بطور اتوماتیک و خودکار میباشد.

برای آموزش داده کاوی، باید بر مفاهیم و روش های اعمال شده برخلاف همه جاذبه های ابزارهای مبتنی بر کامپیوتر که امور رابا جزئیات و دستورات با فرمت های خاصی باید به خیلی از سوالات از جمله چگونگی طراحی و استفاده از فرایندها را پاسخ داد به جای بیان جزئیات عملی ابزار مختلف داده کاوی تکیه نمود.

 

 

MAGadmin

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

یازده − 6 =

پست بعدی

پایگاه داده یا دیتابیس (Data Base) چیست؟

پ اکتبر 3 , 2019
پایگاه داده یا دیتابیس (Data Base) چیست؟ بانک اطلاعاتی یا پایگاه داده یا دیتابیس (data base) به مجموعه ای از اطلاعات با ساختار منظم  گفته می شود. این پایگاه های اطلاعاتی معمولاً در قالبی که برای دستگاه ها و رایانه ها قابل خواندن و قابل دسترسی باشند ذخیره می شوند. […]
پایگاه داده یا دیتابیس (Data Base) چیست؟