- آخرین فایل ها
- پرفروشترین فایل ها
- پربازدیدترین فایل ها
مقدمه ای بر دادهکاوی
در دو دهه قبل توانايي های فنی بشر در برای توليد و جمع آوری دادهها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب و کار، علوم، خدمات دولتی و پيشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهواره ای، در اين تغييرات نقش مهمی دارند [۱].
بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. اين رشد انفجاری در دادههای ذخيره شده، نياز مبرم وجود تکنولوژی های جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند: داده کاوی به عنوان يک راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی داده کاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي کنند، که اين دانش به صورت ضمنی در پايگاه داده های عظيم، انباره داده و ديگر مخازن بزرگ اطلاعات، ذخيره شده است. داده کاوی بطور همزمان از چندين رشته علمی بهره مي برد نظير: تکنولوژی پايگاه داده، هوش مصنوعی، يادگيری ماشين، شبکه های عصبی، آمار، شناسايی الگو، سيستم های مبتنی بر دانش ، حصول دانش ، بازيابی اطلاعات ، محاسبات سرعت بالا و بازنمايی بصری داده . داده کاوی در اواخر دهه ۱۹۸۰ پديدار گشته، در دهه ۱۹۹۰ گامهای بلندی در اين شاخه از علم برداشته شده و انتظار می رود در اين قرن به رشد و پيشرفت خود ادامه دهد [۲].
واژه های «داده کاوی» و «کشف دانش در پایگاه داده» اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان يک فرآيند در شکل۱-۱ نشان داده شده است.
کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها می باشد. داده کاوی، مرحله ای از فرایند کشف دانش می باشد و شامل الگوریتمهای مخصوص داده کاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند [۱]. به بیان ساده تر، داده کاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می شود. تعریف دیگر اینست که، داده کاوی گونه ای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می باشد، به نحوی که با استخراج آنها، در حوزه های تصمیم گیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند. داده ها اغلب حجیم ، اما بدون ارزش می باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه گفته می شود.
۱-۱ چه چيزی سبب پيدايش داده کاوی شده است؟
اصلی ترين دليلی که باعث شد داده کاوی کانون توجهات در صنعت اطلاعات قرار بگيرد، مساله در دسترس بودن حجم وسيعی از داده ها و نياز شديد به اينکه از اين داده ها اطلاعات و دانش سودمند استخراج کنيم. اطلاعات و دانش بدست آمده در کاربردهای وسيعی از مديريت کسب و کار وکنترل توليد و تحليل بازار تا طراحی مهندسی و تحقيقات علمی مورد استفاده قرار می گيرد.
داده کاوی را می توان حاصل سير تکاملی طبيعی تکنولوژی اطلاعات دانست، که اين سير تکاملی ناشی از يک سير تکاملی در صنعت پايگاه داده می باشد، نظير عمليات: جمع آوری داده ها وايجاد پايگاه داده، مديريت داده و تحليل و فهم داده ها. در شکل۱-۲ اين روند تکاملی در پايگاه های داده نشان داده شده است
فهرست
1-1 چه چيزی سبب پيدايش داده کاوی شده است؟. 4
1-3 جایگاه داده کاوی در میان علوم مختلف... 11
1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟. 12
1-5 داده کاوی و انبار داده ها 13
1-7 کاربرد یادگیری ماشین و آمار در داده کاوی... 15
2- توصیف داده ها در داده کاوی... 15
2-1 خلاصه سازی و به تصویر در آوردن داده ها 15
3- مدل های پیش بینی داده ها 17
4 مدل ها و الگوریتم های داده کاوی... 18
4-3 Multivariate Adaptive Regression Splines(MARS). 24
4-5 K-nearest neibour and memory-based reansoning(MBR). 26
حجم:7005KB | بازدید :1292
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : مقدمه: اصولاً امروزه شهركهاي صنعتي بستر و شالوده رشد و ايجاد صنايع كوچك را فراهم مي كند. سازمان صنايع كوچك و شهركهاي صنعتي ايران هم به ايجاد روبناها مي پردازد و نواحي ، شهركها و مدلهاي مختلف توسعه اقتصادي نظير خوشه...
حجم:4886KB | بازدید :1620
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : طرح مقدماتی کارخانه تولید طناب نایلونی هر شرکت تولیدی از سه بخش کلی تشکیل شده است که بترتیب زیر میباشند. 1- بخش اداری 2- بخش حقوقی 3- بخش فنی و تخصصی و ما در این مجموعه به توضیح...
مقاله بررسی سیستم فروش در شرکت کارتن مشهد
حجم:4013KB | بازدید :1077
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : تاریخچه: شرکت کارتن مشهد(سهامی عام) در تاریخ 7/3/1363 تحت شمارة 3333 در ادارة ثبت شهرستان مشهد به ثبت رسید و در مرداد ماه سال 1368 بهرهبرداری آزمایشی و از ابتدای سال 1369 بهرهبرداری عملی از آن با ظرفیت 20.000 تن ورق و کارتن در...
حجم:3511KB | بازدید :2109
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : منابع و عوامل توليد بخش كشاورزي منابع اقتصادي روستاهاي ايران عمدتا شامل ؛ کشاورزي( زراعت، باغداري، دامداري ، شکار و صيد ) صنايع (دستي، روستايي، خانگي و کارگاهي) خدمات (عمومي، حمل و نقل و ...) ، دادوستد و پيله وري و...
حجم:2462KB | بازدید :1561
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : اقتصاد روستايي اقتصاد روستايي شاخه اي از اقتصاد است که با اقتصاد کشاورزي وابستگي متقابل دارد و در کليت ، خود جزئي از اقتصاد ملي است. هر گونه تغييري در اقتصاد ملي باعث تغيير در اقتصاد روستايي خواهد شد. اقتصاد روستايي با...
دانلود مقاله کامل الگوريتم هاي مسير يابي
حجم:2131KB | بازدید :1412
فایل ورد قابل ویرایش 142 صفحه توضیحی مختصر از متن فایل : مقدمه الگوريتمهاي مسيريابي در هريك از سه قرم گذشته فناوري خاصي رونق داشته باشد قرن هجدهم زمان توسعه سيستم هاي مكانيكي بزرگ به همراه انقلاب صنعتي بود. قرن نوزدهم عصر موتور بخار بود. قرن بيستم زمان جمع آو...
مقاله گرم کردن آب با نیروی خورشیدی
حجم:959KB | بازدید :1300
تقريباً همه ي ما در زندگي روزمره به آب گرم شده توسط انرژي خورشيدي بر خورده ايم. تا به حال چند بار شيلنگ آب را باز كرده ايد و با آب بسيار داغ درون آن مواجه شده ايد؟ خورشيد بدون توجه به تمـايل شـما آب درون شيـلنگ را گـرم مي كند. سيستم هاي گرمكن آب خورشيدي غير فعال از قديمي ترين و...