پایان نامه ویژه دانشجویان رشته کامپیوتر در زمینه بررسی علم داده کاوی

سایت تخصصی هفت برگ بهترین مرجع پایان نامه ، آموزش و ارائه دهنده مقالات تخصصی

بررسی علم داده کاوی

قیمت محصول 45000 تومان

آسان خرید کنید

تضمین کیفیت فایل

پشتیبانی 24 ساعته

45000 تومان – خرید

0 خرید

۰دیدگاه

علم داده کاوی

رتبه دادن به محصول

جزییات محصول

علم داده کاوی یکی از مهمترین روشها است که به وسیله آن الگوهای مفید در داده‌هابا حداقل دخالت کاربران شناخته می‌شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می‌دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند. در روش علم داده کاوی از بخشی از علم آمار به نام تحلیل اکتشافی داده‌هااستفاده می شود که در آن بر کشف اطلاعات نهفته و ناشناخته از درون حجم انبوه داده‌هاتاکید می شود. علاوه بر این علم داده کاوی با هوش مصنوعی و یادگیری ماشین نیز ارتباط تنگاتنگی دارد ، بنابراین می توان گفت در داده کاوی تئوریهای پایگاه داده‌ها، هوش مصنوعی، یادگیری ماشین و علم آمار را در هم می‌آمیزند تا زمینه کاربردی فراهم شود. در این زمینه پایان نامه کامپیوتر با عنوان داده کاوی و بررسی داده بزرگ از سایت هفت برگ قابل دسترس است.

به اعتقاد الوین تافلر، مردم کره زمین تا به امروز سه موج اساسی تحول را پشت سرگذاشته‌اند:

موج اول، موج انقلاب کشاوزی است که زمان آغاز آن برکسی مشخص نیست.  موج دوم، انقلاب صنعتی است که به دنبال اختراع ماشین بخار در سال  1764آغاز­ شد. موج سوم یا انقلاب انفورماتیک است که ازسال 1946 که بشر به ساخت کامپیوتر نائل آمده آغاز گشته­است.

داده یا دانش

داده اطلاعاتی (Data) به اطلاعات خام سازمان اتلاق می‌شود و اطلاعات (Information) به داده‌های پردازش شده. همچنین داده های پردازش شده پس از طبقه بندی و آنالیز به دانش سازمان (Knowledge) تبدیل می گردند.

علم داده ­کاوی چیست؟

فناوری­های نوین اطلاعاتی و ارتباطی، و همچنین تکنولوژی­های پشتیبان تصمیم، با جمع­آوری، ذخیره، ارزیابی، تفسیر و تحلیل، بازیابی و اشاعه اطلاعات و دانش به کاربران خاص، می­توانند در اطلاع­یابی به­موقع، صحیح و مورد­نیاز به افراد تاثیر زیادی داشته­باشند. یکی از ابزارهای مورد استفاده در این فناوری­ها، داده کاوی می باشد. داده­کاوی شامل استفاده از ابزار­های پیشرفته تحلیل داده به منظور کشف الگو­های معتبر، از قبل نا­شناخته و روابط در مجموعه داده­های بزرگ است. این ابزار­ها، مدلهای آماری، الگوریتم­های ریاضی و متد­های یادگیری ماشین (الگوریتم­هایی که عملکرد خود را از طریق تجربه به­صورت اتوماتیک بهبود می­دهند) می­باشد. داده­کاوی فراتر از جمع­آوری و مدیریت داده است، و شامل تجزیه و تحلیل و پیش­گویی می­شود. نام دیگر آن کشف دانش در پایگاه داده یا به اختصار KDD است. داده ­کاوی می­تواند روی داده­ های کمی، متنی، یا چند­رسانه­‌ای انجام ­گیرد.

علم داده ­کاوی چیست؟

کاربرد­ علم داده کاوی:

– قوانین وابستگی: الگو­هایی که در آن وجود یک آیتم دلالت بر وجود آیتم دیگر دارد،

– کلاس­بندی: انتساب الگو­ها به یک مجموعه کوچک از کلاس­های از قبل تعریف شده به وسیله­       کشف بعضی روابط بین ویژگی­ها،

– خوشه­بندی: گروه­بندی مشتریان یا مجموعه الگو­هایی که ویژگی­های مشابهی دارند،

– پیش­گویی: کشف الگو­ها برای پیش­گویی منطقی درباره آینده،

– تحلیل مسیریا الگو­های ترتیبی: الگو­هایی که در آن یک رخداد منجر به وقوع رخداد دیگر می­شود.

تعاریف علم داده کاوی

داده کاوی عبارت است از فرایند استخراج اطلاعات معتبر  از پیش ناشناخته ، قابل فهم و قابل اعتماد از پایگاه داده های بزرگ و استفاده از آن در تصمیم گیری در فعالیت های تجاری مهم.

اصطلاح داده کاوی به فرایند نیم خودکار تجزیه و تحلیل پایگاه داده های بزرگ به منظور یافتن الگوهای مفید اطلاق می‌شود.

داده کاوی یعنی جستجو در یک پایگاه داده‌هابرای یافتن الگوهایی میان داده‌ها.

داده کاوی یعنی استخراج دانش کلان، قابل استناد و جدید از پایگاه داده‌های بزرگ.

داده کاوی یعنی تجزیه و تحلیل مجموعه داده‌های قابل مشاهده برای یافتن روابط مطمئن بین داده‌ها.

مراحل فرایند کشف دانش از پایگاه داده‌ها

انبارش داده‌ها

انتخاب داده‌ها

تبدیل داده‌ها

کاوش در داده‌ها

تفسیر نتیجه

ساختن مدل داده کاوی

مهمترین مساله برای یادآوری در مورد ساخت مدل آن است که این کار یک فرآیند تکراری است. شما برای جستجو به مدلهای جایگزین جهت یافتن سودمندترین آنها جهت حل مسائلتان نیاز دارید. آنچه که شما در جستجوی یک مدل مناسب یاد می گیرید می تواند شما را به بازگشتن به عقب و انجام برخی تغییرات در داده مورد استفاده خود و حتی بهبود بیان ساله راهنمایی کند. هنگامی که شما در مورد نوع پیش بینی که می خواهید انجام دهید تصمیم گرفتید باید یک نوع مدل برای ساخت تصمیم خود انتخاب کنید. آماده سازی و آزمایش مدل داده کاوی احتیاج به این دارد که داده به حداقل دو گروه شکسته شود: یکی برای آماده کردن مدل و دیگری جهت تست مدل مربوطه. اگر شما از آماده سازی و تست متفاوتی استفاده ننمائید دقت مدل  خواهد بود.

ساختن مدل داده کاوی

پایگاه داده‌ها باید مثل یک فرآیند شامل گام‌های زیر باشد:

درک قلمرو

آماده کردن مجموعه داده ها

کشف الگوها (داده کاوی)

پردازش بعد از کشف الگو

استفاده از نتایج

از نظر فرآیندی فعالیت‌های داده کاوی به سه طبقه‌بندی عمومی تقسیم می‌شوند:

اکتشاف

مدل پیش بینی

تحلیلهای دادگاهی

ابزارهای علم داده کاوی

مدل/ معماری مشترکی بین آنها موجود نمی‌باشد.

به منابع داده گوناگون و نه لزوماً همه گونه منبعی دسترسی دارند.

از یک یا بیشتر الگوریتم DM پشتیبانی می‌نماید.

ممکن است از تمام انواع داده پشتیبانی کند یا نکند.

قابلیتهای مختلف اما نه تمام آنها را پشتیبانی می‌نماید.

وابسته به بستر کاری هر کاربردی ممکن است با یک ابزار کار کند و با ابزار دیگر کار نکند.

 

ابزارهای تجاری برای داده کاوی

Darwin (Oracle Corp)

Mine Set (Silicon Graphics Inc. – SGI)

Intelligent Miner (IBM Corp)

Enterprise Miner (SAS Institute Inc.)

Clementine (SPSS Inc. – Integral Solutions)

DM Miner (DB Miner Technology Inc.)

Brain Maker (California Scientific Software)

CART (Sanford Systems)

MARS (Sanford Systems)

Scenario (Congo’s Inc.)

Web Analyst (Megaputer Intelligence Inc.)

Surf Aid Analysis (IBM crop)

Visualizer Workstation (Computer Science Innovations, Inc.)

 

ابزار علم داده کاوی

منابع اطلاعاتی علم داده کاوی

پایگاه داده‌های رابطه‌ای

انبارهای داده

فایلها

وب

پایگاه های داده شیءگرا

چند رسانه ای

دیتامارت

دیتا مارت اغلب کوچک است و بر یک موضوع یا دپارتمان خاص متمرکز است. بنابراین پاسخگوی یک نیاز داخلی است. طرح بانک اطلاعات برای یک دیتامارت حول ساختار اتصال ستاره‌ای ساخته شده است که بهینه برای نیازهای کاربران دپارتمان است. دیتامارت با ابزارهای کامپیوتری که انعطاف‌پذیری تحلیل را تامین می‌کنند؛ نیرومند می‌شود. رکوردهای ذخیره شده در دیتامارتها بخوبی نمایه شده‌اند. یک دیتامارت در صورتیکه داده‌ها را از منابع داده ای بسیار سازماندهی شده مثل انبار داده‌هابگیرد؛ دیتامارت وابسته نامیده می‌شود. مسلما دیتامارت‌های وابسته از لحاظ ساختاری و معماری منطقی هستند. منبع دیتامارت‌های وابسته تکنولوژِی بانک اطلاعات دپارتمانی است. دیتامارت‌های مستقل ثابت نیستند و از لحاظ معماری بسیار با هم متفاوتند. این مساله هنگام یکپارچه‌سازی دیتامارت‌های مستقل، مشکل ایجاد می‌کند. بنابراین با یکپارچه‌سازی ساده دیتامارت‌ها یک انبار داده ایجاد نخواهد شد. دیتامارت اساسا برای اهداف تاکتیکی طراحی شده است و هدفش تامین یک نیاز تجاری فوری است.

دیتامارت

انبار داده‌ها

یک انبار داده کاملا متفاوت از دیتامارت است. سازماندهی انبارهای داده بگونه ایست که کلیه موضوعات حول فعالیتهای کاری سازمان را می‌پوشاند. انبار داده نمایانگر یک تسهیلات مرکزی است. برخلاف دیتامارت که در آن داده‌ها به شکل خلاصه تر و متراکم تر وجود دارند، یک انبار داده، داده‌ها را در یک سطح نامتراکم ذخیره می‌کند. ساختار داده‌ها در یک انبار داده یک ساختار لزوما هنجار شده است. بدین معنی که ساختار و محتوای داده‌ها در انبار داده منعکس کننده ویژگیهای دپارتمانهای عضو نیست. داده‌ها در انبار داده از نظر حجم و شکل کاملا متفاوت از داده‌ها در دیتامارت هستند. دیتامارت ممکن است شامل حجم زیادی از داده‌های قدیمی و گذشته نگر باشد. داده‌ها در انبار داده اغلب بصورت نسبتا سبک نمایه می‌شوند. (به بیان دیگر در عمق کمتر).

انبار داده‌ها

مشخصات ساختار یک انبار داده

وابستگی به زمان

غیر فرار بودن

تمرکز موضوعی

یکپارچگی

عناصر علم داده کاوی

توصیف و کمک به پیش بینی دو کارکرد اصلی داده کاوی هستند. تحلیل داده مربوط به مشخصه های انتخابی متغیرها؛ از گذاشته و حال، و درک الگو مثالی از تحلیل توصیفی است. برآورد ارزش آینده یک متغیر و طرح ریزی کردن روند مثالی از توانایی پیشگویانه داده کاوی است. برای عملی شدن هریک از دو کارکرد فوق الذکر داده کاوی، چند گام ابتدایی اما مهم باید اجرا شوند که از این قرارند:

  1. انتخاب داده
  2. پاک سازی داده
  3. غنی سازی داده
  4. کد گذاری داده

ابزارهای رایج بکار گرفته شده تحت عنوان داده کاوی عبارتند از:

ابزارهای پرس و جو

فنون آماری

مصور سازی

پردازش تحلیلی پیوسته

یادگیری مبتنی بر مورد

درختان تصمیم گیری

قوانین وابستگی

شبکه های عصبی

الگوریتم ژنتیکی

علم داده کاوی در تولید چهار نوع دانش ذیل مفید است:

– دانش سطحی: کاربردهای SQL

– دانش چند وجهی: کاربردهای OALP

– دانش نهان : تشخیص الگو و کاربردهای الگوریتم یادگیری ماشینی

– دانش عمیق :کاربردهای الگوریتم بهینه سازی داخلی

محدودیت علم داده کاوی

کاربرد داده کاوی با چند عامل محدود شده است. اولین مورد به سخت افزار و نرم افزار لازم و موقعیت بانک اطلاعاتی مربوط می‌شود . در دسترس بودن نیروی انسانی ماهر در داده کاوی نیز مسأله مهم دیگری است. محرمانه بودن رکوردهای مراجعان ممکن است در نتیجه پردازش داده های مبتنی بر داده کاوی آسیب پذیر شود. محدودیت دیگرا ز ضعف ذاتی نهفته در ابزارهای نظری ناشی میگردد. ابزارهایی مانند یادگیری ماشینی و الگوریتمهای ژنتیکی بکار گرفته شده در  فعالیتهای داده کاوی به مفاهیم و فنون منطق و آمار بستگی دارد.

کاربرد علم داده کاوی

۱- کشف تقلب (کلاه برداری) و آنالیز ریسک

۲- خــرده فروشی (تک فروشی)

3-آنالیز بازار استوک

۴- تشخیص جرائم

۵- پیش بینی سیل.

۶- ارتباطات راه دور

۷- تشخیص طبی و درمان

۸- آنالیز داده DNA و زیست پزشکی (Biomedical)

۹- وب کاوی Web Mining

قالب: فایل ورد قابل ادیت (تعداد صفحه:97)(حجم فایل:1.1 MB)
فهرست مطالب
مفاهیم داده کاوی
مدیریت ذخیره سازی و دستیابی اطلاعات
ساختار بانک اطلاعاتی سازمان
داده کاوی (Data Mining
مفاهیم پایه در داده کاوی
تعریف داده کاوی
مراحل فرایند کشف دانش از پایگاه داده ها
الگوریتم های داده کاوی
آماده سازی داده برای مدل سازی
درک قلمرو
ابزارهای تجاری داده کاوی Tools DM Commercial
منابع اطلاعاتی مورد استفاده
محدودیت های داده کاوی
حفاظت از حریم شخصی در سیستم‌های داده‌کاوی
کاربردهای داده کاوی
کاربرد داده کاوی در کسب و کار هوشمند بانک
داده کاوی درمدیریت ارتباط بامشتری
کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی
داده کاوی و مدیریت موسسات دانشگاهی
داده کاوی و مدیریت بهینه وب سایت ها
داده‌کاوی و مدیریت دانش
کاربرد داده‌کاوی در آموزش عالی
وب کاوی
معماری وب کاوی
مشکلات ومحدودیت های وب کاوی در سایت های فارسی زبان
محتوا کاوی وب
داده کاوی در شهر الکترونیک
زمینه داده کاوی در شهر الکترونیک
کاربردهای داده کاوی در شهر الکترونیک
چالش های داده کاوی در شهر الکترونیک
45000 تومان – خرید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

شبکه های اجتماعی

لینک های مفید

جواز های ما

تعداد کاربران 298 عدد
تعداد محصولات 1336 عدد
تعداد نوشته ها 7 عدد