961405

داده‌کاوی چیست؟

داده‌کاوی چیست؟

داده‌کاوی عبارت است از فرآیند اکتشاف الگو و روندهای منظم و پنهان در داده‌های بزرگ و توزیع‌شده، با استفاده از مجموعه وسیعی از الگوریتم‌های مبتنی بر علوم ریاضی و آمار. این الگوریتم‌ها معمولاً بروی مقادیر عددی و غیرمتنی اعمال می‌شوند و برای داده‌های متنی، از الگوریتم‌های متن‌کاوی استفاده می‌شود. داده‌کاوی از علومی مانند هوش مصنوعی، یادگیری ماشینی، آمار، پژوهش عملیاتی و مدیریت پایگاه‌های داده برای ساخت مدل‌ها و پاسخ به سؤالات بهره می‌برد. استخراج و تحلیل اطلاعات سازمان از داده‌های در دسترس توسط کارکنان، فرایندی است که برای‌ سال‌های متمادی انجام‌شده و وظیفه جدیدی در سازمان‌ها به شمار نمی‌آید. اولین الگوریتم‌های شناسایی روندهای منظم و الگوها در پایگاه داده، از علم آمار و نظریه‌های احتمال نشات گرفته‌اند. در سال‌های اخیر، با رشد روزافزون قدرت محاسباتی رایانه‌ها و امکان دستیابی به نتایج حاصل از محاسبات پیچیده در مدت‌زمان کوتاه، سبب شده است تا الگوریتم‌های پیشرفته ریاضی موردتوجه قرار بگیرند. این الگوریتم‌ها با درنظرگرفتن ابعاد مختلف داده‌، به پالایش و تحلیل آن پرداخته و الگوهای پیچیده و غیرقابل‌شناسایی توسط روش‌های قدیمی را استخراج و ارائه می‌کنند. رایانه‌ها کمک کرده‌اند تا فرآیند استخراج، پالایش، پیش‌پردازش و مدل‌سازی داده‌ها و همچنین  اعتبارسنجی یافته‌ها با دقت بیشتر و سرعتی بی‌نظیر انجام شود. داده‌کاوی در تلاقی سه رشته زیر است: ۱- آمار (مطالعه عددی روابط داده‌ها) ۲- هوش مصنوعی (هوش انسان‌ مانند که توسط نرم‌افزار و یا ماشین ظهور می‌یابد) ۳- یادگیری ماشین (الگوریتم‌هایی که می‌تواند با آموزش دیدن از داده‌ها، آینده را پیش‌بینی کند) با داده‌کاوی چه‌کارهایی می‌توان انجام داد: ۱- تمام داده‌های نامرتبط، بی‌فایده و تکراری را از مجموعه داده‌هایتان حذف کنید. ۲- موارد مرتبط را شناسایی کرده و از آن‌ها برای نیل به اهداف از پیش تعیین‌شده خود بهره ببرید. ۳- به فرایند تصمیم‌گیری آگاهانه سرعت ببخشید.