یادگیری افزایشی که به خصوص اخیراً در بخش کلان داده‌ها و یادگیری جریان بسیار مورد توجه قرار گرفته، با فرضیات سنتی یعنی در دسترس بودن کل داده آموزشی در تناقض است. روش‌های یادگیری ماشین، تمامی داده های جمع آوری شده را استفاده می‌کنند تا اطلاعات مرتبط را از مدل استخراج نموده و یا با استفاده از این مدل بتوانند پیش بینی خود را انجام دهند. اما رویکردهای یادگیری ماشین دسته‌ای (batch) کلاسیک قادر نیستند تا حجم معینی از داده را که در زمانی خاص در دسترس قرار می‌گیرند را پردازش کنند؛ بنابراین حجمی از داده‌های پردازش نشده در دسترس خواهند بود و باید مدل مرتباً از نو ساخته شود. بنابراین این یک روند زمانبری خواهد بود و باعث می‌شود که مدل از رده خارج شود.

زمانی تمام داده‌ها در دسترس قرار نمی‌گیرند که یا داده‌ها آنلاین تولید می‌شوند (یادگیری آنلاین) مانند پیش بینی داده‌های بورس، و یا حجم بسیار زیادی از داده در اختیار داریم و نمی‌توانیم در حافظه اصلی (RAM) سیستم قرار دهیم مانند آنچه که مربوط به کلان داده‌هاست(big data). بنابراین در هر برهه‌ای از زمان داده‌های متفاوتی در دست داریم.

Post Views: 41