تفاوت بین متن کاوی و تجزیه و تحلیل متن(Text Mining vs Text Analytics)

تفاوت بین متن کاوی و تجزیه و تحلیل متن(Text Mining vs Text Analytics)

 

داده های ساختاری از اوایل دهه 1900 وجود داشته است، اما آنچه باعث استخراج متن (Text Mining) و تجزیه و تحلیل متن(Text Analytics) شده است، استفاده از اطلاعات از داده های بدون ساختار (پردازش زبان طبیعی(NLP)) است. هنگامی که ما قادر به تبدیل این متن بدون ساختار به داده های نیمه ساختاریافته یا ساختاریافته باشیم، استفاده از همه الگوریتم های داده کاوی پیشین در دسترس خواهد بود. الگوریتم های آماری و یادگیری ماشین.

 

حتی دونالد ترامپ توانست از این داده ها استفاده کند و آنها را به اطلاعاتی تبدیل کند که به او کمک کرد تا در انتخابات ریاست جمهوری آمریکا پیروز شود، اما اساساً او این کار را به صورت دستی انجام نداد.

بسیاری از مشاغل شروع به استفاده از استخراج متن کرده اند تا از ورودی های ارزشمند متن موجود در آنجا استفاده کنند، به عنوان مثال، یک شرکت مبتنی بر محصول می تواند از داده های توییتر / داده های فیس بوک استفاده کند تا بداند محصول آنها در دنیا با استفاده از تحلیل و بررسی احساسات مشتریان چقدر خوب یا بد عمل می کند. در روزهای اولیه پردازش، برای پردازش یا حتی پیاده سازی الگوریتم های یادگیری ماشین زمان زیادی را صرف می کردند، روزها طول می کشید، اما با معرفی ابزارهایی مانند Hadoop ، Azure ، KNIME و سایر نرم افزارهای پردازش داده های بزرگ استخراج متن محبوبیت زیادی در بازار پیدا کرده است. یکی از بهترین نمونه های تجزیه و تحلیل متن با استفاده از استخراج ارتباط، موتور توصیه آمازون است که به طور خودکار به مشتریان خود توصیه می کند سایر افراد هنگام خرید هر یک از محصولات خاص چه چیز دیگری خریداری کنند.

ادامه نوشته

متن کاوی چیست؟

همان طور که تا اینجا صحبت کردیم، متوجه شدیم که داده‌های متنی غیر ساخت‌یافته، بزرگترین منبع داده‌های تولید شده به وسیله انسان محسوب می‌شوند که روز به روز در سرتاسر جهان بر حجم آن افزوده می شود. در این برهه زمانی شرکت ها با این سوال مواجه هستند که با این داده ها چه کار کنند؟

این داده‌ها، از یک سو، به شرکت‌های تجاری این امکان را می‌دهند تا بتوانند بینش هوشمندانه و دانش مفیدی را در رابطه با دیدگاه مردم، نسبت به یک محصول یا سرویس خاص، کسب کنند. شرکت‌ها قادر خواهند بود از طریق اطلاعات به دست آمده از تحلیل ایمیل‌های مشتریان، نقدهای محصولات، مطالب شبکه‌های اجتماعی، بازخورد مشتریان و سایر موارد، ایده‌های جالبی در مورد بهبود محصولات و خدمات کنونی یا ارائه خدمات و محصولات جدید کسب کنند. از سوی دیگر، چالش بزرگ شرکت‌ها، نحوه ی «پردازش (Processing) »این حجم از داده‌های غیر ساخت‌یافته است. اینجا است که اهمیت و نقش متن کاوی، برای شرکت‌ها مشخص می‌شود.

 

ادامه نوشته