متن کاوی چیست و چگونه ؟!


متن کاوی به معنای دسته بندی اطلاعات متنی غیر ساخت یافته به اطلاعات قابل آنالیز ساخت یافته است .
با متن کاوی شرکت های بزرگ میتوانند اطلاعات بزرگ و ساختمان داده های پیچیده را به شکلی ساده سریع و بسیار موثرتری

تجزیه وتحلیل کنند .

اولین بار توسط ۴ دانشمند داده کاوی شروع شد ، Weizz S ، Indurkhya N ، Zhang T ، Damerau F

و توسط شرکت Springer-Verlag شروع به کار کرد

البته در سال ۱۳۷۵ شمسی Indurkhya N کتاب را نوشت و شروع کرد به نوشتن توضیحات در مورد کیت های نرم افزاری که میتوانند این موضوع رو به جلو حرکت بدهند..

ولی هنوز هم حس میکنم یکم قبل تر خیلی های دیگه در این مورد فکر کرده اند و ایده هایی داشتن!!

یکم قبل تر توسط Ronen Feldman که هیچ اطلاعاتی از توی ویکیپدیا نیست !

کتابی تهیه شد و اطلاعات جمع آوری شد که این اطلاعات در سال ۲۰۰۰ بررسی هایی رو نشون که در سال ۱۹۸۰ معلوم شد که

از آن سالها داده کاوی با متن کاوی شروع شده بود که توسط موارد علمی و بویژه دستگاههای جاسوسی مورد استفاده بوده .

ولی من فکر میکنم به عقب تر باید بریم ولی دیگه واقعا از Text Mining دور میشیم و به زبان شناسی مجبوریم برسیم ونزدیک بشیم

ما در انتها در Text Mining به دنبال LSA هستیم این موضوع انقدر ها مهم هست که هنوز هم در حال گسترش میباشد و

اطلاعات پایش شده ۱۰۰ درصد تایید شده ایی وجود ندارد .

در سال ۲۰۰۵ Fridolin Wild یا به اختصار Wild F شروع به کار کرد و اولین تکه کد برنامه نویسی شده با زبان R را تولید کرد که

آخرین نمونه کار ایشون سال ۲۰۲۲ آپدیت شده ،

text mining

فصل اول و روز اول رو به این صورت آماده میکنیم که …

نوشته‌های مشابه