امروز، ما قصد داریم در دنیای پردازش زبان طبیعی (NLP)، برخی از موارد استفاده صنعتی محبوب برای NLP و اینکه چگونه میتوانید NLP را در یک گردش کار مشترک هوش تجاری (BI) به کار ببرید، بپردازیم.
پردازش زبان طبیعی (NLP) در یک نگاه
NLP مجموعه ای از کارها و الگوریتم های پردازش داده است که به گونه ای طراحی شده اند که رایانه ها را قادر می سازد قوانین پیچیده زبان انسانی ما را درک کنند. به طور سیستماتیک زبان را به قطعات کوچک و کوچکی تقسیم می کند که می توانند توسط ماشین ها تفسیر شوند. هدف نهایی NLP کالبدشکافی ویژگی ها و تفاوت های ظریف زبان ما برای خلاصه کردن و استفاده از داده هایی است که فاقد بافت یا ساختار هستند.
این یک باور عمومی است که همپوشانی زیادی در برنامه های NLP و هوش تجاری BI وجود ندارد، که از داده های ساختار یافته تری استفاده می کند، اما هنوز موارد استفاده ارزشمندی وجود دارد که می توانیم از NLP استفاده کنیم.
NLP همه جا در اطراف ما است
چه رباتهای چت خدمات مشتری، چه دستیاران مجازی یا نوار جستجوی Google، اکثر مردم هر روز با NLP تعامل دارند. به عنوان مثال، یک موتور جستجو کلمات کلیدی را از یک جستجو بیرون می کشد و از آن برای یافتن محتوایی که کاربرانی که موارد مشابه را جستجو کرده اند استفاده می کند، استفاده می کند. در حالی که این یک نسخه بسیار ساده از کاری است که یک موتور جستجو می تواند انجام دهد، تنها بخش کوچکی از استفاده از NLP را نشان می دهد.
با افزایش استفاده و دسترسی NLP، تقاضا برای NLP به عنوان راهی برای آسانتر کردن و در دسترستر کردن تجربه کاربر، علاوه بر مزایایی که از پیشرو بودن در توسعه NLP حاصل میشود، افزایش یافته است. تیمی از تحلیلگران به عنوان پلی عالی بین مرحله توسعه بسیار فنی و مخاطبان عمومی مانند سهامداران علاقه مند عمل می کنند:
NLP در هوش تجاری
سه مورد عمده استفاده از NLP در قلمرو هوش تجاری (BI) وجود دارد:
- برچسبگذاری داده / Data labeling
- طبقهبندی / Classification
- خلاصهسازی / Summarization
Data labeling : برچسبگذاری دادهها با پیوست کردن خروجیهای NLP، خروجی مجموعه داده شما را گسترش میدهد. این به ویژه برای چیزی مانند پاسخ باز در نظرسنجی که در آن NLP می تواند تشخیص دهد که آیا چیزی مثبت، منفی یا خنثی بود، مفید است.
Classification : طبقه بندی عبارت است از گرفتن سوابق بهانه و اختصاص ساختار یا گروه بندی به آنها بر اساس موضوع متون. اگر می خواهید بخشی داشته باشید که به طور خاص به دنبال ذکر نام محصول شما باشد، طبقه بندی می تواند گروه های بهتری برای ساختار بهتر داده های شما ایجاد کند.
Summarization : خلاصه سازی یک مورد استفاده رو به رشد است که با گرفتن یک مجموعه داده یا ابزار داده و نوشتن گزارشی در مورد روندها بدون نیاز به تحلیلگر نیاز به بررسی یک مجموعه داده و انجام این کار به صورت دستی است.
جایی که NLP در اکوسیستم هوش تجاری (BI) قرار می گیرد
NLP را می توان در چندین لایه مختلف در اکوسیستم هوش تجاری BI استفاده کرد که هر کدام مزایای خاص خود را دارند، مانند:
- لایه استخراج / Extract (ETL) layer
- لایه آماده سازی / Preparation layer
- لایه تعامل / Interaction layer
پیاده سازی NLP در لایه ETL به کاربران اجازه می دهد تا با داده ها در مقیاس در فضای ابری تعامل داشته باشند. این همچنین به تحلیلگران امکان دسترسی به تعدادی ابزار و خدمات را می دهد که به طور خاص برای این لایه طراحی شده اند. اگر دادهها از طریق یک کار NLP در اینجا اجرا شوند، نتایج به آسانی برای سایر تحلیلگران در پایینتر خط لوله در دسترس است تا برای اهداف خود استفاده کنند.
به عنوان یک نکته، اگر کاربران هنوز در مرحله اکتشاف بدون جهت مشخصی از جایی که می خواهند در پروژه بروند، این لایه پیاده سازی ممکن است خوب نباشد.
بزرگترین مزیت پیاده سازی NLP در لایه آماده سازی، افزایش ویژگی کاری است که NLP می تواند انجام دهد یا در داده ها جستجو کند. با دادههایی که تا این حد وارد خط لوله شده است، NLP میتواند با کنترل بسیار بهتری بر نتایجی که ممکن است یک تحلیلگر به دنبال آن باشد، استفاده شود.
در لایه تعامل تجزیه و تحلیل، یک مورد استفاده رو به رشد در فشار برای ابزارهای بدون کد وجود دارد که به کاربران اجازه می دهد داشبورد خود را با سرویس یا ابزاری تقویت کنند که به آنها امکان می دهد نتایجی را به زبان طبیعی ایجاد کنند که می تواند از طریق Slack یا کانال های دیگر به اشتراک گذاشته شود.
اکنون مجموعه ای از برنامه ها مانند تبلو Tableau Server وجود دارد که به تحلیلگران اجازه می دهد آن نتایج زبان طبیعی را برای افزایش سهولت استفاده ایجاد کنند.
NLP در عمل
چهار مرحله در فرآیند NLP وجود دارد:
- تعیین هدف / Set a goal
- شناسایی منبع داده/ Identify the data source
- دریافت/ پردازش داده / Ingest/process data
- تجسم و تجزیه و تحلیل / Visualize and analyze
این فرآیند چهار مرحله ای باید به راهنمایی یک تحلیلگر با اجرای بالقوه NLP کمک کند:
ابتدا، تحلیلگر باید به وضوح مشخص کند که هدف یک تحلیل چیست. این شامل تصمیم گیری در مورد اینکه آیا اکتشافی است یا نه. در مرحله بعد، تحلیلگر باید تعیین کند که آیا داده ها برای NLP مناسب هستند، به خصوص اگر ساختار یافته یا بدون ساختار باشد. سپس، تحلیلگر باید دریابد که چه منابعی برای انجام NLP در دسترس دارد. برای مرحله نهایی، تحلیلگر باید تصمیم بگیرد که چه خروجی هایی برای کاربر نهایی ارزشمندتر هستند.
دیدگاهتان را بنویسید