اکنون که فایلهای داده را در تبلو پرپ Tableau prep بارگذاری کرده اید، مطمئن هستید که می خواهید همه فایل ها را با هم ترکیب کنید.
داده های خود را کاوش کنید / Explore your data
اکنون که فایل های داده را در تبلو Tableau Prep بارگذاری کرده اید، کاملا مطمئن هستید که می خواهید همه فایل ها را با هم ترکیب کنید. اما قبل از اینکه این کار را انجام دهید، ممکن است ایده خوبی باشد که ابتدا به آنها نگاهی بیندازید و ببینید آیا می توانید مشکلاتی را تشخیص دهید.
هنگامی که یک مرحله ورودی را در قسمت Flow انتخاب میکنید، میتوانید تنظیمات مورد استفاده برای وارد کردن دادهها، فیلدهای موجود و پیشنمایش مقادیر خود را ببینید.
این مکان خوبی است برای تصمیم گیری اینکه چه مقدار داده را می خواهید در فلوی خود بگنجانید و فیلدهایی را که نمی خواهید حذف یا فیلتر کنید. همچنین می توانید انواع داده هایی را که به اشتباه اختصاص داده شده اند تغییر دهید.
- نکته: اگر با مجموعه داده های بزرگ کار می کنید، Tableau Prep به طور خودکار نمونه ای از داده ها را برای به حداکثر رساندن کارایی وارد می کند. اگر دادههای مورد انتظار را نمیبینید، ممکن است لازم باشد نمونه را تنظیم کنید. می توانید این کار را در تب Data Sample انجام دهید.
در پنجره Flow، همانطور که هر مرحله را انتخاب میکنید و به هر مجموعه داده نگاه میکنید، متوجه چند چیز میشوید که میخواهید بعداً آنها را برطرف کنید و یک چیز را میتوانید اکنون در مرحله Input اصلاح کنید.
- فیلد State از اختصارات برای نام ایالت استفاده می کند. سایر فایلها این را توضیح میدهند، بنابراین باید بعداً آن را برطرف کنید.
- فیلدهای زیادی وجود دارد که با Right_ شروع می شوند. به نظر می رسد این فیلدها تکراری از فیلدهای دیگر هستند. شما نمی خواهید این فیلدهای تکراری را در جریان خود قرار دهید. این چیزی است که می توانید در اینجا در مرحله Input آن را برطرف کنید:
برای رفع این مشکل، کادر بررسی تمام فیلدهایی که با Right_ شروع می شوند را پاک کنید. این به Tableau Prep میگوید که این فیلدها را نادیده بگیرد و آنها را در جریان قرار ندهد.
نکته: هنگامی که عملیات تمیز کردن را در یک مرحله انجام می دهید، مانند حذف فیلدها، Tableau Prep تغییرات شما را در قسمت Changes ردیابی می کند و یک حاشیه نویسی (به شکل یک نماد کوچک) در بخش Flow اضافه می کند تا به شما کمک کند اقداماتی را که روی داده های خود انجام می دهید پیگیری کنید.
- تاریخ های سفارش و تاریخ های ارسال به فیلدهای ماه، روز و سال تفکیک می شوند.
- برخی از فیلدها انواع داده های متفاوتی نسبت به فیلدهای مشابه در سایر فایل ها دارند.
- فیلدی برای Region وجود ندارد.
قبل از اینکه بتوانید این فایل را با فایل های دیگر ترکیب کنید، باید این فیلدها را تمیز کنید. اما نمیتوانید آن را در اینجا در مرحله Input حل کنید، بنابراین برای انجام این کار بعداً یادداشت کنید
فیلدهای این فایل به نظر می رسد که به خوبی با سایر فایل ها هماهنگ هستند. اما به نظر می رسد که مقادیر Sales همگی دارای کد ارز هستند. بعداً باید آن را نیز اصلاح کنید.
اکنون که چند مشکل ساز را در مجموعه داده های خود شناسایی کرده اید، گام بعدی این است که داده های خود را کمی دقیق تر بررسی کنید و مسائلی را که پیدا می کنید پاک کنید تا بتوانید داده های خود را ترکیب و شکل دهید و یک فایل خروجی ایجاد کنید که بتوانید از آن برای تجزیه و تحلیل استفاده کنید.
دیدگاهتان را بنویسید