انواع نمودار ضروری برای تجسم داده ها

ساخت وبلاگ

نمودارها بخش اساسی کار با داده ها هستند ، زیرا آنها راهی برای متراکم کردن مقادیر زیادی از داده ها در یک قالب آسان برای درک هستند. تجسم داده ها می تواند بینش هایی را برای کسی که برای اولین بار به داده ها نگاه می کند ، و همچنین یافته هایی را به دیگران که داده های خام را نمی بینند منتقل کند. انواع بی شماری در آنجا وجود دارد که هر کدام موارد استفاده متفاوتی دارند. غالباً ، دشوارترین بخش برای ایجاد تجسم داده ها این است که بفهمید کدام نوع نمودار برای کار مورد نظر بهترین است.

انتخاب شما از نوع نمودار به چندین عامل بستگی دارد. انواع معیارها ، ویژگی ها یا متغیرهای دیگری که برای ترسیم برنامه ریزی می کنید چیست؟چه کسی مخاطبی است که شما قصد ارائه آن را دارید - آیا این فقط یک اکتشاف اولیه برای خودتان است یا به مخاطبان گسترده تری ارائه می دهید؟نتیجه گیری که می خواهید خواننده ترسیم کند چیست؟

در این مقاله ، ما یک مرور کلی از انواع نمودار ضروری را ارائه خواهیم داد که بیشتر آنها توسط ابزارهای تجسم ارائه می شود. با استفاده از این نمودارها ، شما یک ابزار گسترده خواهید داشت تا بتوانید نیازهای تجسم داده خود را برطرف کنید. راهنمایی در مورد زمان انتخاب هر یک بر اساس مورد استفاده ، در مقاله پیگیری پوشانده شده است.

چهار پایه

در کتاب خود شماره ها را به من نشان می دهد ، استفان چند کد اصلی را برای مقادیر عددی پیشنهاد می کند ، که نشان دهنده ارزش موقعیتی از طریق میله ها ، خطوط ، نقاط و جعبه ها است. بنابراین ما با چهار نوع نمودار اساسی شروع خواهیم کرد ، یکی برای هر یک از این روشهای رمزگذاری ارزش.

نمودار میله ای

This bar chart shows the number of purchases made by different user types

در یک نمودار نوار ، مقادیر با طول میله ها نشان داده شده است که هر یک از آنها با یک گروه اندازه گیری مطابقت دارد. نمودارهای نوار می توانند به صورت عمودی یا افقی جهت یابی شوند. نمودارهای نوار عمودی گاهی اوقات نمودارهای ستون نامیده می شوند. نمودارهای نوار افقی گزینه خوبی است که شما میله های زیادی برای ترسیم دارید ، یا برچسب های روی آنها به فضای اضافی برای خوانا نیاز دارند.

نمودار خط

This line chart shows changes in a currency exchange rate over time

نمودارهای خط تغییرات در ارزش را در اندازه گیری های مداوم ، مانند موارد انجام شده با گذشت زمان نشان می دهد. حرکت خط بالا یا پایین به ترتیب به ایجاد تغییرات مثبت و منفی کمک می کند. همچنین می تواند روندهای کلی را در معرض دید قرار دهد ، تا به خواننده کمک کند پیش بینی یا پیش بینی هایی را برای نتایج آینده انجام دهد. نمودارهای چند خط همچنین می تواند به سایر نمودارهای مرتبط مانند طرح Sparkline یا Ridgeline منجر شود.

طرح پراکنده

This scatter plot demonstrates a moderate linear correlation between two numeric variables

یک نقشه پراکندگی مقادیر را در دو متغیر عددی با استفاده از نقاط قرار گرفته در دو محور نشان می دهد: یکی برای هر متغیر. توطئه های پراکندگی یک نمایش همه کاره از رابطه بین متغیرهای ترسیم شده است-خواه این همبستگی قوی باشد ، ضعیف ، مثبت یا منفی ، خطی یا غیرخطی. توطئه های پراکندگی همچنین برای شناسایی نقاط دور افتاده و شکاف های احتمالی در داده ها بسیار عالی هستند.

طرح

This box plot compares the distribution of a numeric variable for three levels of a categorical variable

یک طرح جعبه برای خلاصه توزیع مقادیر در گروه های اندازه گیری شده از جعبه ها و ویسک ها استفاده می کند. موقعیت های جعبه و ویسکر به پایان می رسد مناطقی را نشان می دهد که اکثر داده ها در آن قرار دارند. ما معمولاً وقتی چندین گروه برای مقایسه با یکدیگر داریم ، توطئه های جعبه را می بینیم. نمودارهای دیگر با جزئیات بیشتر وقتی فقط یک گروه برای ترسیم داریم ترجیح داده می شود.

جداول و مقادیر منفرد

Single statistics can be reported as they are rather than as a chart

قبل از حرکت به انواع نمودارهای دیگر ، ارزش آن را دارد که لحظه ای از گزینه نمایش شماره های خام قدردانی کنید. به طور خاص ، هنگامی که شما فقط یک شماره برای نمایش دارید ، فقط نمایش مقدار یک رویکرد معقول برای به تصویر کشیدن داده ها است. هنگامی که مقادیر دقیق در یک تجزیه و تحلیل مورد توجه قرار می گیرند ، می توانید آنها را در یک جدول همراه یا از طریق حاشیه نویسی در یک تجسم گرافیکی قرار دهید.

تغییرات مشترک

انواع نمودار اضافی می تواند ناشی از تغییر روش های رمزگذاری یا با استفاده از رمزگذاری های اضافی باشد. رمزگذاری های ثانویه مانند منطقه ، شکل و رنگ می تواند برای افزودن متغیرهای اضافی به انواع اصلی نمودار مفید باشد.

بافت نگار

This histogram shows the distribution of response times to a ticketing system, grouped by hours

اگر گروه هایی که در یک نمودار نوار به تصویر کشیده شده در واقع دامنه عددی مداوم هستند ، می توانیم میله ها را به هم فشار دهیم تا یک هیستوگرام تولید کنیم. طول نوار در هیستوگرام به طور معمول با تعداد نقاط داده مطابقت دارد و الگوهای آنها توزیع متغیرها در داده های شما را نشان می دهد. هنگامی که مقدار عمودی تعداد فرکانس نیست ، یک نوع نمودار متفاوت مانند نمودار خط تمایل به استفاده دارد.

نمودار نوار انباشته

This stacked bar chart shows revenue by store location, divided by department

یکی از اصلاحات نمودار نوار استاندارد ، تقسیم هر نوار به چندین میله کوچکتر بر اساس مقادیر متغیر گروه بندی دوم ، به نام نمودار نوار انباشته است. این به شما امکان می دهد نه تنها مقادیر گروهی اولیه مانند یک نمودار نوار معمولی را مقایسه کنید ، بلکه یک شکست نسبی کل گروه را در قسمت های تشکیل دهنده آن نشان می دهد.

نمودار نوار گروهی

This grouped bar chart shows new quarterly revenue divided by representative

اگر از طرف دیگر ، زیر بارها به جای نگه داشتن در پشته های خود ، در کنار هم قرار می گرفتند ، نمودار نوار گروهی را بدست می آوریم. نمودار نوار گروهی امکان مقایسه تعداد گروه های اولیه را فراهم نمی کند ، اما کار بسیار بهتری را برای مقایسه گروه های زیر گروه انجام می دهد.

طرح

This dot plot shows differences in performance for different experimental conditions

یک طرح نقطه مانند یک نمودار نوار است به این ترتیب که مقادیر گروه های مختلف طبقه بندی را نشان می دهد ، اما مقادیر را بر اساس موقعیت یک نقطه رمزگذاری می کند تا طول یک نوار. توطئه های نقطه زمانی مفید هستند که شما نیاز به مقایسه در دسته ها دارید ، اما پایه صفر آموزنده یا مفید نیست. همچنین می توانید یک طرح نقطه مانند یک طرح خط با خط برداشته شده فکر کنید ، به طوری که می توان از متغیرهایی با دسته های بدون هماهنگ استفاده کرد و نه فقط متغیرهای مداوم یا سفارش داده شده.

نمودار منطقه

This area chart shows number of daily trips, divided by user type

نمودار منطقه با همان پایه به عنوان یک نمودار خط شروع می شود - نقاط ارزش متصل به بخش های خط - اما در یک مفهوم از نمودار نوار با سایه بین خط و یک پایه اضافه می کند. این نمودار اغلب در هنگام ترکیب با مفهوم انباشت مشاهده می شود ، تا نشان دهد که چگونه یک کل با گذشت زمان تغییر کرده است ، بلکه همچنین چگونه سهم مؤلفه های آن تغییر کرده است.

نمودار دو محور

This dual-axis bar+line chart shows number of new customers and average acquisition cost over time

نمودارهای محور دو محور دو نمودار مختلف را با یک محور افقی مشترک پوشانده اند ، اما مقیاس محور عمودی بالقوه متفاوت (یکی برای هر نمودار مؤلفه). این می تواند برای نشان دادن مقایسه مستقیم بین دو مجموعه از مقادیر عمودی مفید باشد ، در حالی که شامل زمینه متغیر محور افقی نیز هست. استفاده از انواع مختلف نمودار پایه مانند نوار و ترکیب خط ، برای کاهش سردرگمی مقیاس های مختلف محور برای هر نمودار مؤلفه معمول است.

نمودار حباب

This bubble chart shows the relationship between three numeric variables by x-position, y-position, and point size

راه دیگر برای نشان دادن رابطه بین سه متغیر از طریق اصلاح یک طرح پراکندگی است. هنگامی که یک متغیر سوم طبقه بندی شده است ، امتیازها می توانند از اشکال یا رنگهای مختلف برای نشان دادن عضویت در گروه استفاده کنند. اگر نقاط داده به نوعی سفارش داده شوند ، می توان نقاط را نیز با بخش های خط وصل کرد تا توالی مقادیر را نشان دهد. هنگامی که متغیر سوم از نظر طبیعت عددی است ، جایی که نمودار حباب وارد می شود. یک نمودار حباب با داشتن مقدار متغیر سوم ، اندازه هر نقطه را بر روی طرح پراکندگی پایه ایجاد می کند.

منحنی چگالی

This density curve shows a smooth distribution by adding a smooth amount of area around each data point

منحنی چگالی یا برآورد چگالی هسته ، یک روش جایگزین برای نمایش توزیع داده ها به جای هیستوگرام است. به جای جمع آوری نقاط داده در سطل های فرکانس ، هر نقطه داده به حجم کمی از داده ها کمک می کند که کل جمع آوری شده به منحنی چگالی تبدیل می شود. در حالی که منحنی های چگالی ممکن است حاکی از مقادیر داده ای باشد که وجود ندارند ، می تواند راهی مناسب برای صاف کردن نویز در داده ها باشد تا درک سیگنال توزیع را بدست آورد.

نقشه ویولن

This violin plot compares the distribution of a numeric variable for three levels of a categorical variable

گزینه ای برای رویکرد طرح جعبه برای مقایسه توزیع ارزش بین گروه ها ، طرح ویولن است. در یک نقشه ویولن ، هر مجموعه جعبه و ویسک با منحنی چگالی ساخته شده در اطراف یک پایه مرکزی جایگزین می شود. این می تواند مقایسه بهتری از شکل داده ها بین گروه ها را فراهم کند ، اگرچه این امر در مقایسه مقادیر آماری دقیق از دست می دهد. تنوع مکرر برای توطئه های ویولن شامل علائم جعبه در بالای طرح ویولن برای به دست آوردن بهترین ها در هر دو جهان است.

نقشه حرارت

This heatmap shows new revenue by quarter and representative

نقشه گرما شبکه ای از مقادیر را بر اساس دو متغیر مورد علاقه ارائه می دهد. متغیرهای محور می توانند عددی یا طبقه ای باشند. شبکه با تقسیم هر متغیر به محدوده یا سطحی مانند هیستوگرام یا نمودار نوار ایجاد می شود. سلولهای شبکه بر اساس ارزش رنگی هستند ، اغلب با رنگ های تیره تر مطابق با مقادیر بالاتر. هنگامی که تعداد زیادی از نقاط داده برای ترسیم وجود دارد ، یک نقشه گرما می تواند یک جایگزین جالب برای یک طرح پراکندگی باشد ، اما چگالی نقطه دیدن رابطه واقعی بین متغیرها را دشوار می کند.

نمودارهای تخصصی

نمودارهای اضافی زیادی در آنجا وجود دارد که داده ها را به روش های دیگر برای موارد استفاده خاص رمزگذاری می کند. Xenographics شامل مجموعه ای از برخی از نمودارهای خیالی است که توسط اهداف بسیار خاص هدایت شده اند. با این وجود ، برخی از این نمودارها از مواردی استفاده می کنند که به اندازه کافی مشترک هستند که می توان آنها را برای دانستن ضروری دانست.

نمودار دایره ای

This pie chart shows share of votes for candidates following an election

ممکن است با توجه به اینکه میزان استفاده از آنها در بخش "متخصص" در اینجا در بخش "متخصص" توقیف می شود ، تعجب کنید. با این حال ، نمودارهای پای از رمزگذاری غیر معمول استفاده می کنند و مقادیر را به عنوان مناطقی که از یک شکل دایره ای خرد شده است ، به تصویر می کشد. از آنجا که یک نمودار پای به طور معمول فاقد علائم ارزش در اطراف محیط آن است ، معمولاً گرفتن ایده خوبی از اندازه های برش دقیق دشوار است. با این حال ، نمودار پای و پسر عموی آن The Donut Plot در گفتن خواننده به خواننده می گوید که مقایسه بخشی به کل باید اصلی ترین راه حل از تجسم باشد.

نمودار قیف

This funnel chart shows conversion rates from impression and through clicks

نمودار قیف اغلب در زمینه های تجاری دیده می شود که بازدیدکنندگان یا کاربران باید در یک جریان خط لوله ردیابی شوند. نمودار نشان می دهد که چه تعداد کاربر از عرض قیف در هر تقسیم مرحله به هر مرحله از فرآیند ردیابی شده راه می یابند. باریک شدن قیف به فروش قیاس کمک می کند، اما می تواند نرخ تبدیل واقعی را مختل کند. نمودار میله ای اغلب می تواند همان هدفی را که یک نمودار قیفی انجام می دهد، انجام دهد، اما با نمایشی تمیزتر از داده ها.

نمودار گلوله

This bullet chart shows pageviews and downloads against goal benchmarks

نمودار گلوله ای یک نوار را با علامت های اضافی برای چگونگی متن بندی مقدار آن نوار افزایش می دهد. این معمولاً به معنای یک خط عمودی است که مقدار هدف را نشان می دهد، اما همچنین سایه پس زمینه را برای ارائه معیارهای عملکرد اضافی نشان می دهد. نمودارهای گلوله معمولاً برای چندین معیار استفاده می شوند و نسبت به سایر انواع سنج های خیالی تر برای نمایش فشرده تر هستند.

نمودارهای مبتنی بر نقشه

This choropleth shows how many people live in each state of the United States

تعدادی از خانواده های قطعه های تخصصی وجود دارد که بر اساس کاربری گروه بندی شده اند، اما ما این مقاله را با لمس یکی از آنها می بندیم: نقشه های مبتنی بر نقشه یا نقشه های جغرافیایی. هنگامی که مقادیر موجود در یک مجموعه داده با موقعیت های جغرافیایی واقعی مطابقت دارند، ترسیم آنها با نوعی نقشه می تواند ارزشمند باشد. یک مثال رایج از این نوع نقشه، choropleth مانند تصویر بالا است. این یک رویکرد نقشه حرارتی برای نشان دادن ارزش از طریق استفاده از رنگ دارد، اما به جای اینکه مقادیر در یک شبکه ترسیم شوند، آنها در مناطق روی نقشه پر می شوند.

برای یک راهنمای مرجع مفید برای انواع نمودارهای بیشتر و زمان استفاده از آنها، کتاب الکترونیکی رایگان ما را بررسی کنید، نحوه انتخاب تجسم داده مناسب.

نرم افزار مفید تریدر...
ما را در سایت نرم افزار مفید تریدر دنبال می کنید

برچسب : نویسنده : احمد شاملو بازدید : 38 تاريخ : شنبه 9 ارديبهشت 1402 ساعت: 15:47