پایتون – تجسم دادهها با استفاده از Bokeh
Bokeh یک کتابخانه تجسم داده در پایتون است که نمودارها و گرافهای تعاملی با عملکرد بالا را فراهم میکند. خروجی Bokeh میتواند در محیطهای مختلفی مانند نوتبوک، HTML و سرور تولید شود. همچنین امکان جاسازی نمودارهای Bokeh در برنامههای جنگو (Django) و فلسک (Flask) وجود دارد.
Bokeh دو رابط تجسم داده به کاربران ارائه میدهد:
- bokeh.models: یک رابط سطح پایین که انعطافپذیری بالایی را برای توسعهدهندگان برنامه فراهم میکند.
- bokeh.plotting: یک رابط سطح بالا برای ایجاد اشکال بصری.
برای نصب بسته Bokeh، دستور زیر را در ترمینال اجرا کنید:
pip install bokeh
کد #1: نشانگرهای پراکندگی
برای ایجاد نشانگرهای دایرهای پراکندگی، از متد circle()
استفاده میشود.
# وارد کردن ماژولها
from bokeh.plotting import figure, output_notebook, show
# خروجی به نوتبوک
output_notebook()
# ایجاد نمودار
p = figure(plot_width=400, plot_height=400)
# افزودن یک رندر دایرهای با اندازه، رنگ و شفافیت مشخص
p.circle([1, 2, 3, 4, 5], [4, 7, 1, 6, 3],
size=10, color="navy", alpha=0.5)
# نمایش نتایج
show(p)
کد #2: یک خط ساده
برای ایجاد یک خط ساده، از متد line()
استفاده میشود.
# وارد کردن ماژولها
from bokeh.plotting import figure, output_notebook, show
# خروجی به نوتبوک
output_notebook()
# ایجاد نمودار
p = figure(plot_width=400, plot_height=400)
# افزودن یک رندر خطی
p.line([1, 2, 3, 4, 5], [3, 1, 2, 6, 5],
line_width=2, color="green")
# نمایش نتایج
show(p)
کد #3: نمودار میلهای
نمودار میلهای دادههای دستهای را با میلههای مستطیلی ارائه میدهد. طول میله متناسب با مقدار نمایش داده شده است.
# وارد کردن ماژولهای مورد نیاز
import pandas as pd
from bokeh.charts import Bar, output_notebook, show
# خروجی به نوتبوک
output_notebook()
# خواندن دادهها در یک دیتافریم
df = pd.read_csv(r"D:/kaggle/mcdonald/menu.csv")
# ایجاد نمودار میلهای
p = Bar(df, "Category", values="Calories",
title="Total Calories by Category",
legend="top_right")
# نمایش نتایج
show(p)
کد #4: نمودار جعبهای
نمودار جعبهای برای نمایش دادههای آماری روی یک نمودار استفاده میشود. این نمودار به خلاصهسازی ویژگیهای آماری گروههای مختلف داده کمک میکند.
# وارد کردن ماژولهای مورد نیاز
from bokeh.charts import BoxPlot, output_notebook, show
import pandas as pd
# خروجی به نوتبوک
output_notebook()
# خواندن دادهها در یک دیتافریم
df = pd.read_csv(r"D:/kaggle/mcdonald/menu.csv")
# ایجاد نمودار جعبهای
p = BoxPlot(df, values="Protein", label="Category",
color="yellow", title="Protein Summary (grouped by category)",
legend="top_right")
# نمایش نتایج
show(p)
کد #5: هیستوگرام
هیستوگرام برای نمایش توزیع دادههای عددی استفاده میشود. ارتفاع هر مستطیل در هیستوگرام متناسب با فراوانی مقادیر در یک بازه خاص است.
# وارد کردن ماژولهای مورد نیاز
from bokeh.charts import Histogram, output_notebook, show
import pandas as pd
# خروجی به نوتبوک
output_notebook()
# خواندن دادهها در یک دیتافریم
df = pd.read_csv(r"D:/kaggle/mcdonald/menu.csv")
# ایجاد هیستوگرام
p = Histogram(df, values="Total Fat",
title="Total Fat Distribution",
color="navy")
# نمایش نتایج
show(p)
کد #6: نمودار پراکندگی
نمودار پراکندگی برای نمایش مقادیر دو متغیر در یک مجموعه داده استفاده میشود. این نمودار به یافتن همبستگی بین دو متغیر انتخاب شده کمک میکند.
# وارد کردن ماژولهای مورد نیاز
from bokeh.charts import Scatter, output_notebook, show
import pandas as pd
# خروجی به نوتبوک
output_notebook()
# خواندن دادهها در یک دیتافریم
df = pd.read_csv(r"D:/kaggle/mcdonald/menu.csv")
# ایجاد نمودار پراکندگی
p = Scatter(df, x="Carbohydrates", y="Saturated Fat",
title="Saturated Fat vs Carbohydrates",
xlabel="Carbohydrates", ylabel="Saturated Fat",
color="orange")
# نمایش نتایج
show(p)
دیدگاهتان را بنویسید