امروزه کتابخانههای بسیار زیادی وجود دارند که میتوانند به مصورسازی دادههای شما کمک کنند. یکی از قدرتمندترین و محبوبترین کتابخانههایی که برای مصورسازی دادهها به کار برده میشود، کتابخانه matplotlib است که از آن میتوان برای رسم نمودارهای مختلف مانند نمودارهای خطی، نمودارهای نواری، نمودارهای پراکندگی و... استفاده کرد. برای آشنایی بیشتر، قصد داریم در این مقاله به معرفی کتابخانه matplotlib برای مصورسازی دادهها بپردازیم و بیشتر درمورد آن توضیح دهیم.
کتابخانه matplotlib چیست؟
کتابخانه matplotlib یکی از کتابخانههای محبوبی است که برای تجسم دادهها توسط کاربران پایتون استفاده میشود. کتابخانه matplotlib را میتوان از قدرتمندترین کتابخانهها برای مصورسازی دادهها دانست. علاوه بر کاربران پایتون، افرادی که با NumPy کار میکنند نیز میتوانند از این کتابخانه قدرتمند استفاده کنند. در حال حاضر، پر استفادهترین ماژول این کتابخانه، ماژول Pyplot است. این ماژول رابط کاربریای مشابه MATLAB دارد.
در معرفی کتابخانه matplotlib برای مصورسازی دادهها باید گفت که تفاوت این کتابخانه و این ماژول با MATLAB در این است که از زبان پایتون استفاده میکند و منبع باز نیز محسوب میشود.
نصب کتابخانه matplotlib
برای اینکه بتوانید کتابخانه matplotlib را نصب کنید، ابتدا باید پایتون را اجرا و سپس دستور زیر را تایپ کنید:
python -m pip install -U matplotlib
اگر میخواهید که صرفا در حوزه علم داده و یادگیری کار کنید، پیشنهاد میکنیم که کار خود را با بسته توزیع آناکوندا شروع کنید. این بسته مهمترین چیزهایی که شما برای مصورسازی داده نیاز دارید را نصب میکند. در معرفی کتابخانه plot برای مصورسازی دادهها باید اشاره کرد که این کتابخانه روی بسیاری از سیستمعاملها مانند MacOS، Windows و Linux قابل نصب است.
اگر میخواهید که دسترسی سریعتری به این کتابخانه داشته باشید، میتوانید Google Colab را بررسی کنید که به صورت ابری پشتیبانی میشود یا خیر.
خوب است بدانید که شما میتوانید دادههای کتابخانه matplotlib را روی GPU خود بارگذاری کنید. با این کار میتوانید کار محاسبات و رندر گرفتن از آنها را سریعتر دریافت کنید. به طور کلی در معرفی کتابخانه Plot برای مصورسازی دادهها باید گفت که این کتابخانه برای انجام محاسبات نیازی به GPU ندارد.
قسمتهای اصلی کتابخانه matplotlib
کتابخانه matplotlib برای مصورسازی داده را به طور کلی میتوان به قسمتهای زیر دسته بندی کرد:
شکل
اولین قسمتی که برای مصورسازی دادههای خود به کمک کتابخانه matplotlib باید به آن مراجعه کنید، قسمت شکل یا همان Figure است. در این قسمت شما میتوانید یک یا چند محور را برای مصور کردن دادههای خود انتخاب کنید.
محورها
محورها مهمترین قسمت از هر کتابخانه برای مصورسازی دادهها هستند. در معرفی کتابخانه matplotlib برای مصورسازی دادهها شما میتوانید محورهای بسیار زیادی را رسم کنید. محورها میتوانند دو یا سه بعدی باشند. محورهای رسم شده یک برچسب x و یک برچسب y دارند.
متغیرها
شما میتوانید متغیرهای مختلفی را برای نمودارها تعیین کنید. بسته به اینکه چه نوع دادههایی را میخواهید مصور کنید، به متغیرهای مختلفی نیاز خواهید داشت.
Artist
قسمت Artist به طور اختصاصی برای اضافه کردن اشیای متنی، اشیای Line2D و اشیای مجموعه کاربرد دارد.
برخی از نمودارهای قابل رسم به کمک کتابخانه matplotlib
در ادامه معرفی کتابخانه matplotlib برای مصورسازی دادهها به برخی از نمودارهای قابل رسم توسط این کتابخانه اشاره خواهیم کرد:
نمودارهای میلهای
نمودارهای میلهای از رایجترین نمودارهایی هستند که برای مصورسازی داده به کار برده میشوند. در کتابخانه matplotlib برای رسم این نمودار باید از یک متد bar () استفاده کنید که آرگومانها را در بر میگیرد. شما میتوانید به کمک دستورهای مختلف مانند متغیرهای طبقه بندی، مقادیر و رنگ نمودار را تغییر دهید.
برای رسم نمودارهای میلهای افقی از متد bar () استفاده میشود که میتوان آرگومان آن را انتخاب کرد.
برای ایجاد نمودارهای نواری انباشته شده به صورت افقی نیز میتوان از متد bar () دوبار استفاده کرد. برای رسم این نمودارها میتوان شاخصها و عرض نمودارهای میلهای را ذکر کرد.
نمودارهای دایره
یکی دیگر از نمودارهایی که درست به اندازه نمودارهای میلهای برای مصورسازی دادهها به کار برده میشود، نمودار دایرهای است. برای رسم نمودارهای دایرهای از متد pie () استفاده میشود. همچنین در معرفی کتابخانه matplotlib برای مصورسازی دادهها خوب است اشاره کنیم که میتوان از آرگومانهای مختلف برای سفارشی سازی نمودارهای دایرهای استفاده کرد.
هیستوگرام
نمودار هیستوگرام یکی از رایجترین مدلهای نمودار است که میتواند برای دادههایی که به دو نسبت نیاز دارند، مانند قد و وزن، قیمت سهام و... استفاده شود. نمودارهای هیستوگرام در محدودههای مختلف رسم میشوند. هیستوگرام برای نشان دادن دادههایی که به آمار و احتمال مربوط میشوند کاربرد دارند؛ به همین دلیل بسیار رایج هستند. این نوع نمودارها برای توزیع نرمال، توزیع t و... به کار برده میشوند.
جمع بندی
اگر قصد دارید دادههای خود را مصورسازی کنید اما نمیدانید که چه کتابخانهای میتواند برای مصورسازی دادهها به شما کمک کند، ما به شما کتابخانه plot را پیشنهاد میکنیم. کتابخانه matplotlib برای زبان پایتون ساخته شده است و تواناییهای زیادی در رسم نمودارهای مختلف برای مصورسازی دادهها دارد. به همین دلیل برای آشنایی بیشتر در این مقاله به معرفی کتابخانه matplotlib برای مصورسازی دادهها پرداختیم و در مورد این نمودار توضیح دادیم.