آشنایی اولیه با Pandas
Pandas یک کتابخانه پایتون است که برای انجام عملیات ریاضی به شیوهای انعطافپذیر مورد استفاده قرار میگیرد. Pandas یک کتابخانه اپن سورس است که در تجزیه و تحلیل دادهها و همچنین در manipulation دادهها مورد استفاده قرار میگیرد تا مدیران ارشد داده بتوانند بدین وسیله، اطلاعات را از داده بازیابی کنند. همچنین دارای لایسنس BSD است و جداول اعداد در آن به راحتی manipulate میشوند، به زبانهای پایتون، سایتون و C نوشته شده است. همانطور که گفته شد، این نرم افزار اپن سورس است و در مقایسه با کتابخانههای دیگر از عملکرد بالایی برخوردار است. این کتابخانه جداولی (و نه آرایههایی) را برای بازیابی حافظه فراهم میکند و استفاده از ساختارهای داده (data structures) در آن آسان است.
چرا پایتون اینقدر محبوب است؟
- مورد پسند برنامه نویسان بوده و درک آن آسان است.
- کتابخانههای پشتیبانی گستردهای دارد.
- انعطافپذیر است و اجزای آن از یکپارچهسازی خوبی برخوردارند. (به راحتی میتوان آن را با برنامهها و ابزارها ترکیب کرد)
- پرتابل بودن پلتفرم
- در دسترس و اپن سورس بودن
پایتون در چه زمینههایی کاربرد دارد؟
- برنامهنویسی سیستم (روی Scripting پایتون)
- ایجاد رابط کاربری گرافیکی
- طراحی وب سایت
- برنامهنویسی دیتابیس
- برنامهنویسی علمی (مثلاً برای تجزیه و تحلیل)
- گیمینگ، پردازش تصویر، روباتیک و غیره.
نقش Pandas در پایتون
Pandas یک راهاندازی اپن سورس برای یک زبان برنامهنویسی اپن سورس و یک کتابخانه لایسنسدار پایتون است که ابزارهای تجزیه و تحلیل دادهای با کارایی بالا و ساختارهای دادهای با استفاده آسان را برای زبان برنامهنویسی پایتون ارائه میدهد.
برای دستیابی به عملکرد عمیق در توابع manipulation دادهها و تجزیه و تحلیل، سگمنت Pandas توسط توسعهدهنده Mckinney به عنوان بخشی از پایتون و یک کتابخانه اپن سورس معرفی شد. این کلمه برگرفته از ساختار زیر است:
Pandas –> Pan (Panel) + Das (Data)
قبل از معرفی کتابخانههای Pandas ، کار اصلی پایتون مربوط به آمادهسازی دادهها و مانگ کردن آنها (munging) بود. پس از ظهور Pandas ، پایتون در زمینه تجزیه و تحلیل شکوفا شد. خروجیهای اصلی Pandas عبارتند از:
- تجزیه و تحلیل دادهها
- آمادهسازی دادهها
- Manipulation دادهها
- مدلسازی دادهها
- آنالیزهای داده
فیلدهای اصلی که پایتون در آنها از Pandas استفاده میکند به شرح زیر است:
- امور مالی
- اقتصاد
- تجزیه و تحلیل و غیره.
نحوه نصب پکیج Pandas
- prompt anaconda نصبشده را باز کنید.
- برای نصب پکیج از دستور زیر استفاده کنید.
Ex: pip install pandas
- اکنون میتوانیم پکیج نصبشده را وارد برنامه شما کنیم.
شناخت مفاهیم Pandas
ساختارهای کلیدی داده در Pandas به شرح زیر است:
- Series : ساختارهای داده تکبعدی از نظر اندازه تغییر ناپذیر هستند.
مثال:

پارامترها:

Code Snippet نمونه:
import pandas as PD
import numpy as np
Test_data = np.array(['a','b','c','d'])
Sample = PD.Series(Test_data)
print sample
- Dataframe : آرایهای (array) که فرمت آن ناهمگن و دوبعدی است.
مثال:

پارامترها:

Code Snippet نمونه:
import pandas as PD
data = [[ ' Alex ' , 10 ],[ ' Bob ', 12 ],[ ' Clarke ' , 13 ]] df = PD.DataFrame(data,columns=[' Name ' , ' Age '])
print df
- Panel : یک ساختار داده ناهمگن است که فرمت آن سه بعدی است و دادهها را در پنلها مدیریت میکند.
پارامترها:

Code Snippet نمونه:
import pandas as PD
import numpy as np
data = {'Item1' : PD.DataFrame(np.random.randn(4, 3)),
'Item2' : PD.DataFrame(np.random.randn(4, 2))}
p = PD.Panel(data)
print
مزایای استفاده از Pandas
- frame objects های داده ایندکسشده و با قابلیت شخصیسازی
- ابزارهای مختلف برای پشتیبانی از data load در data object ها صرف نظر از فرمت فایل آنها
- Data alignment به شیوهای کارآمد
- مجموعه داده محوری (Pivot dataset)
- تغییر شکل مجموعه دادهها
- برش لیبل محور (Label-oriented slicing)
- ایندکس کردن دادهها و زیرمجموعهسازی دادههایی با حجم بالاتر
- ادغام مجموعه دادههای با کارایی بالا به شیوهای کارآمد
- زمان سری-عملکردی (Time series-functionality)
مهارتهای مورد نیاز برای پایتون Pandas
- دانش وب پایتون
- آشنایی با ORM و کتابخانههای مرتبط
- یکپارچهسازی دیتابیس
- توانایی حل مشکل و مسئله
- قابلیت سازماندهی مؤثر کد
مخاطبان پایتون Pandas
- مخاطبان علاقهمند به یادگیری پایتون
- افرادی که آرزوی تبدیل شدن به معمار پایتون، توسعهدهنده، تحلیلگر، تستر و همچنین موقعیتهای شغلی نسبتاً حرفهای دارند.
- این کمک میکند تا جنبههای حرفهای و مهارتهای فنی برنامه نویسان حرفهای که قصد انجام همین کار را دارند، پیشرفت کند.
- افراد علاقه مند به توسعه اپلیکیشن با پایتون
- افردی که علاقهمند به یادگیری تجزیه و تحلیل و کسب تخصص در این زمینه هستند.
نتیجهگیری
قطعاً پایتون یکی از همهکارهترین و پایدارترین زبانها در یک دهه گذشته است. در این setup پروگراماتیک بسیار پایدار، برنامههای کتابخانه Pandas نقش مهمی در تقویت جنبههای مربوط به دادههای این زبان گسترده دارند. همچنین تمام نیازهای اصلی مربوط به رسیدگی به دادههای پایتون، در تنظیمات آن به خوبی برطرف میشود.
منبع: educba
Leave feedback about this