آموزش رایگان صفر تا صد یادگیری ماشین (Machine Learning) به زبان ساده
-
خوش آمدید به یادگیری ماشین!
-
میانگین، میانه و مد در یادگیری ماشین
-
انحراف معیار (Standard Deviation) در یادگیری ماشین
-
صدک (Percentile) در یادگیری ماشین
-
توزیع دادهها در یادگیری ماشین
-
توزیع نرمال دادهها در یادگیری ماشین
-
نمودار پراکندگی (Scatter Plot) در یادگیری ماشین
-
رگرسیون خطی در یادگیری ماشینی
-
رگرسیون چندجملهای در یادگیری ماشین
-
رگرسیون چندگانه در یادگیری ماشین
-
روش Train/Test در یادگیری ماشین
-
درخت تصمیمگیری در یادگیری ماشین
-
ماتریس سردرگمی (Confusion Matrix) در یادگیری ماشین
-
خوشهبندی سلسلهمراتبی (Hierarchical Clustering) در یادگیری ماشین
-
رگرسیون لجستیک در یادگیری ماشین
-
Grid Search در یادگیری ماشین
-
پردازش دادههای دستهای (Categorical Data) در یادگیری ماشین
-
خوشهبندی K-Means در یادگیری ماشین
-
یادگیری Bootstrap Aggregation (Bagging) در یادگیری ماشین
-
کراس والیدیشن (Cross Validation) در یادگیری ماشین
-
منحنی AUC - ROC در یادگیری ماشین
-
الگوریتم K-Nearest Neighbors (KNN) در یادگیری ماشین
صدک (Percentile) در یادگیری ماشین
در آمار، صدک (Percentile) به عددی گفته میشود که درصد مشخصی از دادهها کمتر از آن مقدار هستند.
🔹 به زبان ساده، اگر بگوییم یک مقدار در صدک 75 قرار دارد یعنی 75٪ از دادهها از آن مقدار کمتر هستند.
📌 مثال ساده از صدک
فرض کنید لیستی از سن افراد ساکن در یک خیابان داریم:
ages = [5, 31, 43, 48, 50, 41, 7, 11, 15, 39, 80, 82, 32, 2, 8, 6, 25, 36, 27, 61, 31]
حالا میخواهیم بدانیم سن مربوط به صدک 75 چند است؟
✅ پاسخ: 43
یعنی 75٪ افراد در این خیابان، 43 سال یا کمتر دارند.
🎯 پیدا کردن صدک با NumPy
در پایتون میتوانیم از کتابخانهی NumPy برای محاسبهی صدکها استفاده کنیم.
🔹 متد ()percentile در NumPy این کار را انجام میدهد.
💡 مثال: پیدا کردن صدک 75
import numpy
ages = [5, 31, 43, 48, 50, 41, 7, 11, 15, 39, 80, 82, 32, 2, 8, 6, 25, 36, 27, 61, 31]
x = numpy.percentile(ages, 75)
print(x) # خروجی: 43
📌 در اینجا عدد 43 نشان میدهد که 75٪ از افراد این خیابان سن کمتری از 43 دارند.
🚀 تمرین: صدک 90 را پیدا کنید!
🔹 حالا میخواهیم بدانیم 90٪ از افراد چند سال یا کمتر دارند؟
✅ کد زیر را اجرا کنید:
import numpy
ages = [5, 31, 43, 48, 50, 41, 7, 11, 15, 39, 80, 82, 32, 2, 8, 6, 25, 36, 27, 61, 31]
x = numpy.percentile(ages, 90)
print(x) # خروجی را ببینید!
❓ حدس میزنید خروجی چه عددی باشد؟ امتحان کنید و نتیجه را ببینید! 🎯🔥
🏆 نکات مهم درباره صدکها:
1️⃣ صدک 50 همان میانه (Median) است
یعنی اگر صدک 50 را محاسبه کنیم، مقدار وسط دادهها را پیدا کردهایم.
2️⃣ صدکها برای تحلیل دادههای بزرگ کاربرد زیادی دارند
مثلاً در تحلیل نمرات، درآمدها، میزان قد افراد و بسیاری از دادههای دیگر.
3️⃣ اگر دادهها مرتب نباشند هم صدک را میتوان محاسبه کرد
نیازی به مرتبسازی دستی نیست، NumPy خودش این کار را انجام میدهد.
💬 چالش برای شما!
🔹 یک لیست جدید از اعداد تصادفی بسازید و صدکهای 25، 50 و 75 آن را پیدا کنید!
🔹 آیا مقدار صدک 50 همیشه برابر میانه (Median) خواهد بود؟ چرا؟ 🤔