آموزش رایگان صفر تا صد یادگیری ماشین (Machine Learning) به زبان ساده
-
خوش آمدید به یادگیری ماشین!
-
میانگین، میانه و مد در یادگیری ماشین
-
انحراف معیار (Standard Deviation) در یادگیری ماشین
-
صدک (Percentile) در یادگیری ماشین
-
توزیع دادهها در یادگیری ماشین
-
توزیع نرمال دادهها در یادگیری ماشین
-
نمودار پراکندگی (Scatter Plot) در یادگیری ماشین
-
رگرسیون خطی در یادگیری ماشینی
-
رگرسیون چندجملهای در یادگیری ماشین
-
رگرسیون چندگانه در یادگیری ماشین
-
روش Train/Test در یادگیری ماشین
-
درخت تصمیمگیری در یادگیری ماشین
-
ماتریس سردرگمی (Confusion Matrix) در یادگیری ماشین
-
خوشهبندی سلسلهمراتبی (Hierarchical Clustering) در یادگیری ماشین
-
رگرسیون لجستیک در یادگیری ماشین
-
Grid Search در یادگیری ماشین
-
پردازش دادههای دستهای (Categorical Data) در یادگیری ماشین
-
خوشهبندی K-Means در یادگیری ماشین
-
یادگیری Bootstrap Aggregation (Bagging) در یادگیری ماشین
-
کراس والیدیشن (Cross Validation) در یادگیری ماشین
-
منحنی AUC - ROC در یادگیری ماشین
-
الگوریتم K-Nearest Neighbors (KNN) در یادگیری ماشین
خوش آمدید به یادگیری ماشین!
در این آموزش، اول از همه به ریاضی و آمار برمیگردیم تا ببینیم چطور میتوانیم از مجموعه دادهها (Data Sets) اطلاعات مهمی استخراج کنیم.
✅ یاد میگیریم چطور با ماژولهای مختلف پایتون (Python Modules) کار کنیم تا جوابهای موردنیاز را بهدست آوریم.
✅ همچنین میبینیم چطور میتوانیم تابعهایی بسازیم که بتوانند براساس اطلاعات ورودی، نتیجه را پیشبینی کنند.
📊 مجموعه دادهها (Data Sets)
برای یک کامپیوتر، دادهها میتوانند هر چیزی باشند؛ از یک آرایه ساده گرفته تا یک پایگاه داده کامل!
📌 مثال از یک آرایه ساده:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
برند خودرو | رنگ | سن (سال) | سرعت | AutoPass |
---|---|---|---|---|
BMW | قرمز | ۵ | ۹۹ | بله |
Volvo | مشکی | ۷ | ۸۶ | بله |
VW | خاکستری | ۸ | ۸۷ | خیر |
VW | سفید | ۷ | ۸۸ | بله |
Ford | سفید | ۲ | ۱۱۱ | بله |
VW | سفید | ۱۷ | ۸۶ | بله |
Tesla | قرمز | ۲ | ۱۰۳ | بله |
BMW | مشکی | ۹ | ۸۷ | بله |
Volvo | خاکستری | ۴ | ۹۴ | خیر |
Ford | سفید | ۱۱ | ۷۸ | خیر |
Toyota | خاکستری | ۱۲ | ۷۷ | خیر |
VW | سفید | ۹ | ۸۵ | خیر |
Toyota | آبی | ۶ | ۸۶ | بله |
💡 با نگاه کردن به این جدول، میتوان فهمید که محبوبترین رنگ ماشین سفید است و قدیمیترین ماشین ۱۷ سال دارد. اما آیا میتوانیم پیشبینی کنیم که یک ماشین AutoPass دارد یا نه؟ 🤯
این همان کاری است که یادگیری ماشین انجام میدهد! تحلیل دادهها و پیشبینی نتایج! 🚀
در یادگیری ماشین، معمولا با مجموعههای داده بسیار بزرگ سروکار داریم، اما در این آموزش سعی میکنیم همه چیز را ساده و قابلفهم نگه داریم.
🏷️ انواع دادهها در یادگیری ماشین
برای اینکه بتوانیم دادهها را تحلیل کنیم، باید بدانیم که با چه نوع دادههایی سروکار داریم. دادهها را میتوان به سه دسته اصلی تقسیم کرد:
1️⃣ دادههای عددی (Numerical Data)
- این نوع دادهها عدد هستند و خودشان به دو دسته تقسیم میشوند:
✅ دادههای گسسته (Discrete Data): دادههایی که تعداد مشخص و محدود دارند، مثلا تعداد ماشینهایی که از یک خیابان عبور میکنند.
✅ دادههای پیوسته (Continuous Data): دادههایی که میتوانند هر مقداری داشته باشند، مثلا قیمت یک محصول یا قد افراد.
2️⃣ دادههای دستهبندیشده (Categorical Data)
- دادههایی که نمیتوان مقدار آنها را با هم مقایسه کرد، مثلا رنگ یک ماشین یا پاسخ بله/خیر.
3️⃣ دادههای ترتیبی (Ordinal Data)
- این دادهها مانند دادههای دستهبندیشده هستند، اما ترتیب دارند. مثلا نمرات مدرسه: A بهتر از B است، B بهتر از C و …
💡 دانستن نوع دادهها به ما کمک میکند که روش تحلیل مناسب را انتخاب کنیم!
در ادامه، یاد میگیریم که چطور از آمار و روشهای تحلیل داده استفاده کنیم تا بتوانیم الگوها را کشف کرده و با یادگیری ماشین پیشبینیهای دقیقتری انجام دهیم! 🚀🔥