কনটেন্টে যান

Part VII — Glossary (Applied Linear Algebra: Data Science)

Part VII-এর পাঁচ chapter-এ (7.1–7.5) প্রথম দেখা সব গুরুত্বপূর্ণ term এক টেবিলে — chapter অনুযায়ী সাজানো।

Chapter 7.1 — Least Squares Classification

English Term বাংলা এক লাইনে অর্থ
Classification ক্লাসিফিকেশন (শ্রেণিবিভাজন) Output সংখ্যা নয়, কয়েকটা শ্রেণি/সিদ্ধান্ত: spam নাকি নয়, "৩" নাকি "৭" — feature থেকে label predict
Label লেবেল Categorical outcome \(y\) যা মাত্র কয়েকটা মান নেয়; classifier-এ \(\pm 1\) সংখ্যায় বদলানো হয়
Boolean Classification বুলিয়ান ক্লাসিফিকেশন দুই-শ্রেণির (binary) কেস: \(y \in \{-1, +1\}\), model \(\hat{f}:\mathbb{R}^n \to \{-1,+1\}\)
Least Squares Classifier লিস্ট স্কোয়ার্স ক্লাসিফায়ার \(\hat{f}(x) = \text{sign}(x^T\beta + v)\)\(\pm 1\) label-এ regression চালিয়ে বানানো প্রথম ML classifier
Sign Function সাইন ফাংশন continuous স্কোরকে \(\pm 1\) সিদ্ধান্তে রূপ দেয়: \(\ge 0\) হলে \(+1\), নাহলে \(-1\)
Decision Boundary ডিসিশন বাউন্ডারি যেখানে সিদ্ধান্ত বদলায়: \(\{x : x^T\beta + v = 0\}\) — একটা hyperplane, normal \(\beta\)
Confusion Matrix কনফিউশন ম্যাট্রিক্স classifier-এর রিপোর্ট কার্ড: TP/FN/FP/TN — ৪ ঘরের টেবিল
Error Rate এরর রেট ভুল-classify হওয়া নমুনার অনুপাত: \((N_{fp} + N_{fn})/N\)
True Positive Rate (Recall) ট্রু পজিটিভ রেট (রিকল) আসল \(+1\)-দের কত ভাগ ধরা পড়ল: \(N_{tp}/(N_{tp}+N_{fn})\)
False Positive Rate ফলস পজিটিভ রেট আসল \(-1\)-দের কত ভাগ ভুলে \(+1\) বলা হলো: \(N_{fp}/(N_{fp}+N_{tn})\)
Decision Threshold ডিসিশন থ্রেশহোল্ড নিয়ম \(\text{sign}(\tilde{f}(x) - \alpha)\); \(\alpha\) সরালে boundary parallel সরে, TPR ও FPR-এর দর কষাকষি
One-vs-Others ওয়ান-ভার্সাস-আদারস \(K\)-শ্রেণির কৌশল: প্রতি শ্রেণির আলাদা স্কোর-মেশিন, রায় \(\hat{f}(x) = \operatorname{argmax}_k \tilde{f}_k(x)\)
Baseline Model বেসলাইন মডেল তুলনার ভিত্তিরেখা — এর চেয়ে খারাপ করলে বুঝবে গলদ আছে; least squares classifier ক্লাসিক baseline

Chapter 7.2 — Regularized Least Squares

English Term বাংলা এক লাইনে অর্থ
Overfitting ওভারফিটিং Training-এ নিখুঁত কিন্তু বাস্তবে ধোঁকা — model noise-ও মুখস্থ করে ফেলে, সাধারণীকরণ করে না
Multi-objective (Bi-criterion) LS মাল্টি-অবজেক্টিভ লিস্ট স্কোয়ার্স দুটো লক্ষ্য একসাথে: \(\underset{x}{\min}\; J_1(x) + \lambda J_2(x)\) — রান্নায় স্বাদ বনাম স্বাস্থ্য
Weight \(\lambda\) ওয়েট (ল্যাম্বডা) দুই লক্ষ্যের আপেক্ষিক গুরুত্বের knob; ছোট = fit-কে পাত্তা, বড় = penalty-কে
Optimal Trade-off Curve অপটিমাল ট্রেড-অফ কার্ভ \(\lambda\) ঘোরালে \((J_1, J_2)\)-র যে বক্ররেখা — একটা কমাতে অন্যটা বাড়ে
Pareto Optimal পারেটো অপটিমাল trade-off curve-এর বিন্দু: \(J_1\) কমাতে চাইলে \(J_2\) বাড়াতেই হবে, বিনা মূল্যে উন্নতি অসম্ভব
Ridge Regression রিজ রিগ্রেশন \(\underset{x}{\min}\; \|Ax-b\|^2 + \lambda\|x\|^2\) — fit + "parameter ছোট রাখো" penalty
Tikhonov Regularization টিখোনভ রেগুলারাইজেশন Ridge-এরই আরেক নাম (\(\ell_2\)-regularized LS); ill-posed inverse problem-এ অপরিহার্য
Regularization Term (Penalty) রেগুলারাইজেশন টার্ম \(\lambda\|x\|^2\) পদ — model-এর জটিলতার ওপর জরিমানা বসায়
Regularization Parameter রেগুলারাইজেশন প্যারামিটার penalty-র ওজন \(\lambda\); এটাই তোমার প্রথম hyperparameter
Closed-form Solution ক্লোজড-ফর্ম সলিউশন Ridge-এর বন্ধ-রূপ: \(\hat{x}(\lambda) = (A^TA + \lambda I)^{-1}A^Tb\) — diagonal-এ পাহাড় (ridge)
Bias-Variance Trade-off বায়াস-ভ্যারিয়েন্স ট্রেড-অফ \(\lambda\) ছোট = low bias/high variance (over-fit), বড় = high bias/low variance (under-fit)
Regularization Path রেগুলারাইজেশন পাথ \(\lambda\)-র সাথে coefficient-দের শূন্যের দিকে সংকোচন-বক্ররেখা
Shrinkage শ্রিংকেজ Ridge coefficient-দের শূন্যের দিকে টানে (কিন্তু ঠিক শূন্য করে না)
Weight Decay ওয়েট ডিকে neural network training-এ loss-এ \(\lambda\|W\|^2\) যোগ — সেটাই এই ridge penalty
Multicollinearity মাল্টিকলিনিয়ারিটি দুই feature প্রায় একই তথ্য বহন করলে \(A^TA\) প্রায় singular; ridge এর ওষুধ

Chapter 7.3 — Constrained Least Squares

English Term বাংলা এক লাইনে অর্থ
Constrained Least Squares কনস্ট্রেইনড লিস্ট স্কোয়ার্স \(\underset{x}{\min}\;\|Ax-b\|^2\) শর্তসাপেক্ষে \(Cx = d\) — কঠোর, অলঙ্ঘনীয় শর্ত
Equality Constraint ইকুয়ালিটি কনস্ট্রেইন্ট \(Cx = d\) সমতা-শর্ত; সমাধানকে একটা affine subspace-এ বেঁধে রাখে
Objective অবজেক্টিভ যা minimize করছি — এখানে fit-error \(\|Ax-b\|^2\)
Lagrange Multiplier ল্যাগ্রাঞ্জ মাল্টিপ্লায়ার নতুন ভেরিয়েবল \(z\) (প্রতি constraint-এ একটা) যা দিয়ে constraint-কে objective-এ মেশানো হয়
Lagrangian ল্যাগ্রাঞ্জিয়ান যৌথ ফাংশন \(L(x,z) = \|Ax-b\|^2 + z^T(Cx-d)\) — constrained সমস্যাকে "মুক্ত" করে
KKT System কে-কে-টি সিস্টেম \(\begin{bmatrix}2A^TA & C^T\\ C & 0\end{bmatrix}\begin{bmatrix}x\\ z\end{bmatrix} = \begin{bmatrix}2A^Tb\\ d\end{bmatrix}\) — এক বড় linear ব্যবস্থা, iteration নয়
Lagrange Condition ল্যাগ্রাঞ্জ কন্ডিশন Optimum-এ objective-এর gradient \(\parallel\) constraint normal — fig01-এর দুই সমান্তরাল তীর
Least Norm Problem লিস্ট নর্ম প্রবলেম \(\underset{x}{\min}\;\|x\|^2\) s.t. \(Cx = d\) — under-determined সমস্যার সবচেয়ে মিতব্যয়ী সমাধান
Least Norm Formula লিস্ট নর্ম সূত্র \(\hat{x} = C^T(CC^T)^{-1}d\) — origin থেকে constraint-এর লম্ব পাদবিন্দু
Shadow Price শ্যাডো প্রাইস Multiplier \(z_i\)-র অর্থনৈতিক মানে: constraint সামান্য শিথিল করলে objective কতটা ভালো হবে (প্রান্তিক মূল্য)
Spline Fitting স্প্লাইন ফিটিং টুকরো-টুকরো বহুপদীকে seam-এ মসৃণ (মান ও ঢাল মেলানো) জোড়া — constrained LS-এর ক্লাসিক প্রয়োগ
Minimum Energy Control মিনিমাম এনার্জি কন্ট্রোল লক্ষ্যে ঠিক পৌঁছানোর least-norm force — মৃদু, ছড়ানো ধাক্কা = কম জ্বালানি

Chapter 7.4 — Clustering, Graphs ও PageRank

English Term বাংলা এক লাইনে অর্থ
Unsupervised Learning আনসুপারভাইজড লার্নিং label ছাড়াই শুধু data-র গঠন থেকে structure/দল খুঁজে বের করা
k-means Clustering কে-মিনস ক্লাস্টারিং label-বিহীন data-কে \(k\) দলে ভাগ করা, প্রতি দলের একটা প্রতিনিধি বেছে
Representative (Centroid) রিপ্রেজেন্টেটিভ (সেন্ট্রয়েড) প্রতি cluster-এর প্রতিনিধি \(z_j\) — সবসময় সেই দলের গড় (তাই k-means)
Clustering Objective ক্লাস্টারিং অবজেক্টিভ \(J^{clust} = \frac1N\sum_i\|x^{(i)} - z_{c_i}\|^2\) — প্রতিনিধি থেকে দূরত্ব-বর্গের গড়
Lloyd's Algorithm লয়েডস অ্যালগরিদম পালা করে assign (নিকটতমে বরাদ্দ) ও update (গড়ে সরানো) — প্রতি ধাপে \(J^{clust}\) কমে
Local Minimum লোকাল মিনিমাম k-means সবসময় সেরা (global) নয়; খারাপ random init-এ খারাপ জায়গায় আটকায়
Graph গ্রাফ node (বিন্দু) আর edge (সংযোগ) — বন্ধুত্ব-network, রাস্তা, web-link সব এতে ধরা
Adjacency Matrix অ্যাডজেসেন্সি ম্যাট্রিক্স \(A_{ij} = 1\) যদি node \(i\)\(j\)-এ edge থাকে; undirected হলে symmetric
Degree Matrix ডিগ্রি ম্যাট্রিক্স Diagonal matrix \(D\), \(D_{ii} =\) node \(i\)-র degree (কয়টা edge লাগানো)
Graph Laplacian গ্রাফ ল্যাপ্লাসিয়ান \(L = D - A\) — row sum \(0\), PSD; \(f^TLf = \sum_{(i,j)}(f_i-f_j)^2\) "পার্থক্যের শক্তি"
Connected Component কানেক্টেড কম্পোনেন্ট graph-এর এক-একটা বিচ্ছিন্ন টুকরো; \(L\)-এর zero eigenvalue-র সংখ্যা = component-সংখ্যা
Spectral Clustering স্পেকট্রাল ক্লাস্টারিং Laplacian-এর eigenvector দিয়ে ক্লাস্টারিং — নন-গোলাকার দলও খুঁজতে পারে
PageRank পেজর‍্যাঙ্ক web-কে Markov matrix ভেবে power iteration-এ গুরুত্ব-eigenvector: \(Gr = r\) — Google-এর জন্ম
Power Iteration পাওয়ার ইটারেশন বারবার \(r \leftarrow Gr\) — dominant eigenvector-এ পৌঁছানোর algorithm, গোটা matrix invert না করেই
Google Matrix গুগল ম্যাট্রিক্স \(G = \alpha M + \frac{1-\alpha}{N}\mathbf{1}\mathbf{1}^T\) — link matrix + teleport; সব entry \(>0\)

Chapter 7.5 — Markov Matrices

English Term বাংলা এক লাইনে অর্থ
Markov Matrix (Stochastic) মার্কভ ম্যাট্রিক্স (স্টোক্যাস্টিক) entry \(\geq 0\) আর প্রতি column-এর যোগফল \(1\); \(P_{ij} =\) অবস্থা \(j \to i\)-এর সম্ভাবনা
Probability Vector প্রবাবিলিটি ভেক্টর entry \(\geq 0\), যোগফল \(1\) — বর্তমান অবস্থার সম্ভাবনা-বণ্টন
Markov Chain মার্কভ চেইন বিবর্তন \(p_{k+1} = Pp_k\) — "আজকের অবস্থা → কালকের সম্ভাবনা" নিয়মের শৃঙ্খল
Steady State (Stationary) স্টেডি স্টেট (স্টেশনারি) যে বণ্টন আর বদলায় না: \(P\pi = \pi\) — eigenvalue-\(1\) eigenvector, "দীর্ঘকালীন জলবায়ু"
Perron-Frobenius পেরন-ফ্রোবেনিয়াস সব entry ধনাত্মক matrix-এ একটাই ধনাত্মক dominant eigenvector নিশ্চিত করে (steady state-এর গ্যারান্টি)
Second Eigenvalue \(\lambda_2\) সেকেন্ড আইগেনভ্যালু দ্বিতীয় বৃহত্তম \(\vert \lambda_2\vert\) — convergence-এর গতি ঠিক করে: \(\|p_k - \pi\| \approx \vert \lambda_2\vert ^k\)
Mixing (Mixing Time) মিক্সিং (মিক্সিং টাইম) প্রাথমিক অবস্থার স্মৃতি কত দ্রুত মরে; \(\vert \lambda_2\vert\) ছোট = দ্রুত mixing
Dynamic Equilibrium ডায়নামিক ইকুইলিব্রিয়াম steady state-এ অবস্থা বদলাতেই থাকে, শুধু বণ্টন স্থির — রেস্তোরাঁয় লোক ঢোকে-বেরোয়, সংখ্যা স্থির
Matrix Exponential ম্যাট্রিক্স এক্সপোনেনশিয়াল \(e^{At} = \sum_k \frac{(At)^k}{k!}\) — discrete power \(P^k\)-এর অবিচ্ছিন্ন যমজ
Continuous-time Dynamics কন্টিনিউয়াস-টাইম ডায়নামিক্স \(\dot{x} = Ax\)-এর সমাধান \(x(t) = e^{At}x_0\); সময় discrete না হয়ে মসৃণ প্রবাহ
Eigenvalue → Decay/Rotation আইগেনভ্যালু-নিয়ম \(A\)-র eigenvalue \(\lambda\) হলে \(e^{At}\)-র eigenvalue \(e^{\lambda t}\): Re → decay/grow, Im → rotation
Spiral স্পাইরাল complex eigenvalue \(a \pm bi\): বাস্তব অংশ সংকোচন + কাল্পনিক অংশ ঘূর্ণন = origin-মুখী কুণ্ডলী
Dangling Node / Spider Trap ড্যাংলিং নোড / স্পাইডার ট্র্যাপ outgoing link-হীন বা বেরোনো-অসম্ভব node — teleport term ছাড়া PageRank বিকৃত করে