Assignment 5 - Data Analytics and Model Evaluation

Certainly, here's a concise summary of each method in a pointwise format:
<h3>Holdout Method</h3>
<ul>
<li>Purpose: Evaluate machine learning model performance on unseen data.</li>
<li>Process: Split dataset into two subsets - approximately 70% training and 30% testing.</li>
<li>Evaluation: Test the model on the testing set after training on the training set.</li>
<li>Advantages:
<ul>
<li>Simple to implement.</li>
<li>Faster and less computationally demanding.</li>
</ul>
</li>
<li>Disadvantages:
<ul>
<li>Inefficient data usage, especially with small datasets.</li>
<li>Performance estimate can vary greatly based on the data split.</li>
</ul>
</li>
</ul>
<h3>Random Sampling Methods</h3>
<ul>
<li>Types:
<ul>
<li>Simple Random Sampling: Equal chance for each data point to be selected.</li>
<li>Stratified Sampling: Divides dataset into strata and samples from each to maintain representation.</li>
<li>Cluster Sampling: Divides into clusters, randomly selects entire clusters.</li>
</ul>
</li>
<li>Application:
<ul>
<li>Used in cross-validation to ensure varied training and testing subsets.</li>
<li>Enhances model robustness by training on diverse data samples.</li>
</ul>
</li>
</ul>

My Blog.

Discuss Holdout method and random sampling methods.

Holdout Method

Random Sampling Methods