Demo Mode

No student ID available

Activity 9 of 18

Activity 9: Introduction to Generative Models

Practice and reinforce the concepts from Lesson 9

Activity 09: Introduction to Generative Models

Overview

In this activity, you'll build a working generative model system that demonstrates the core concepts from Lesson 9. You'll implement a Gaussian Mixture Model (GMM) from scratch, visualize latent spaces, and create an interactive tool to explore generative vs discriminative models.

Learning Objectives

By completing this activity, you will:

Implement a Gaussian Mixture Model (GMM) using Expectation-Maximization
Visualize probability distributions and sampling
Explore latent space representations
Compare generative vs discriminative approaches
Generate new samples from learned distributions
Build an interactive latent space explorer

Prerequisites

Completed Concept 09: Introduction to Generative Models
Basic understanding of probability distributions
Familiarity with NumPy and Matplotlib

Getting Started

Step One: Access the Template

Download the activity template from the Templates folder:

Template: AI25-Template-activity-09-introduction-to-generative-models.zip
Location: Templates/AI25-Template-activity-09-introduction-to-generative-models.zip

Step 2: Open in Google Colab

Extract the ZIP file
Upload activity-09-introduction-to-generative-models.ipynb to Google Colab
Runtime: CPU is sufficient (GPU optional)

Step 3: Run Initial Cells

Execute the first few cells to:

Install libraries (scipy, scikit-learn, plotly)
Import dependencies
Load visualization utilities

What You'll Build

Part One: Gaussian Mixture Model (YOU COMPLETE)

Scenario: Implement GMM to model 2D data with multiple clusters.

TODO 1: Implement E-step (compute responsibilities)

Calculate probability of each point under each Gaussian component
Normalize to get responsibilities (posterior probabilities)

python

class GMM:
    def _e_step(self, X):
        """
        E-step: Compute responsibilities

        Args:
            X: Data (n_samples, n_features)

        Returns:
            responsibilities: (n_samples, n_components)
        """
        # TODO 1: Compute probability of each point under each component
        # Hint: Use scipy.stats.multivariate_normal.pdf
        # responsibilities[i, k] = P(component k | point i)

        responsibilities = np.zeros((X.shape[0], self.n_components))

        # Your code here

        return responsibilities

TODO 2: Implement M-step (update parameters)

Update mixture weights (π)
Update means (μ)
Update covariances (Σ)

python

def _m_step(self, X, responsibilities):
    """
    M-step: Update parameters

    Args:
        X: Data (n_samples, n_features)
        responsibilities: (n_samples, n_components)
    """
    # TODO 2: Update parameters based on responsibilities
    # weights: π_k = (sum of responsibilities for k) / n_samples
    # means: μ_k = weighted average of points (weights = responsibilities)
    # covariances: Σ_k = weighted covariance matrix

    # Your code here
    pass

Part 2: Sampling from GMM (YOU COMPLETE)

TODO 3: Generate new samples from trained GMM

python

def sample(self, n_samples):
    """
    Generate samples from the GMM

    Args:
        n_samples: Number of samples to generate

    Returns:
        samples: (n_samples, n_features)
    """
    samples = []

    for _ in range(n_samples):
        # TODO 3: Implement sampling
        # Step 1: Choose component k with probability self.weights[k]
        # Step 2: Sample from N(self.means[k], self.covariances[k])

        # Your code here
        pass

    return np.array(samples)

Part 3: Latent Space Visualization (PRE-BUILT)

Interactive visualization showing:

Original data distribution
Learned GMM components (ellipses)
Generated samples
Component assignments (colors)

Features:

Adjust number of components (1-10)
Re-run EM algorithm
Compare with real data distribution

Part 4: Generative vs Discriminative Comparison (YOU COMPLETE)

TODO 4: Implement both approaches for 2-class classification

Discriminative (Logistic Regression):

python

def discriminative_model(X_train, y_train, X_test):
    """
    Train logistic regression (discriminative)

    Learns: P(y | X)
    """
    # TODO 4a: Fit logistic regression
    # Use sklearn.linear_model.LogisticRegression

    # Your code here
    pass

Generative (Gaussian Naive Bayes):

python

def generative_model(X_train, y_train, X_test):
    """
    Train Gaussian Naive Bayes (generative)

    Learns: P(X | y) and P(y), then computes P(y | X) via Bayes' rule
    """
    # TODO 4b: Fit Gaussian Naive Bayes
    # Use sklearn.naive_bayes.GaussianNB

    # Your code here
    pass

Part 5: Latent Space Exploration (YOU COMPLETE)

TODO 5: Build interactive latent space explorer for VAE-style model

python

class LatentSpaceExplorer:
    def __init__(self, model):
        self.model = model

    def interpolate(self, z1, z2, num_steps=10):
        """
        Interpolate between two latent codes

        Args:
            z1, z2: Start and end latent codes
            num_steps: Number of interpolation steps

        Returns:
            interpolated_samples: Generated samples along path
        """
        # TODO 5a: Implement linear interpolation in latent space
        # z_interpolated = (1-alpha) * z1 + alpha * z2
        # Then decode each z_interpolated

        # Your code here
        pass

    def arithmetic(self, z_base, z_attribute, alpha=1.0):
        """
        Latent space arithmetic

        Args:
            z_base: Base latent code
            z_attribute: Attribute to add/subtract
            alpha: Strength of attribute

        Returns:
            generated_sample: Result of z_base + alpha * z_attribute
        """
        # TODO 5b: Implement latent arithmetic
        # z_new = z_base + alpha * z_attribute
        # Decode z_new

        # Your code here
        pass

Part 6: Evaluation Metrics (PRE-BUILT)

Pre-built functions for:

Log-likelihood computation
Sample quality visualization
Distribution comparison (KL divergence)
Mode coverage analysis

Expected Results

Part One: GMM Training

After training on 2D data with 3 clusters:

ini

Iteration 1: Log-likelihood = -2.45
Iteration 10: Log-likelihood = -1.82
Iteration 20: Log-likelihood = -1.75 (converged)

✓ Learned 3 components
✓ Component 1: μ=[2.1, 3.5], weight=0.33
✓ Component 2: μ=[5.8, 1.2], weight=0.34
✓ Component 3: μ=[1.5, 8.7], weight=0.33

Part 2: Sampling

Generated 100 samples:

sql

✓ Sample distribution matches training data
✓ All 3 modes represented
✓ Visual quality: realistic clusters

Part 3: Visualization

Interactive plot showing:

Blue points: Original data
Red ellipses: Learned GMM components
Green points: Generated samples
✓ Ellipses align with data clusters

Part 4: Generative vs Discriminative

2-class classification results:

yaml

Discriminative (Logistic Regression):
- Train accuracy: 92%
- Test accuracy: 89%
- Decision boundary: linear

Generative (Gaussian Naive Bayes):
- Train accuracy: 88%
- Test accuracy: 86%
- Decision boundary: curved
- Bonus: Can generate new samples!

Key insight: Discriminative slightly better for classification, but generative can also generate data.

Part 5: Latent Space Exploration

Interpolation between two points:

sql

✓ Smooth transition across 10 steps
✓ All intermediate samples are valid
✓ No "jumps" or artifacts

Latent arithmetic:

ini

Example: z_smiling - z_neutral + z_man = z_smiling_man
✓ Attributes transfer correctly
✓ Composition works as expected

Success Criteria

Your implementation is complete when:

GMM correctly clusters 2D data (visual inspection)
EM algorithm converges (log-likelihood increases then plateaus)
Sampling generates realistic points from learned distribution
Generative and discriminative models both classify correctly
Latent space interpolation produces smooth transitions
Latent arithmetic produces expected attribute combinations

Tips for Success

EM Algorithm Debugging

Common issues:

Responsibilities don't sum to 1: Check normalization in E-step
Covariance becomes singular: Add small value to diagonal (1e-6 * I)
Doesn't converge: Check learning rate, initialization, or data scaling

Verification:

python

# After E-step
assert np.allclose(responsibilities.sum(axis=1), 1.0), "Responsibilities must sum to 1"

# After M-step
assert np.allclose(weights.sum(), 1.0), "Weights must sum to 1"

Sampling Tips

Good sampling:

python

# Step 1: Choose component (categorical distribution)
k = np.random.choice(n_components, p=weights)

# Step 2: Sample from chosen Gaussian
sample = np.random.multivariate_normal(means[k], covariances[k])

Avoid:

python

# ❌ Don't sample component uniformly if weights are non-uniform
k = np.random.randint(n_components)  # Wrong!

Visualization Best Practices

Effective plots:

Use different colors for different components
Show confidence ellipses (2 standard deviations)
Include legend and axis labels
Overlay generated samples on top of real data

Extension Challenges

Challenge One: Bayesian Information Criterion (Easy)

Implement BIC to select optimal number of components:

python

def compute_bic(gmm, X):
    """
    Compute BIC = -2 * log_likelihood + k * log(n)
    where k = number of parameters
    """
    # TODO: Implement BIC
    pass

# Test with 1-10 components, choose best

Challenge 2: High-Dimensional GMM (Medium)

Apply GMM to MNIST digits:

Flatten 28x28 images to 784-dimensional vectors
Fit GMM with 10 components (one per digit)
Generate new digit images
Visualize learned clusters with t-SNE

Challenge 3: Conditional GMM (Hard)

Implement conditional generation:

python

def conditional_sample(self, condition, n_samples):
    """
    Generate samples conditioned on partial observations

    Example: Generate y coordinate given x coordinate
    """
    pass

Challenge 4: Online EM (Hard)

Implement online/incremental EM for streaming data:

python

def online_update(self, new_batch):
    """
    Update GMM parameters with new batch without storing all data
    """
    pass

Submission Requirements

What to Submit

Completed Notebook: activity-09-introduction-to-generative-models.ipynb
- All code cells executed
- Output visible for all visualizations
- All TODOs completed
Generated Visualizations:
- GMM clustering plot
- Generative vs discriminative comparison
- Latent space interpolation
- Sample quality comparison
Reflection (3-5 sentences):
- When would you choose generative over discriminative models?
- What challenges did you face implementing EM?
- How does GMM compare to k-means clustering?

Submission Steps

Complete all TODO sections
Run all cells from top to bottom
Verify success criteria
Download notebook
Submit via [course portal link]

Resources

Documentation

Papers

Original EM Paper (Dempster et al., 1977)
Generative vs Discriminative Classifiers (Ng & Jordan, 2001)

Expectation-Maximization (EM) algorithm
Maximum likelihood estimation
Bayes' theorem
Latent variable models

Next Steps

Congratulations! You've built your first generative model.

Next Activity: Activity 10 - Build a Variational Autoencoder (VAE) for image generation

Deep generative model (not just GMM)
Learn latent representations of MNIST digits
Generate new digit images

Assessment

This activity is graded on:

Code Completion (40%): All TODOs implemented correctly
Visualizations (30%): Clear, informative plots
Code Quality (20%): Clean, documented, follows best practices
Reflection (10%): Demonstrates understanding

Passing Grade: 70% or higher

Great work on your first generative model! 🎉🎨

Activity 9 of 18

Activity 9: Introduction to Generative Models

Practice and reinforce the concepts from Lesson 9

Activity 09: Introduction to Generative Models

Overview

Learning Objectives

By completing this activity, you will:

Implement a Gaussian Mixture Model (GMM) using Expectation-Maximization
Visualize probability distributions and sampling
Explore latent space representations
Compare generative vs discriminative approaches
Generate new samples from learned distributions
Build an interactive latent space explorer

Prerequisites

Completed Concept 09: Introduction to Generative Models
Basic understanding of probability distributions
Familiarity with NumPy and Matplotlib

Getting Started

Step One: Access the Template

Download the activity template from the Templates folder:

Template: AI25-Template-activity-09-introduction-to-generative-models.zip
Location: Templates/AI25-Template-activity-09-introduction-to-generative-models.zip

Step 2: Open in Google Colab

Extract the ZIP file
Upload activity-09-introduction-to-generative-models.ipynb to Google Colab
Runtime: CPU is sufficient (GPU optional)

Step 3: Run Initial Cells

Execute the first few cells to:

Install libraries (scipy, scikit-learn, plotly)
Import dependencies
Load visualization utilities

What You'll Build

Part One: Gaussian Mixture Model (YOU COMPLETE)

Scenario: Implement GMM to model 2D data with multiple clusters.

TODO 1: Implement E-step (compute responsibilities)

Calculate probability of each point under each Gaussian component
Normalize to get responsibilities (posterior probabilities)

python

class GMM:
    def _e_step(self, X):
        """
        E-step: Compute responsibilities

        Args:
            X: Data (n_samples, n_features)

        Returns:
            responsibilities: (n_samples, n_components)
        """
        # TODO 1: Compute probability of each point under each component
        # Hint: Use scipy.stats.multivariate_normal.pdf
        # responsibilities[i, k] = P(component k | point i)

        responsibilities = np.zeros((X.shape[0], self.n_components))

        # Your code here

        return responsibilities

TODO 2: Implement M-step (update parameters)

Update mixture weights (π)
Update means (μ)
Update covariances (Σ)

python

def _m_step(self, X, responsibilities):
    """
    M-step: Update parameters

    Args:
        X: Data (n_samples, n_features)
        responsibilities: (n_samples, n_components)
    """
    # TODO 2: Update parameters based on responsibilities
    # weights: π_k = (sum of responsibilities for k) / n_samples
    # means: μ_k = weighted average of points (weights = responsibilities)
    # covariances: Σ_k = weighted covariance matrix

    # Your code here
    pass

Part 2: Sampling from GMM (YOU COMPLETE)

TODO 3: Generate new samples from trained GMM

python

def sample(self, n_samples):
    """
    Generate samples from the GMM

    Args:
        n_samples: Number of samples to generate

    Returns:
        samples: (n_samples, n_features)
    """
    samples = []

    for _ in range(n_samples):
        # TODO 3: Implement sampling
        # Step 1: Choose component k with probability self.weights[k]
        # Step 2: Sample from N(self.means[k], self.covariances[k])

        # Your code here
        pass

    return np.array(samples)

Part 3: Latent Space Visualization (PRE-BUILT)

Interactive visualization showing:

Original data distribution
Learned GMM components (ellipses)
Generated samples
Component assignments (colors)

Features:

Adjust number of components (1-10)
Re-run EM algorithm
Compare with real data distribution

Part 4: Generative vs Discriminative Comparison (YOU COMPLETE)

TODO 4: Implement both approaches for 2-class classification

Discriminative (Logistic Regression):

python

def discriminative_model(X_train, y_train, X_test):
    """
    Train logistic regression (discriminative)

    Learns: P(y | X)
    """
    # TODO 4a: Fit logistic regression
    # Use sklearn.linear_model.LogisticRegression

    # Your code here
    pass

Generative (Gaussian Naive Bayes):

python

def generative_model(X_train, y_train, X_test):
    """
    Train Gaussian Naive Bayes (generative)

    Learns: P(X | y) and P(y), then computes P(y | X) via Bayes' rule
    """
    # TODO 4b: Fit Gaussian Naive Bayes
    # Use sklearn.naive_bayes.GaussianNB

    # Your code here
    pass

Part 5: Latent Space Exploration (YOU COMPLETE)

TODO 5: Build interactive latent space explorer for VAE-style model

python

class LatentSpaceExplorer:
    def __init__(self, model):
        self.model = model

    def interpolate(self, z1, z2, num_steps=10):
        """
        Interpolate between two latent codes

        Args:
            z1, z2: Start and end latent codes
            num_steps: Number of interpolation steps

        Returns:
            interpolated_samples: Generated samples along path
        """
        # TODO 5a: Implement linear interpolation in latent space
        # z_interpolated = (1-alpha) * z1 + alpha * z2
        # Then decode each z_interpolated

        # Your code here
        pass

    def arithmetic(self, z_base, z_attribute, alpha=1.0):
        """
        Latent space arithmetic

        Args:
            z_base: Base latent code
            z_attribute: Attribute to add/subtract
            alpha: Strength of attribute

        Returns:
            generated_sample: Result of z_base + alpha * z_attribute
        """
        # TODO 5b: Implement latent arithmetic
        # z_new = z_base + alpha * z_attribute
        # Decode z_new

        # Your code here
        pass

Part 6: Evaluation Metrics (PRE-BUILT)

Pre-built functions for:

Log-likelihood computation
Sample quality visualization
Distribution comparison (KL divergence)
Mode coverage analysis

Expected Results

Part One: GMM Training

After training on 2D data with 3 clusters:

ini

Iteration 1: Log-likelihood = -2.45
Iteration 10: Log-likelihood = -1.82
Iteration 20: Log-likelihood = -1.75 (converged)

✓ Learned 3 components
✓ Component 1: μ=[2.1, 3.5], weight=0.33
✓ Component 2: μ=[5.8, 1.2], weight=0.34
✓ Component 3: μ=[1.5, 8.7], weight=0.33

Part 2: Sampling

Generated 100 samples:

sql

✓ Sample distribution matches training data
✓ All 3 modes represented
✓ Visual quality: realistic clusters

Part 3: Visualization

Interactive plot showing:

Blue points: Original data
Red ellipses: Learned GMM components
Green points: Generated samples
✓ Ellipses align with data clusters

Part 4: Generative vs Discriminative

2-class classification results:

yaml

Discriminative (Logistic Regression):
- Train accuracy: 92%
- Test accuracy: 89%
- Decision boundary: linear

Generative (Gaussian Naive Bayes):
- Train accuracy: 88%
- Test accuracy: 86%
- Decision boundary: curved
- Bonus: Can generate new samples!

Key insight: Discriminative slightly better for classification, but generative can also generate data.

Part 5: Latent Space Exploration

Interpolation between two points:

sql

✓ Smooth transition across 10 steps
✓ All intermediate samples are valid
✓ No "jumps" or artifacts

Latent arithmetic:

ini

Example: z_smiling - z_neutral + z_man = z_smiling_man
✓ Attributes transfer correctly
✓ Composition works as expected

Success Criteria

Your implementation is complete when:

GMM correctly clusters 2D data (visual inspection)
EM algorithm converges (log-likelihood increases then plateaus)
Sampling generates realistic points from learned distribution
Generative and discriminative models both classify correctly
Latent space interpolation produces smooth transitions
Latent arithmetic produces expected attribute combinations

Tips for Success

EM Algorithm Debugging

Common issues:

Responsibilities don't sum to 1: Check normalization in E-step
Covariance becomes singular: Add small value to diagonal (1e-6 * I)
Doesn't converge: Check learning rate, initialization, or data scaling

Verification:

python

# After E-step
assert np.allclose(responsibilities.sum(axis=1), 1.0), "Responsibilities must sum to 1"

# After M-step
assert np.allclose(weights.sum(), 1.0), "Weights must sum to 1"

Sampling Tips

Good sampling:

python

# Step 1: Choose component (categorical distribution)
k = np.random.choice(n_components, p=weights)

# Step 2: Sample from chosen Gaussian
sample = np.random.multivariate_normal(means[k], covariances[k])

Avoid:

python

# ❌ Don't sample component uniformly if weights are non-uniform
k = np.random.randint(n_components)  # Wrong!

Visualization Best Practices

Effective plots:

Use different colors for different components
Show confidence ellipses (2 standard deviations)
Include legend and axis labels
Overlay generated samples on top of real data

Extension Challenges

Challenge One: Bayesian Information Criterion (Easy)

Implement BIC to select optimal number of components:

python

def compute_bic(gmm, X):
    """
    Compute BIC = -2 * log_likelihood + k * log(n)
    where k = number of parameters
    """
    # TODO: Implement BIC
    pass

# Test with 1-10 components, choose best

Challenge 2: High-Dimensional GMM (Medium)

Apply GMM to MNIST digits:

Flatten 28x28 images to 784-dimensional vectors
Fit GMM with 10 components (one per digit)
Generate new digit images
Visualize learned clusters with t-SNE

Challenge 3: Conditional GMM (Hard)

Implement conditional generation:

python

def conditional_sample(self, condition, n_samples):
    """
    Generate samples conditioned on partial observations

    Example: Generate y coordinate given x coordinate
    """
    pass

Challenge 4: Online EM (Hard)

Implement online/incremental EM for streaming data:

python

def online_update(self, new_batch):
    """
    Update GMM parameters with new batch without storing all data
    """
    pass

Submission Requirements

What to Submit

Completed Notebook: activity-09-introduction-to-generative-models.ipynb
- All code cells executed
- Output visible for all visualizations
- All TODOs completed
Generated Visualizations:
- GMM clustering plot
- Generative vs discriminative comparison
- Latent space interpolation
- Sample quality comparison
Reflection (3-5 sentences):
- When would you choose generative over discriminative models?
- What challenges did you face implementing EM?
- How does GMM compare to k-means clustering?