Auto-Differentiation in Quantum Circuits: Enabling Gradient-Based Quantum Machine Learning

By

-

May 28, 2025

Introduction
What Is Auto-Differentiation?
Why Gradients Matter in Quantum ML
Variational Quantum Circuits and Parameter Training
Challenges of Differentiation in Quantum Systems
Classical vs Quantum Auto-Differentiation
Forward and Reverse Mode Differentiation
Parameter-Shift Rule and Analytic Gradients
Finite Differences and Numerical Approximations
Differentiation via Backpropagation in Hybrid Models
Auto-Diff in PennyLane
Auto-Diff in Qiskit
Auto-Diff in TensorFlow Quantum
Hardware Support and Differentiable Interfaces
Jacobian and Hessian Computation in Quantum Circuits
Differentiable Quantum Nodes (QNodes)
Autograd + Quantum: Hybrid Pipelines
Best Practices for Stable Gradient Computation
Research Challenges and Opportunities
Conclusion

1. Introduction

Auto-differentiation (auto-diff) has revolutionized classical deep learning and plays a similar role in quantum machine learning. It allows quantum models to be trained with standard optimizers using gradient information extracted directly from the quantum circuit.

2. What Is Auto-Differentiation?

Auto-diff is the algorithmic technique to compute exact derivatives of functions by applying the chain rule to computational graphs, without symbolic differentiation or finite differences.

3. Why Gradients Matter in Quantum ML

Gradients power optimizers like Adam, SGD
Used to train variational quantum circuits (VQCs), QNNs, QGANs
Essential for hybrid quantum-classical models

4. Variational Quantum Circuits and Parameter Training

Quantum gates are parameterized by learnable variables
Training = optimizing a cost function with respect to these parameters

5. Challenges of Differentiation in Quantum Systems

Quantum systems are probabilistic
State collapse prevents full observability
Differentiation must be compatible with measurement

6. Classical vs Quantum Auto-Differentiation

Feature	Classical Auto-Diff	Quantum Auto-Diff
Input space	Deterministic	Probabilistic (qubits)
Data type	Scalars/tensors	Expectation values
Differentiation	Graph traversal	Parameter-shift or adjoint

7. Forward and Reverse Mode Differentiation

Forward: propagates derivatives from inputs to outputs
Reverse: propagates loss sensitivity from outputs to inputs (efficient for deep models)

8. Parameter-Shift Rule and Analytic Gradients

The core tool for analytic gradients in quantum models:
\[
rac{\partial \langle O
angle}{\partial heta} = rac{1}{2} [\langle O( heta + rac{\pi}{2})
angle – \langle O( heta – rac{\pi}{2})
angle]
\]

9. Finite Differences and Numerical Approximations

Simple but noisy and less efficient
Susceptible to gradient estimation error due to sampling noise

10. Differentiation via Backpropagation in Hybrid Models

Quantum nodes act as layers in a neural network
Classical auto-diff engines treat expectation values as differentiable outputs

11. Auto-Diff in PennyLane

Seamless integration with autograd, PyTorch, TensorFlow
Use qml.qnode(..., interface='torch') for full gradient tracking

12. Auto-Diff in Qiskit

Use EstimatorGradient or SamplerGradient in qiskit.algorithms.gradients
Interfaces with Torch and NumPy-based training loops

13. Auto-Diff in TensorFlow Quantum

Uses tfq.layers.PQC to wrap quantum circuits as Keras layers
Gradient flow supported through TensorFlow backpropagation

14. Hardware Support and Differentiable Interfaces

Parameter-shift compatible with real quantum hardware
PennyLane + AWS Braket, Qiskit + IBM Quantum

15. Jacobian and Hessian Computation in Quantum Circuits

Auto-diff can generate Jacobians for multi-output circuits
Second-order optimization uses approximated Hessians

16. Differentiable Quantum Nodes (QNodes)

Abstract quantum circuits as callable differentiable functions
Support composition and nested differentiation

17. Autograd + Quantum: Hybrid Pipelines

Combine CNN/RNN → VQC → Dense layers
Full training via unified gradient computation

18. Best Practices for Stable Gradient Computation

Normalize inputs
Avoid deep circuits on NISQ hardware
Use shot-averaging for reduced variance

19. Research Challenges and Opportunities

Extending auto-diff to general quantum channels
Differentiable quantum error correction
Adjoint differentiation for custom gates

20. Conclusion

Auto-differentiation empowers scalable and trainable quantum models by enabling gradient-based learning in hybrid and quantum-native systems. As tools mature, auto-diff will continue to be a cornerstone of efficient and automated quantum machine learning pipelines.

.

Optimization Techniques in Quantum Machine Learning: SPSA, COBYLA, and Beyond

By

Kumar Prafull

-

May 27, 2025

0

Introduction
Role of Optimization in Quantum Machine Learning
Gradient-Based vs Gradient-Free Methods
Stochastic Gradient Descent (SGD)
Adam Optimizer
Simultaneous Perturbation Stochastic Approximation (SPSA)
SPSA: Algorithm and Use Cases
SPSA for Noisy Quantum Environments
Constrained Optimization BY Linear Approximation (COBYLA)
COBYLA in Qiskit and PennyLane
Nelder-Mead Method
Powell’s Method
Conjugate Gradient Descent
BFGS and L-BFGS-B
SPSA vs COBYLA: Strengths and Weaknesses
Choosing the Right Optimizer for NISQ Devices
Optimization Under Measurement Noise
Layer-Wise Optimization Strategy
Combining Classical and Quantum Optimizers
Conclusion

1. Introduction

Optimization techniques are at the heart of training quantum machine learning models, especially those based on parameterized quantum circuits. These methods adjust gate parameters to minimize a loss function, using either exact gradients or approximations.

2. Role of Optimization in Quantum Machine Learning

Guides training of Variational Quantum Circuits (VQCs)
Minimizes cost functions (e.g., classification loss, energy in VQE)
Must handle noise, hardware constraints, and quantum randomness

3. Gradient-Based vs Gradient-Free Methods

Gradient-Based: require partial derivatives (e.g., parameter-shift rule)
Gradient-Free: rely on function evaluations (e.g., SPSA, COBYLA)

4. Stochastic Gradient Descent (SGD)

Uses a small batch of data to compute approximate gradients
Simple, but sensitive to learning rate and noise

5. Adam Optimizer

Combines momentum and adaptive learning rate
Well-suited for differentiable hybrid quantum-classical models

6. Simultaneous Perturbation Stochastic Approximation (SPSA)

Estimates gradients by perturbing all parameters simultaneously
Only requires two function evaluations per step:
\[
g_k = rac{f( heta_k + c_k \Delta_k) – f( heta_k – c_k \Delta_k)}{2 c_k \Delta_k}
\]

7. SPSA: Algorithm and Use Cases

Efficient for high-dimensional or noisy cost landscapes
Popular in QAOA, QNN training on real quantum devices

8. SPSA for Noisy Quantum Environments

Naturally robust to shot noise
Performs well even with low-fidelity measurements

9. Constrained Optimization BY Linear Approximation (COBYLA)

Gradient-free, constraint-respecting algorithm
Approximates local linear models for optimization
Good for small parameter spaces

10. COBYLA in Qiskit and PennyLane

Qiskit: qiskit.algorithms.optimizers.COBYLA
PennyLane: qml.optimize.COBYLAOptimizer()

11. Nelder-Mead Method

Uses simplex-based optimization
Sensitive to local minima
Performs well in low-dimensional, smooth landscapes

12. Powell’s Method

Performs line searches along conjugate directions
No gradient required
Effective when parameters are weakly correlated

13. Conjugate Gradient Descent

Assumes differentiable cost function
Optimizes along conjugate directions
Requires Hessian approximation

14. BFGS and L-BFGS-B

Quasi-Newton methods
Use approximate second-order information
Suitable for simulator-based training

15. SPSA vs COBYLA: Strengths and Weaknesses

Optimizer	Strengths	Weaknesses
SPSA	Robust to noise, scalable	Stochastic, may oscillate
COBYLA	Handles constraints	Slow in high dimensions

16. Choosing the Right Optimizer for NISQ Devices

Use SPSA or COBYLA for noisy, real-device training
Use Adam, BFGS for clean, simulator environments

17. Optimization Under Measurement Noise

Use averaging over multiple shots
Apply learning rate decay
Employ variance reduction techniques

18. Layer-Wise Optimization Strategy

Optimize circuit layers sequentially
Reduces barren plateau effects
Similar to greedy layer-wise pretraining

19. Combining Classical and Quantum Optimizers

Classical layers use Adam/SGD
Quantum layers use SPSA/COBYLA
Unified hybrid optimization pipelines

20. Conclusion

Optimization is a central component of quantum model training. Techniques like SPSA and COBYLA enable effective learning even on noisy, real-world quantum hardware. Understanding the landscape of optimizers helps practitioners design robust, efficient, and scalable quantum learning workflows.

.

Backpropagation with Parameter-Shift Rule in Quantum Models

By

Kumar Prafull

-

May 26, 2025

0

Introduction
Need for Gradients in Quantum ML
Variational Quantum Circuits and Training
Limitations of Classical Backpropagation
The Parameter-Shift Rule: Core Concept
Mathematical Derivation
Conditions for Using Parameter-Shift Rule
General Formula and Intuition
Example: Single Qubit Gate
Applying the Rule in Multiqubit Circuits
Cost Function Gradient Computation
Comparison with Finite Difference
Implementation in PennyLane
Implementation in Qiskit
Integration with Classical Backpropagation
Hardware Considerations and Sampling
Efficiency and Shot Complexity
Extensions to Arbitrary Parametrizations
Research Directions in Quantum Differentiation
Conclusion

1. Introduction

In quantum machine learning, we must optimize parameterized quantum circuits. This requires gradients of cost functions with respect to circuit parameters — which classical backpropagation can’t compute directly on quantum hardware. The parameter-shift rule solves this problem.

2. Need for Gradients in Quantum ML

Quantum models are trained using classical optimizers (e.g., Adam, COBYLA)
Gradients guide updates to circuit parameters to minimize a loss

3. Variational Quantum Circuits and Training

VQCs are circuits with learnable parameters (gate angles)
Outputs (e.g., expectation values) form predictions
These predictions are used in cost functions

4. Limitations of Classical Backpropagation

No direct access to quantum state vectors
Measurement collapses state, preventing analytic gradient computation

5. The Parameter-Shift Rule: Core Concept

Provides a way to compute exact gradients by evaluating the quantum circuit at two shifted values of a parameter:
\[
rac{d}{d heta} \langle O
angle = rac{1}{2} [\langle O( heta + rac{\pi}{2})
angle – \langle O( heta – rac{\pi}{2})
angle]
\]

6. Mathematical Derivation

Assume gate: \( U( heta) = e^{-i heta G/2} \) for generator \( G \) with eigenvalues ±1. Then:
\[
rac{\partial}{\partial heta} \langle \psi( heta) | O | \psi( heta)
angle = rac{1}{2} \left( \langle O
angle_{ heta + \pi/2} – \langle O
angle_{ heta – \pi/2}
ight)
\]

7. Conditions for Using Parameter-Shift Rule

Gate must be generated by an operator with two distinct eigenvalues (e.g., ±1)
Common gates: RX, RY, RZ

8. General Formula and Intuition

For \( U( heta) = e^{-i heta G} \), if \( G \) has spectrum ±r:
\[
rac{d}{d heta} \langle O
angle = rac{r}{2} [\langle O( heta + rac{\pi}{2r})
angle – \langle O( heta – rac{\pi}{2r})
angle]
\]

9. Example: Single Qubit Gate

import pennylane as qml

dev = qml.device('default.qubit', wires=1)

@qml.qnode(dev)
def circuit(theta):
    qml.RY(theta, wires=0)
    return qml.expval(qml.PauliZ(0))

10. Applying the Rule in Multiqubit Circuits

Shift one parameter at a time
Compute two forward passes per parameter

11. Cost Function Gradient Computation

Use chain rule:
\[
rac{dL}{d heta} = rac{dL}{d\langle O
angle} \cdot rac{d\langle O
angle}{d heta}
\]

12. Comparison with Finite Difference

Method	Accuracy	Noise Robustness	Evaluations
Finite Difference	Approx.	Sensitive	2
Parameter-Shift	Exact	Hardware-Friendly	2

13. Implementation in PennyLane

qml.grad(circuit)(theta)

14. Implementation in Qiskit

Use qiskit.opflow.gradients.Gradient for circuits with parameterized gates

15. Integration with Classical Backpropagation

Hybrid models: quantum gradients flow into classical layers
Frameworks like PennyLane, TensorFlow Quantum support this natively

16. Hardware Considerations and Sampling

Each gradient term needs circuit execution
More shots → lower variance but higher cost

17. Efficiency and Shot Complexity

For \( n \) parameters → \( 2n \) circuit evaluations per step
Can be optimized using batching and vectorized evaluations

18. Extensions to Arbitrary Parametrizations

Generalized rules for multivalued generators
Commutator-based gradients for arbitrary gates

19. Research Directions in Quantum Differentiation

Stochastic parameter shift
Quantum-aware optimizers
Circuit-aware gradient scaling

20. Conclusion

The parameter-shift rule bridges quantum computing and classical optimization by providing an exact, hardware-compatible method for gradient computation. It’s the cornerstone of training modern quantum models and integrating them into hybrid machine learning pipelines.

.

Training Quantum Models: Optimizing Parameters for Quantum Machine Learning

By

Kumar Prafull

-

May 25, 2025

0

Introduction
What Does Training Mean in Quantum ML?
Variational Quantum Circuits (VQCs) as Models
Cost Functions and Objective Definitions
Forward Pass: Circuit Evaluation
Measurement and Output Processing
Gradient Computation in Quantum Models
The Parameter-Shift Rule
Finite Difference and Numerical Gradients
Automatic Differentiation in Hybrid Workflows
Classical Optimizers in QML
Choosing the Right Optimizer
Optimization Challenges: Barren Plateaus
Strategies to Mitigate Barren Plateaus
Batch Training vs Online Updates
Noise in Training: Effects and Handling
Training on Simulators vs Real Hardware
Evaluation Metrics and Validation
Transfer Learning in Quantum Models
Conclusion

1. Introduction

Training quantum models involves tuning the parameters of quantum circuits to minimize a loss or cost function, just like in classical machine learning. However, the quantum nature of these models introduces unique challenges and methods.

2. What Does Training Mean in Quantum ML?

Training refers to optimizing parameterized gates in a quantum circuit to achieve a target task (e.g., classification, regression, simulation).

3. Variational Quantum Circuits (VQCs) as Models

Use parameterized quantum gates (e.g., RY(θ), RZ(θ))
Circuit outputs are measured to produce model predictions
Parameters are updated iteratively to minimize a cost

4. Cost Functions and Objective Definitions

Binary Cross-Entropy, MSE, Fidelity loss, etc.
The loss measures the difference between target and actual output

5. Forward Pass: Circuit Evaluation

Encode input
Apply parameterized gates
Measure observables
Calculate cost from measurement results

6. Measurement and Output Processing

Measure expectation values (e.g., PauliZ)
Convert quantum measurement to classical values for loss computation

7. Gradient Computation in Quantum Models

Crucial for gradient-based optimizers
Quantum gradients estimated via analytic or numerical methods

8. The Parameter-Shift Rule

Allows gradient computation from two circuit evaluations:
\[
rac{d\langle O
angle}{d heta} = rac{\langle O( heta + \pi/2)
angle – \langle O( heta – \pi/2)
angle}{2}
\]

9. Finite Difference and Numerical Gradients

Alternative when shift rule is unavailable, but less stable:
\[
rac{f( heta + \epsilon) – f( heta – \epsilon)}{2\epsilon}
\]

10. Automatic Differentiation in Hybrid Workflows

PennyLane, TensorFlow Quantum, Qiskit support autograd
Compatible with PyTorch and TensorFlow for hybrid models

11. Classical Optimizers in QML

Gradient-based: Adam, SGD, RMSProp
Gradient-free: COBYLA, Nelder-Mead, SPSA

12. Choosing the Right Optimizer

Noisy settings: use SPSA, COBYLA
Simulators: use Adam or BFGS
Start simple, switch if convergence stalls

13. Optimization Challenges: Barren Plateaus

Flat regions in cost landscape
Cause vanishing gradients and poor learning

14. Strategies to Mitigate Barren Plateaus

Use shallow circuits
Local cost functions
Layer-wise pretraining
Careful parameter initialization

15. Batch Training vs Online Updates

Batch: use expectation values over multiple inputs
Online: update after each individual sample

16. Noise in Training: Effects and Handling

Real hardware introduces noise in gradients
Solutions:
Use noise-aware optimizers
Error mitigation
Training on simulators before hardware

17. Training on Simulators vs Real Hardware

Simulators: idealized training, flexible debugging
Hardware: real noise, limited access, slower iteration

18. Evaluation Metrics and Validation

Accuracy, Precision, Recall for classification
Loss curves over epochs
Cross-validation with quantum-compatible splits

19. Transfer Learning in Quantum Models

Reuse trained circuits as feature maps
Fine-tune VQCs for new datasets
Combine with classical layers for adaptation

20. Conclusion

Training quantum models is an evolving science that blends classical optimization with quantum circuit dynamics. With proper cost functions, gradient strategies, and noise mitigation, quantum models can be trained effectively and integrated into hybrid AI systems.

.

Cost Functions for Quantum Models: Measuring Performance in Quantum Machine Learning

By

Kumar Prafull

-

May 24, 2025

0

Introduction
Role of Cost Functions in QML
Characteristics of a Good Cost Function
Cost Functions for Classification
Binary Cross-Entropy Loss
Mean Squared Error (MSE)
Hinge Loss for Margin-Based Models
Fidelity-Based Loss
KL Divergence in Quantum Models
Quantum Relative Entropy
Loss Functions for Variational Circuits
Cost in Quantum Generative Models (QGANs)
Quantum Adversarial Losses
Cost Functions in Reinforcement Learning
Regularization in Quantum Cost Functions
Gradient Estimation and Differentiability
Challenges in Quantum Cost Evaluation
Tools and Frameworks with Built-in Losses
Custom Cost Design Strategies
Conclusion

1. Introduction

Cost functions are fundamental components in quantum machine learning (QML), serving as quantitative measures of model performance and guiding the optimization of quantum parameters.

2. Role of Cost Functions in QML

Quantify the difference between predicted and actual outcomes
Provide gradient signals for parameter updates in variational circuits
Help models generalize and avoid overfitting

3. Characteristics of a Good Cost Function

Differentiable with respect to parameters
Sensitive to model changes
Robust to noise (especially on real quantum devices)

4. Cost Functions for Classification

Compare predicted class probabilities or expectation values with true labels
Often based on classical formulations

5. Binary Cross-Entropy Loss

Used in binary classification:
\[
\mathcal{L}(y, \hat{y}) = -[y \log(\hat{y}) + (1 – y) \log(1 – \hat{y})]
\]
Where \( \hat{y} \) is derived from quantum measurement (e.g., Pauli-Z expectation).

6. Mean Squared Error (MSE)

\[
ext{MSE} = rac{1}{n} \sum_{i=1}^{n} (y_i – \hat{y}_i)^2
\]
Simple and widely used for regression or expectation-based output.

7. Hinge Loss for Margin-Based Models

Useful for SVM-inspired quantum classifiers:
\[
\mathcal{L}(y, \hat{y}) = \max(0, 1 – y \cdot \hat{y})
\]

8. Fidelity-Based Loss

Measures overlap between quantum states:
\[
\mathcal{L} = 1 – |\langle \psi_{ ext{target}} | \psi_{ ext{output}}
angle|^2
\]
Used in quantum state synthesis and autoencoders.

9. KL Divergence in Quantum Models

\[
D_{ ext{KL}}(P || Q) = \sum_i P(i) \log \left( rac{P(i)}{Q(i)}
ight)
\]
Used to compare two probability distributions output by quantum circuits.

10. Quantum Relative Entropy

\[
S(
ho || \sigma) = ext{Tr}[
ho (\log
ho – \log \sigma)]
\]
Quantum analog of KL divergence for density matrices.

11. Loss Functions for Variational Circuits

Expectation of observable:
\[
\mathcal{L}( heta) = \langle \psi( heta) | H | \psi( heta)
angle
\]
Used in VQE, QAOA, and hybrid models

12. Cost in Quantum Generative Models (QGANs)

Adversarial losses:
\[
\mathcal{L}_G = -\mathbb{E}[\log D(G(z))]
\quad
\mathcal{L}_D = -\mathbb{E}[\log D(x)] – \mathbb{E}[\log(1 – D(G(z)))]
\]

13. Quantum Adversarial Losses

Use Wasserstein distance or maximum mean discrepancy
May involve dual optimization steps with gradient penalties

14. Cost Functions in Reinforcement Learning

Temporal difference loss
Policy gradient loss using quantum expectation values
Hybrid RL cost based on Q-value approximations

15. Regularization in Quantum Cost Functions

Add L2 penalty on weights
Penalize circuit depth or entanglement
Dropout-like randomness in gate selection

16. Gradient Estimation and Differentiability

Use parameter-shift rule for analytic gradients
Finite difference when exact shift not available
Ensure cost is differentiable wrt circuit parameters

17. Challenges in Quantum Cost Evaluation

Measurement shot noise
Non-convexity and barren plateaus
High variance in gradient estimates

18. Tools and Frameworks with Built-in Losses

PennyLane: qml.losses
TensorFlow Quantum: integrated Keras loss support
Qiskit Machine Learning: supports classical and quantum loss tracking

19. Custom Cost Design Strategies

Combine quantum + classical loss terms
Define domain-specific observables
Use hybrid multi-objective formulations

20. Conclusion

Cost functions are the bridge between model predictions and optimization in quantum machine learning. Carefully chosen or custom-designed loss functions enable effective training, stability, and practical performance of quantum models across diverse learning tasks.

.

Welcome to Syskool

Welcome to Syskool

<img class="tdb-logo-img td-retina-data" data-retina="https://syskool.com/wp-content/uploads/2021/05/logo-text@0.75x.png" src="https://syskool.com/wp-content/uploads/2021/04/logo-text@0.5x.png" alt="Syskool" title="Syskool" width="250" height="80" data-eio="l" />

Welcome to Syskool

Subscribe to Syskool

Subscribe to Liberty Case

Welcome to Syskool

Auto-Differentiation in Quantum Circuits: Enabling Gradient-Based Quantum Machine Learning

Table of Contents

1. Introduction

2. What Is Auto-Differentiation?

3. Why Gradients Matter in Quantum ML

4. Variational Quantum Circuits and Parameter Training

5. Challenges of Differentiation in Quantum Systems

6. Classical vs Quantum Auto-Differentiation

7. Forward and Reverse Mode Differentiation

8. Parameter-Shift Rule and Analytic Gradients

9. Finite Differences and Numerical Approximations

10. Differentiation via Backpropagation in Hybrid Models

11. Auto-Diff in PennyLane

12. Auto-Diff in Qiskit

13. Auto-Diff in TensorFlow Quantum

14. Hardware Support and Differentiable Interfaces

15. Jacobian and Hessian Computation in Quantum Circuits

16. Differentiable Quantum Nodes (QNodes)

17. Autograd + Quantum: Hybrid Pipelines

18. Best Practices for Stable Gradient Computation

19. Research Challenges and Opportunities

20. Conclusion

Optimization Techniques in Quantum Machine Learning: SPSA, COBYLA, and Beyond

Table of Contents

1. Introduction

2. Role of Optimization in Quantum Machine Learning

3. Gradient-Based vs Gradient-Free Methods

4. Stochastic Gradient Descent (SGD)

5. Adam Optimizer

6. Simultaneous Perturbation Stochastic Approximation (SPSA)

7. SPSA: Algorithm and Use Cases

8. SPSA for Noisy Quantum Environments

9. Constrained Optimization BY Linear Approximation (COBYLA)

10. COBYLA in Qiskit and PennyLane

11. Nelder-Mead Method

12. Powell’s Method

13. Conjugate Gradient Descent

14. BFGS and L-BFGS-B

15. SPSA vs COBYLA: Strengths and Weaknesses

16. Choosing the Right Optimizer for NISQ Devices

17. Optimization Under Measurement Noise

18. Layer-Wise Optimization Strategy

19. Combining Classical and Quantum Optimizers

20. Conclusion

Backpropagation with Parameter-Shift Rule in Quantum Models

Table of Contents

1. Introduction

2. Need for Gradients in Quantum ML

3. Variational Quantum Circuits and Training

4. Limitations of Classical Backpropagation

5. The Parameter-Shift Rule: Core Concept

6. Mathematical Derivation

7. Conditions for Using Parameter-Shift Rule

8. General Formula and Intuition

9. Example: Single Qubit Gate

10. Applying the Rule in Multiqubit Circuits

11. Cost Function Gradient Computation

12. Comparison with Finite Difference

13. Implementation in PennyLane

14. Implementation in Qiskit

15. Integration with Classical Backpropagation

16. Hardware Considerations and Sampling

17. Efficiency and Shot Complexity

18. Extensions to Arbitrary Parametrizations

19. Research Directions in Quantum Differentiation

20. Conclusion

Training Quantum Models: Optimizing Parameters for Quantum Machine Learning

Table of Contents

1. Introduction

2. What Does Training Mean in Quantum ML?

3. Variational Quantum Circuits (VQCs) as Models

4. Cost Functions and Objective Definitions

5. Forward Pass: Circuit Evaluation