pmlpp/mlpp/cost/cost.cpp

//
//  Reg.cpp
//
//  Created by Marc Melikyan on 1/16/21.
//

#include "cost.h"
#include "../lin_alg/lin_alg.h"
#include "../regularization/reg.h"
#include <cmath>
#include <iostream>


real_t MLPPCost::MSE(std::vector<real_t> y_hat, std::vector<real_t> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		sum += (y_hat[i] - y[i]) * (y_hat[i] - y[i]);
	}
	return sum / 2 * y_hat.size();
}

real_t MLPPCost::MSE(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			sum += (y_hat[i][j] - y[i][j]) * (y_hat[i][j] - y[i][j]);
		}
	}
	return sum / 2 * y_hat.size();
}

std::vector<real_t> MLPPCost::MSEDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {
	MLPPLinAlg alg;
	return alg.subtraction(y_hat, y);
}

std::vector<std::vector<real_t>> MLPPCost::MSEDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	MLPPLinAlg alg;
	return alg.subtraction(y_hat, y);
}

real_t MLPPCost::RMSE(std::vector<real_t> y_hat, std::vector<real_t> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		sum += (y_hat[i] - y[i]) * (y_hat[i] - y[i]);
	}
	return sqrt(sum / y_hat.size());
}

real_t MLPPCost::RMSE(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			sum += (y_hat[i][j] - y[i][j]) * (y_hat[i][j] - y[i][j]);
		}
	}
	return sqrt(sum / y_hat.size());
}

std::vector<real_t> MLPPCost::RMSEDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {
	MLPPLinAlg alg;
	return alg.scalarMultiply(1 / (2 * sqrt(MSE(y_hat, y))), MSEDeriv(y_hat, y));
}

std::vector<std::vector<real_t>> MLPPCost::RMSEDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	MLPPLinAlg alg;
	return alg.scalarMultiply(1 / (2 / sqrt(MSE(y_hat, y))), MSEDeriv(y_hat, y));
}

real_t MLPPCost::MAE(std::vector<real_t> y_hat, std::vector<real_t> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		sum += abs((y_hat[i] - y[i]));
	}
	return sum / y_hat.size();
}

real_t MLPPCost::MAE(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			sum += abs((y_hat[i][j] - y[i][j]));
		}
	}
	return sum / y_hat.size();
}

std::vector<real_t> MLPPCost::MAEDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {
	std::vector<real_t> deriv;
	deriv.resize(y_hat.size());
	for (int i = 0; i < deriv.size(); i++) {
		if (y_hat[i] < 0) {
			deriv[i] = -1;
		} else if (y_hat[i] == 0) {
			deriv[i] = 0;
		} else {
			deriv[i] = 1;
		}
	}
	return deriv;
}

std::vector<std::vector<real_t>> MLPPCost::MAEDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	std::vector<std::vector<real_t>> deriv;
	deriv.resize(y_hat.size());
	for (int i = 0; i < deriv.size(); i++) {
		deriv.resize(y_hat[i].size());
	}
	for (int i = 0; i < deriv.size(); i++) {
		for (int j = 0; j < deriv[i].size(); j++) {
			if (y_hat[i][j] < 0) {
				deriv[i][j] = -1;
			} else if (y_hat[i][j] == 0) {
				deriv[i][j] = 0;
			} else {
				deriv[i][j] = 1;
			}
		}
	}
	return deriv;
}

real_t MLPPCost::MBE(std::vector<real_t> y_hat, std::vector<real_t> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		sum += (y_hat[i] - y[i]);
	}
	return sum / y_hat.size();
}

real_t MLPPCost::MBE(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			sum += (y_hat[i][j] - y[i][j]);
		}
	}
	return sum / y_hat.size();
}

std::vector<real_t> MLPPCost::MBEDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {
	MLPPLinAlg alg;
	return alg.onevec(y_hat.size());
}

std::vector<std::vector<real_t>> MLPPCost::MBEDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	MLPPLinAlg alg;
	return alg.onemat(y_hat.size(), y_hat[0].size());
}

real_t MLPPCost::LogLoss(std::vector<real_t> y_hat, std::vector<real_t> y) {
	real_t sum = 0;
	real_t eps = 1e-8;
	for (int i = 0; i < y_hat.size(); i++) {
		sum += -(y[i] * std::log(y_hat[i] + eps) + (1 - y[i]) * std::log(1 - y_hat[i] + eps));
	}

	return sum / y_hat.size();
}

real_t MLPPCost::LogLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	real_t sum = 0;
	real_t eps = 1e-8;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			sum += -(y[i][j] * std::log(y_hat[i][j] + eps) + (1 - y[i][j]) * std::log(1 - y_hat[i][j] + eps));
		}
	}

	return sum / y_hat.size();
}

std::vector<real_t> MLPPCost::LogLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {
	MLPPLinAlg alg;
	return alg.addition(alg.scalarMultiply(-1, alg.elementWiseDivision(y, y_hat)), alg.elementWiseDivision(alg.scalarMultiply(-1, alg.scalarAdd(-1, y)), alg.scalarMultiply(-1, alg.scalarAdd(-1, y_hat))));
}

std::vector<std::vector<real_t>> MLPPCost::LogLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	MLPPLinAlg alg;
	return alg.addition(alg.scalarMultiply(-1, alg.elementWiseDivision(y, y_hat)), alg.elementWiseDivision(alg.scalarMultiply(-1, alg.scalarAdd(-1, y)), alg.scalarMultiply(-1, alg.scalarAdd(-1, y_hat))));
}

real_t MLPPCost::CrossEntropy(std::vector<real_t> y_hat, std::vector<real_t> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		sum += y[i] * std::log(y_hat[i]);
	}

	return -1 * sum;
}

real_t MLPPCost::CrossEntropy(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			sum += y[i][j] * std::log(y_hat[i][j]);
		}
	}

	return -1 * sum;
}

std::vector<real_t> MLPPCost::CrossEntropyDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {
	MLPPLinAlg alg;
	return alg.scalarMultiply(-1, alg.elementWiseDivision(y, y_hat));
}

std::vector<std::vector<real_t>> MLPPCost::CrossEntropyDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	MLPPLinAlg alg;
	return alg.scalarMultiply(-1, alg.elementWiseDivision(y, y_hat));
}

real_t MLPPCost::HuberLoss(std::vector<real_t> y_hat, std::vector<real_t> y, real_t delta) {
	MLPPLinAlg alg;
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		if (abs(y[i] - y_hat[i]) <= delta) {
			sum += (y[i] - y_hat[i]) * (y[i] - y_hat[i]);
		} else {
			sum += 2 * delta * abs(y[i] - y_hat[i]) - delta * delta;
		}
	}
	return sum;
}

real_t MLPPCost::HuberLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y, real_t delta) {
	MLPPLinAlg alg;
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			if (abs(y[i][j] - y_hat[i][j]) <= delta) {
				sum += (y[i][j] - y_hat[i][j]) * (y[i][j] - y_hat[i][j]);
			} else {
				sum += 2 * delta * abs(y[i][j] - y_hat[i][j]) - delta * delta;
			}
		}
	}
	return sum;
}

std::vector<real_t> MLPPCost::HuberLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y, real_t delta) {
	MLPPLinAlg alg;
	real_t sum = 0;
	std::vector<real_t> deriv;
	deriv.resize(y_hat.size());

	for (int i = 0; i < y_hat.size(); i++) {
		if (abs(y[i] - y_hat[i]) <= delta) {
			deriv.push_back(-(y[i] - y_hat[i]));
		} else {
			if (y_hat[i] > 0 || y_hat[i] < 0) {
				deriv.push_back(2 * delta * (y_hat[i] / abs(y_hat[i])));
			} else {
				deriv.push_back(0);
			}
		}
	}
	return deriv;
}

std::vector<std::vector<real_t>> MLPPCost::HuberLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y, real_t delta) {
	MLPPLinAlg alg;
	real_t sum = 0;
	std::vector<std::vector<real_t>> deriv;
	deriv.resize(y_hat.size());
	for (int i = 0; i < deriv.size(); i++) {
		deriv[i].resize(y_hat[i].size());
	}

	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			if (abs(y[i][j] - y_hat[i][j]) <= delta) {
				deriv[i].push_back(-(y[i][j] - y_hat[i][j]));
			} else {
				if (y_hat[i][j] > 0 || y_hat[i][j] < 0) {
					deriv[i].push_back(2 * delta * (y_hat[i][j] / abs(y_hat[i][j])));
				} else {
					deriv[i].push_back(0);
				}
			}
		}
	}
	return deriv;
}

real_t MLPPCost::HingeLoss(std::vector<real_t> y_hat, std::vector<real_t> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		sum += fmax(0, 1 - y[i] * y_hat[i]);
	}

	return sum / y_hat.size();
}

real_t MLPPCost::HingeLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			sum += fmax(0, 1 - y[i][j] * y_hat[i][j]);
		}
	}

	return sum / y_hat.size();
}

std::vector<real_t> MLPPCost::HingeLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {
	std::vector<real_t> deriv;
	deriv.resize(y_hat.size());
	for (int i = 0; i < y_hat.size(); i++) {
		if (1 - y[i] * y_hat[i] > 0) {
			deriv[i] = -y[i];
		} else {
			deriv[i] = 0;
		}
	}
	return deriv;
}

std::vector<std::vector<real_t>> MLPPCost::HingeLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	std::vector<std::vector<real_t>> deriv;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			if (1 - y[i][j] * y_hat[i][j] > 0) {
				deriv[i][j] = -y[i][j];
			} else {
				deriv[i][j] = 0;
			}
		}
	}
	return deriv;
}

real_t MLPPCost::WassersteinLoss(std::vector<real_t> y_hat, std::vector<real_t> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		sum += y_hat[i] * y[i];
	}
	return -sum / y_hat.size();
}

real_t MLPPCost::WassersteinLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	real_t sum = 0;
	for (int i = 0; i < y_hat.size(); i++) {
		for (int j = 0; j < y_hat[i].size(); j++) {
			sum += y_hat[i][j] * y[i][j];
		}
	}
	return -sum / y_hat.size();
}

std::vector<real_t> MLPPCost::WassersteinLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {
	MLPPLinAlg alg;
	return alg.scalarMultiply(-1, y); // Simple.
}

std::vector<std::vector<real_t>> MLPPCost::WassersteinLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {
	MLPPLinAlg alg;
	return alg.scalarMultiply(-1, y); // Simple.
}

real_t MLPPCost::HingeLoss(std::vector<real_t> y_hat, std::vector<real_t> y, std::vector<real_t> weights, real_t C) {
	MLPPLinAlg alg;
	MLPPReg regularization;
	return C * HingeLoss(y_hat, y) + regularization.regTerm(weights, 1, 0, "Ridge");
}
real_t MLPPCost::HingeLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y, std::vector<std::vector<real_t>> weights, real_t C) {
	MLPPLinAlg alg;
	MLPPReg regularization;
	return C * HingeLoss(y_hat, y) + regularization.regTerm(weights, 1, 0, "Ridge");
}

std::vector<real_t> MLPPCost::HingeLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y, real_t C) {
	MLPPLinAlg alg;
	MLPPReg regularization;
	return alg.scalarMultiply(C, HingeLossDeriv(y_hat, y));
}
std::vector<std::vector<real_t>> MLPPCost::HingeLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y, real_t C) {
	MLPPLinAlg alg;
	MLPPReg regularization;
	return alg.scalarMultiply(C, HingeLossDeriv(y_hat, y));
}

real_t MLPPCost::dualFormSVM(std::vector<real_t> alpha, std::vector<std::vector<real_t>> X, std::vector<real_t> y) {
	MLPPLinAlg alg;
	std::vector<std::vector<real_t>> Y = alg.diag(y); // Y is a diagnoal matrix. Y[i][j] = y[i] if i = i, else Y[i][j] = 0. Yt = Y.
	std::vector<std::vector<real_t>> K = alg.matmult(X, alg.transpose(X)); // TO DO: DON'T forget to add non-linear kernelizations.
	std::vector<std::vector<real_t>> Q = alg.matmult(alg.matmult(alg.transpose(Y), K), Y);
	real_t alphaQ = alg.matmult(alg.matmult({ alpha }, Q), alg.transpose({ alpha }))[0][0];
	std::vector<real_t> one = alg.onevec(alpha.size());

	return -alg.dot(one, alpha) + 0.5 * alphaQ;
}

std::vector<real_t> MLPPCost::dualFormSVMDeriv(std::vector<real_t> alpha, std::vector<std::vector<real_t>> X, std::vector<real_t> y) {
	MLPPLinAlg alg;
	std::vector<std::vector<real_t>> Y = alg.zeromat(y.size(), y.size());
	for (int i = 0; i < y.size(); i++) {
		Y[i][i] = y[i]; // Y is a diagnoal matrix. Y[i][j] = y[i] if i = i, else Y[i][j] = 0. Yt = Y.
	}
	std::vector<std::vector<real_t>> K = alg.matmult(X, alg.transpose(X)); // TO DO: DON'T forget to add non-linear kernelizations.
	std::vector<std::vector<real_t>> Q = alg.matmult(alg.matmult(alg.transpose(Y), K), Y);
	std::vector<real_t> alphaQDeriv = alg.mat_vec_mult(Q, alpha);
	std::vector<real_t> one = alg.onevec(alpha.size());

	return alg.subtraction(alphaQDeriv, one);
}
Added https://github.com/novak-99/MLPP as a base, without the included datasets. 2023-01-23 21:13:26 +01:00			`//`
			`// Reg.cpp`
			`//`
			`// Created by Marc Melikyan on 1/16/21.`
			`//`

Fixed remaining errors and added everything to the build. 2023-01-24 19:14:38 +01:00			`#include "cost.h"`
Include cleanups. 2023-01-24 18:12:23 +01:00			`#include "../lin_alg/lin_alg.h"`
			`#include "../regularization/reg.h"`
Clang format. 2023-01-24 19:00:54 +01:00			`#include <cmath>`
			`#include <iostream>`
Added https://github.com/novak-99/MLPP as a base, without the included datasets. 2023-01-23 21:13:26 +01:00
Removed the MLPP namespace. 2023-01-24 19:20:18 +01:00
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::MSE(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`sum += (y_hat[i] - y[i]) * (y_hat[i] - y[i]);`
			`}`
			`return sum / 2 * y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::MSE(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`sum += (y_hat[i][j] - y[i][j]) * (y_hat[i][j] - y[i][j]);`
			`}`
			`}`
			`return sum / 2 * y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::MSEDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.subtraction(y_hat, y);`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::MSEDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.subtraction(y_hat, y);`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::RMSE(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`sum += (y_hat[i] - y[i]) * (y_hat[i] - y[i]);`
			`}`
			`return sqrt(sum / y_hat.size());`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::RMSE(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`sum += (y_hat[i][j] - y[i][j]) * (y_hat[i][j] - y[i][j]);`
			`}`
			`}`
			`return sqrt(sum / y_hat.size());`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::RMSEDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.scalarMultiply(1 / (2 * sqrt(MSE(y_hat, y))), MSEDeriv(y_hat, y));`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::RMSEDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.scalarMultiply(1 / (2 / sqrt(MSE(y_hat, y))), MSEDeriv(y_hat, y));`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::MAE(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`sum += abs((y_hat[i] - y[i]));`
			`}`
			`return sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::MAE(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`sum += abs((y_hat[i][j] - y[i][j]));`
			`}`
			`}`
			`return sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::MAEDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`std::vector<real_t> deriv;`
Clang format. 2023-01-24 19:00:54 +01:00			`deriv.resize(y_hat.size());`
			`for (int i = 0; i < deriv.size(); i++) {`
			`if (y_hat[i] < 0) {`
			`deriv[i] = -1;`
			`} else if (y_hat[i] == 0) {`
			`deriv[i] = 0;`
			`} else {`
			`deriv[i] = 1;`
			`}`
			`}`
			`return deriv;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::MAEDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`std::vector<std::vector<real_t>> deriv;`
Clang format. 2023-01-24 19:00:54 +01:00			`deriv.resize(y_hat.size());`
			`for (int i = 0; i < deriv.size(); i++) {`
			`deriv.resize(y_hat[i].size());`
			`}`
			`for (int i = 0; i < deriv.size(); i++) {`
			`for (int j = 0; j < deriv[i].size(); j++) {`
			`if (y_hat[i][j] < 0) {`
			`deriv[i][j] = -1;`
			`} else if (y_hat[i][j] == 0) {`
			`deriv[i][j] = 0;`
			`} else {`
			`deriv[i][j] = 1;`
			`}`
			`}`
			`}`
			`return deriv;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::MBE(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`sum += (y_hat[i] - y[i]);`
			`}`
			`return sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::MBE(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`sum += (y_hat[i][j] - y[i][j]);`
			`}`
			`}`
			`return sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::MBEDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.onevec(y_hat.size());`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::MBEDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.onemat(y_hat.size(), y_hat[0].size());`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::LogLoss(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`real_t sum = 0;`
			`real_t eps = 1e-8;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`sum += -(y[i] * std::log(y_hat[i] + eps) + (1 - y[i]) * std::log(1 - y_hat[i] + eps));`
			`}`

			`return sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::LogLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`real_t sum = 0;`
			`real_t eps = 1e-8;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`sum += -(y[i][j] * std::log(y_hat[i][j] + eps) + (1 - y[i][j]) * std::log(1 - y_hat[i][j] + eps));`
			`}`
			`}`

			`return sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::LogLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.addition(alg.scalarMultiply(-1, alg.elementWiseDivision(y, y_hat)), alg.elementWiseDivision(alg.scalarMultiply(-1, alg.scalarAdd(-1, y)), alg.scalarMultiply(-1, alg.scalarAdd(-1, y_hat))));`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::LogLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.addition(alg.scalarMultiply(-1, alg.elementWiseDivision(y, y_hat)), alg.elementWiseDivision(alg.scalarMultiply(-1, alg.scalarAdd(-1, y)), alg.scalarMultiply(-1, alg.scalarAdd(-1, y_hat))));`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::CrossEntropy(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`sum += y[i] * std::log(y_hat[i]);`
			`}`

			`return -1 * sum;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::CrossEntropy(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`sum += y[i][j] * std::log(y_hat[i][j]);`
			`}`
			`}`

			`return -1 * sum;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::CrossEntropyDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.scalarMultiply(-1, alg.elementWiseDivision(y, y_hat));`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::CrossEntropyDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.scalarMultiply(-1, alg.elementWiseDivision(y, y_hat));`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::HuberLoss(std::vector<real_t> y_hat, std::vector<real_t> y, real_t delta) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`if (abs(y[i] - y_hat[i]) <= delta) {`
			`sum += (y[i] - y_hat[i]) * (y[i] - y_hat[i]);`
			`} else {`
			`sum += 2 * delta * abs(y[i] - y_hat[i]) - delta * delta;`
			`}`
			`}`
			`return sum;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::HuberLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y, real_t delta) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`if (abs(y[i][j] - y_hat[i][j]) <= delta) {`
			`sum += (y[i][j] - y_hat[i][j]) * (y[i][j] - y_hat[i][j]);`
			`} else {`
			`sum += 2 * delta * abs(y[i][j] - y_hat[i][j]) - delta * delta;`
			`}`
			`}`
			`}`
			`return sum;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::HuberLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y, real_t delta) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t sum = 0;`
			`std::vector<real_t> deriv;`
Clang format. 2023-01-24 19:00:54 +01:00			`deriv.resize(y_hat.size());`

			`for (int i = 0; i < y_hat.size(); i++) {`
			`if (abs(y[i] - y_hat[i]) <= delta) {`
			`deriv.push_back(-(y[i] - y_hat[i]));`
			`} else {`
			`if (y_hat[i] > 0 \|\| y_hat[i] < 0) {`
			`deriv.push_back(2 * delta * (y_hat[i] / abs(y_hat[i])));`
			`} else {`
			`deriv.push_back(0);`
			`}`
			`}`
			`}`
			`return deriv;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::HuberLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y, real_t delta) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t sum = 0;`
			`std::vector<std::vector<real_t>> deriv;`
Clang format. 2023-01-24 19:00:54 +01:00			`deriv.resize(y_hat.size());`
			`for (int i = 0; i < deriv.size(); i++) {`
			`deriv[i].resize(y_hat[i].size());`
			`}`

			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`if (abs(y[i][j] - y_hat[i][j]) <= delta) {`
			`deriv[i].push_back(-(y[i][j] - y_hat[i][j]));`
			`} else {`
			`if (y_hat[i][j] > 0 \|\| y_hat[i][j] < 0) {`
			`deriv[i].push_back(2 * delta * (y_hat[i][j] / abs(y_hat[i][j])));`
			`} else {`
			`deriv[i].push_back(0);`
			`}`
			`}`
			`}`
			`}`
			`return deriv;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::HingeLoss(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`sum += fmax(0, 1 - y[i] * y_hat[i]);`
			`}`

			`return sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::HingeLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`sum += fmax(0, 1 - y[i][j] * y_hat[i][j]);`
			`}`
			`}`

			`return sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::HingeLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`std::vector<real_t> deriv;`
Clang format. 2023-01-24 19:00:54 +01:00			`deriv.resize(y_hat.size());`
			`for (int i = 0; i < y_hat.size(); i++) {`
			`if (1 - y[i] * y_hat[i] > 0) {`
			`deriv[i] = -y[i];`
			`} else {`
			`deriv[i] = 0;`
			`}`
			`}`
			`return deriv;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::HingeLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`std::vector<std::vector<real_t>> deriv;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`if (1 - y[i][j] * y_hat[i][j] > 0) {`
			`deriv[i][j] = -y[i][j];`
			`} else {`
			`deriv[i][j] = 0;`
			`}`
			`}`
			`}`
			`return deriv;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::WassersteinLoss(std::vector<real_t> y_hat, std::vector<real_t> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`sum += y_hat[i] * y[i];`
			`}`
			`return -sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::WassersteinLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
			`real_t sum = 0;`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y_hat.size(); i++) {`
			`for (int j = 0; j < y_hat[i].size(); j++) {`
			`sum += y_hat[i][j] * y[i][j];`
			`}`
			`}`
			`return -sum / y_hat.size();`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::WassersteinLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.scalarMultiply(-1, y); // Simple.`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::WassersteinLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.scalarMultiply(-1, y); // Simple.`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::HingeLoss(std::vector<real_t> y_hat, std::vector<real_t> y, std::vector<real_t> weights, real_t C) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Prefixed more classes with MLPP. 2023-01-25 00:54:50 +01:00			`MLPPReg regularization;`
Clang format. 2023-01-24 19:00:54 +01:00			`return C * HingeLoss(y_hat, y) + regularization.regTerm(weights, 1, 0, "Ridge");`
			`}`
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::HingeLoss(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y, std::vector<std::vector<real_t>> weights, real_t C) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Prefixed more classes with MLPP. 2023-01-25 00:54:50 +01:00			`MLPPReg regularization;`
Clang format. 2023-01-24 19:00:54 +01:00			`return C * HingeLoss(y_hat, y) + regularization.regTerm(weights, 1, 0, "Ridge");`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::HingeLossDeriv(std::vector<real_t> y_hat, std::vector<real_t> y, real_t C) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Prefixed more classes with MLPP. 2023-01-25 00:54:50 +01:00			`MLPPReg regularization;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.scalarMultiply(C, HingeLossDeriv(y_hat, y));`
			`}`
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> MLPPCost::HingeLossDeriv(std::vector<std::vector<real_t>> y_hat, std::vector<std::vector<real_t>> y, real_t C) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Prefixed more classes with MLPP. 2023-01-25 00:54:50 +01:00			`MLPPReg regularization;`
Clang format. 2023-01-24 19:00:54 +01:00			`return alg.scalarMultiply(C, HingeLossDeriv(y_hat, y));`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`real_t MLPPCost::dualFormSVM(std::vector<real_t> alpha, std::vector<std::vector<real_t>> X, std::vector<real_t> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> Y = alg.diag(y); // Y is a diagnoal matrix. Y[i][j] = y[i] if i = i, else Y[i][j] = 0. Yt = Y.`
			`std::vector<std::vector<real_t>> K = alg.matmult(X, alg.transpose(X)); // TO DO: DON'T forget to add non-linear kernelizations.`
			`std::vector<std::vector<real_t>> Q = alg.matmult(alg.matmult(alg.transpose(Y), K), Y);`
			`real_t alphaQ = alg.matmult(alg.matmult({ alpha }, Q), alg.transpose({ alpha }))[0][0];`
			`std::vector<real_t> one = alg.onevec(alpha.size());`
Clang format. 2023-01-24 19:00:54 +01:00
			`return -alg.dot(one, alpha) + 0.5 * alphaQ;`
			`}`

Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<real_t> MLPPCost::dualFormSVMDeriv(std::vector<real_t> alpha, std::vector<std::vector<real_t>> X, std::vector<real_t> y) {`
Prefixed LinAlg with MLPP. 2023-01-25 00:29:02 +01:00			`MLPPLinAlg alg;`
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> Y = alg.zeromat(y.size(), y.size());`
Clang format. 2023-01-24 19:00:54 +01:00			`for (int i = 0; i < y.size(); i++) {`
			`Y[i][i] = y[i]; // Y is a diagnoal matrix. Y[i][j] = y[i] if i = i, else Y[i][j] = 0. Yt = Y.`
			`}`
Use real_t instead of doubles. 2023-01-27 13:01:16 +01:00			`std::vector<std::vector<real_t>> K = alg.matmult(X, alg.transpose(X)); // TO DO: DON'T forget to add non-linear kernelizations.`
			`std::vector<std::vector<real_t>> Q = alg.matmult(alg.matmult(alg.transpose(Y), K), Y);`
			`std::vector<real_t> alphaQDeriv = alg.mat_vec_mult(Q, alpha);`
			`std::vector<real_t> one = alg.onevec(alpha.size());`
Clang format. 2023-01-24 19:00:54 +01:00
			`return alg.subtraction(alphaQDeriv, one);`
			`}`