AreaCriterionPoCValidation MethodMeasurable Target / ConditionValidation Source / Evidence

Data QualityDataset is complete and consistent after cleaningPOC 1–2Check for missing values and duplicates≤ 2% missing values in relevant features, 0 duplicate rowsData cleaning notebook

Data RelevanceSelected features are relevant for predicting injury riskPOC 2–3Correlation and domain validation≥ 80% of features have meaningful relationship with target variableFeature analysis & domain reasoning

Feature Engineering EffectivenessEngineered features improve model performancePOC 3–4Compare baseline vs. engineered modelAccuracy or F1-score increases by ≥ 5% after feature engineeringModel comparison metrics

Model PerformanceML model predicts injury risk with acceptable accuracyPOC 4–5Cross-validation (train/test split)Accuracy ≥ 75%, F1-score ≥ 0.70, Precision ≥ 0.70Model evaluation results

Model InterpretabilityImportant features align with football domain logicPOC 5SHAP/feature importance analysisTop 5 features (e.g., minutes played, age, tackles) are domain-relevantModel explainability notebook

GeneralizationModel performs consistently on unseen dataPOC 5Validation on hold-out setPerformance drop ≤ 10% between training and test setEvaluation notebook

Dashboard UsabilityDashboard communicates predictions clearlyPOC 6User feedback (survey/test)≥ 80% of testers rate dashboard as “clear” or “useful”Usability test results

System IntegrationDashboard correctly connects with model outputPOC 6Functional test100% of predicted results displayed without errorsDashboard integration testing

Project DocumentationAll PoCs are reproducible and well-documentedAllInternal peer reviewDocumentation completeness ≥ 90% (based on rubric)GitHub / project portfolio

Learning OutcomeDemonstrated growth in ML workflow understandingAllSelf-assessment and reflection≥ 4/5 self-assessed improvement in Python, ML, and data visualizationReflection log / learning journal

table generating project