Interpretable XGBoost Modeling Using SHAP and LIME: A Real-World Electric Vehicle Study


Demirsoy I.

PAMUKKALE UNIVERSITY JOURNAL OF ENGINEERING SCIENCES-PAMUKKALE UNIVERSITESI MUHENDISLIK BILIMLERI DERGISI, ss.1-22, 2026 (ESCI, TRDizin)

Özet

Bu çalışma, açıklanabilir makine öğrenmesi metotları kullanarak elektrikli araç (EA) fiyatlandırmasının belirleyicilerini incelemektedir. Teknik özelliklerden oluşan kapsamlı bir veri seti üzerinde XGBoost modeli kullanılarak yüksek bir tahmin doğruluğu (R² = 0,958) elde edilmiş; modelin karar mantığını ayrıştırmak için SHAP ve LIME yöntemlerinden yararlanılmıştır. Analizlerimiz, otomotiv değerleme ilkelerinde temel bir dönüşümü ortaya koymaktadır: Temel Bileşenler Analizi (PCA) aracılığıyla sentezlenen bütünleşik performans özellikleri birincil fiyat belirleyicisi olarak öne çıkmakta, bunu doğrusal olmayan eşik etkileri sergileyen araç boyutları izlemektedir. Dikkat çekici biçimde, geleneksel ayırt edici unsurların etkisi sınırlı kalmış; bu durum, elektrikli güç aktarma sistemlerinin geleneksel otomotiv hiyerarşilerini yeniden tanımladığını düşündürmektedir. Tamamlayıcı yorumlanabilirlik yöntemleri tutarlı biçimde, EA fiyatlandırmasının geleneksel statü göstergelerinden ziyade mühendislik özünü ödüllendirdiğini; performans paketleri ve boyutsal eşiklerin net bir pazar ayrışması yarattığını göstermektedir. Bu bulgular, üreticilere premium konumlandırma için nicel mühendislik hedefleri sunarken, tüketicilere özellik değerlemesine ilişkin benzeri görülmemiş bir şeffaflık sağlamaktadır. Çalışma, yorumlanabilir makine öğrenmesinin yalnızca fiyatları tahmin etmekle kalmayıp, elektrikli araç devrimini yöneten yeni ekonomik mantığı, teknolojik entegrasyon ve fiziksel oranların tarihsel otomotiv statü sembollerinin önüne geçtiği bir düzeni açığa çıkardığını ortaya koymaktadır.

This study investigates the determinants of electric vehicle (EV) pricing through an interpretable machine learning framework. Using XGBoost on a comprehensive dataset of technical specifications, we achieve high predictive accuracy (R²=0.958) while employing SHAP and LIME to deconstruct the model's decision logic. Our analysis reveals a fundamental shift in automotive valuation principles: integrated performance characteristics synthesized via Principal Component Analysis. It emerges as the primary price driver, followed by vehicle dimensions, which exhibit non-linear threshold effects. Notably, traditional differentiators had minimal impact, suggesting that electric powertrains are redefining conventional automotive hierarchies. The complementary interpretability methods consistently demonstrate that EV pricing rewards engineering substance over traditional status markers, with performance bundles and dimensional thresholds creating clear market stratification. These findings provide manufacturers with quantifiable engineering targets for premium positioning and offer consumers unprecedented transparency into feature valuation. The study establishes that interpretable machine learning not only predicts prices but also uncovers the emerging economic logic governing the electric vehicle revolution, where technological integration and physical proportions supersede historical automotive status symbols.