Homoscedasticity ve Heteroscedasticity nedir, regresyon analizi sırasında oldukça karşılaştığımız bir konudur. Bu konu aslında ML çalışan kişilerin öncelikle İstatistik çalışması gerektiğinin en büyük ispatıdır. Bu iki kavramdan bahsedecek olursak Homoscedasticity rastgele değişkenlerin sonlu varyansı eşitse, homojen bir yapıya sahip olma durumudur. Heteroscedasticity ise homoscedasticity olmama durumu yani eşit olmayan bir yapı/dağılım diyebiliriz.
Heteroscedasticity regresyon kullanılması gereken durumlarda bize bir problem yaratacaktır. Doğrusal regresyonda kullanılan en küçük kareler yöntemi değişkenlerin homoscedasticity olduğunu varsayar. Bunun dışında Heteroscedasticity “p” değerlerinin olması gerekenden daha küçük değerler çıkarmasına sebep olacaktır. Bu da verilerde yapılacak işlemlerde yanılgı ve istatistiksel olarak yapacağımız yorumlarda yanlışa sürükleyecektir.
Öncelikle bir veri kümemizde Heteroscedasticity var mı yok mu bunu incelememiz gerekebilir. Veri bilimi ile uğraşan birçok kişi de önce bunu inceler. Bunun için iki farklı istatiksel test mevcut. Bunları anlatmama izin verin. Bunlardan ilki “Breush – Pegan Testi” bir diğeri ise “beyaz” testtir. Bu iki test yardımıyla verilerimizde Heteroscedasticity saptayabiliriz. Heteroscedasticity probleminden nasıl kurtulabileceğimizi anlatmak istiyorum. İki yöntem mevcuttur.
1) bunlardan biri bağımlı ve bağımsız değişkenlerimizi veri kümemizin dağılımına göre yeniden tanımlamak diyebiliriz. Burada değişkenlerin birbiriyle olan ilişkisinin ne kadar olağan olduğuna dikkat etmekte fayda var. Çünkü fazla olağan bir ilişki bize yeterince aydınlatıcı bir yöntemle sonuçlar vermeyecektir.
2) Bir diğer yöntem ise ağırlıklı regresyon olacaktır. Bu yöntem Heteroscedasticity durumu gözlenen verilerde her bir veriye bir ağırlık vererek homoscedasticity yapma durumu denebilir. Buradaki hedef kareleri küçültmek için yüksek varyanslı değerlere küçük ağırlıklar atayarak Homoscedasticity yapısına ulaşmaktır. Bu kısımda en çok sorun yaratabilecek durum geçerli ağırlıkları belirlemek olacaktır. En doğru ağırlık hatanın varyansının karşılığıdır ve bu hesaplanması zor bir durum.
Bunlar gibi çözüm yöntemlerinden sonra Heteroscedasticity sorunundan kurtulmuş olacağız. Kısaca Heteroscedasticity konusunun ML de kullanımı bu şekildedir.
[…] ML Homoscedasticity Heteroscedasticity Nedir? […]