Homoscedasticity ve Heteroscedasticity nedir,  regresyon analizi sırasında oldukça karşılaştığımız bir konudur. Bu konu aslında ML çalışan kişilerin öncelikle İstatistik çalışması gerektiğinin en büyük ispatıdır. Bu iki kavramdan bahsedecek olursak Homoscedasticity rastgele değişkenlerin sonlu varyansı eşitse, homojen bir yapıya sahip olma durumudur.  Heteroscedasticity ise  homoscedasticity olmama durumu yani eşit olmayan bir yapı/dağılım diyebiliriz.   

ML Homoscedasticity Heteroscedasticity Nedir

Heteroscedasticity regresyon kullanılması gereken durumlarda bize bir problem yaratacaktır. Doğrusal regresyonda kullanılan en küçük kareler yöntemi değişkenlerin  homoscedasticity olduğunu varsayar. Bunun dışında  Heteroscedasticity “p” değerlerinin olması gerekenden daha küçük değerler çıkarmasına sebep olacaktır. Bu da verilerde yapılacak işlemlerde yanılgı ve istatistiksel olarak yapacağımız yorumlarda yanlışa sürükleyecektir. 

ML Heteroscedasticity görünümü

Öncelikle bir veri kümemizde Heteroscedasticity var mı yok mu bunu incelememiz gerekebilir. Veri bilimi ile uğraşan birçok kişi de önce bunu inceler. Bunun için iki farklı istatiksel test mevcut. Bunları anlatmama izin verin. Bunlardan ilki “Breush – Pegan Testi” bir diğeri ise “beyaz” testtir. Bu iki test yardımıyla verilerimizde Heteroscedasticity saptayabiliriz. Heteroscedasticity probleminden nasıl kurtulabileceğimizi anlatmak istiyorum. İki yöntem mevcuttur. 

1) bunlardan biri bağımlı ve bağımsız değişkenlerimizi veri kümemizin dağılımına göre yeniden tanımlamak diyebiliriz. Burada değişkenlerin birbiriyle olan ilişkisinin ne kadar olağan olduğuna dikkat etmekte fayda var. Çünkü fazla olağan bir ilişki bize yeterince aydınlatıcı bir yöntemle sonuçlar vermeyecektir. 

2) Bir diğer yöntem ise ağırlıklı regresyon olacaktır. Bu yöntem  Heteroscedasticity durumu gözlenen verilerde her bir veriye bir ağırlık vererek  homoscedasticity yapma durumu denebilir. Buradaki hedef kareleri küçültmek için yüksek varyanslı değerlere küçük ağırlıklar atayarak  Homoscedasticity yapısına ulaşmaktır. Bu kısımda en çok sorun yaratabilecek durum geçerli ağırlıkları belirlemek olacaktır. En doğru ağırlık hatanın varyansının karşılığıdır ve bu hesaplanması zor bir durum.

regresyon outlier

Bunlar gibi çözüm yöntemlerinden sonra  Heteroscedasticity sorunundan kurtulmuş olacağız. Kısaca  Heteroscedasticity konusunun ML de kullanımı bu şekildedir.

1 Yorum

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz