Veri Bilimi

ML Homoscedasticity Heteroscedasticity Nedir?

Homoscedasticity ve Heteroscedasticity nedir,  regresyon analizi sırasında oldukça karşılaştığımız bir konudur. Bu konu aslında ML çalışan kişilerin öncelikle İstatistik çalışması gerektiğinin en büyük ispatıdır. Bu iki kavramdan bahsedecek olursak Homoscedasticity rastgele değişkenlerin sonlu varyansı eşitse, homojen bir yapıya sahip olma durumudur.  Heteroscedasticity ise  homoscedasticity olmama durumu yani eşit olmayan bir yapı/dağılım diyebiliriz.   

ML Homoscedasticity Heteroscedasticity Nedir

Heteroscedasticity regresyon kullanılması gereken durumlarda bize bir problem yaratacaktır. Doğrusal regresyonda kullanılan en küçük kareler yöntemi değişkenlerin  homoscedasticity olduğunu varsayar. Bunun dışında  Heteroscedasticity “p” değerlerinin olması gerekenden daha küçük değerler çıkarmasına sebep olacaktır. Bu da verilerde yapılacak işlemlerde yanılgı ve istatistiksel olarak yapacağımız yorumlarda yanlışa sürükleyecektir. 

ML Heteroscedasticity görünümü

Öncelikle bir veri kümemizde Heteroscedasticity var mı yok mu bunu incelememiz gerekebilir. Veri bilimi ile uğraşan birçok kişi de önce bunu inceler. Bunun için iki farklı istatiksel test mevcut. Bunları anlatmama izin verin. Bunlardan ilki “Breush – Pegan Testi” bir diğeri ise “beyaz” testtir. Bu iki test yardımıyla verilerimizde Heteroscedasticity saptayabiliriz. Heteroscedasticity probleminden nasıl kurtulabileceğimizi anlatmak istiyorum. İki yöntem mevcuttur. 

1) bunlardan biri bağımlı ve bağımsız değişkenlerimizi veri kümemizin dağılımına göre yeniden tanımlamak diyebiliriz. Burada değişkenlerin birbiriyle olan ilişkisinin ne kadar olağan olduğuna dikkat etmekte fayda var. Çünkü fazla olağan bir ilişki bize yeterince aydınlatıcı bir yöntemle sonuçlar vermeyecektir. 

2) Bir diğer yöntem ise ağırlıklı regresyon olacaktır. Bu yöntem  Heteroscedasticity durumu gözlenen verilerde her bir veriye bir ağırlık vererek  homoscedasticity yapma durumu denebilir. Buradaki hedef kareleri küçültmek için yüksek varyanslı değerlere küçük ağırlıklar atayarak  Homoscedasticity yapısına ulaşmaktır. Bu kısımda en çok sorun yaratabilecek durum geçerli ağırlıkları belirlemek olacaktır. En doğru ağırlık hatanın varyansının karşılığıdır ve bu hesaplanması zor bir durum.

regresyon outlier

Bunlar gibi çözüm yöntemlerinden sonra  Heteroscedasticity sorunundan kurtulmuş olacağız. Kısaca  Heteroscedasticity konusunun ML de kullanımı bu şekildedir.

Burak Berber

Burak Berber

View Comments

Recent Posts

Bill Gates Melinda Gates Boşanma Davasında Son Durum

Bill Gates ve Melinda Gates boşanması teknoloji dünyasına bomba gibi düştü. Bill Gates'in dünyanın en…

4 yıl ago

Facebook Akıllı Bileklik Tanıtımını Yaptı

Facebook akıllı bileklik modelini piyasaya sürdü. En çok kullanılan sosyal medya platformu olmayı yeterli görmeyen…

4 yıl ago

Gameloop Emülatör Kasma ve Donma Sorunu Nasıl Çözülür?

Oyun meraklılarının ve profesyonel oyuncuların sorunlarından biri olan gameloop emülatör kasma ve donma sorunu çözümü…

4 yıl ago

Dijital Diş Hekimliği 2021 – Robotik Cihazlar

Dijital diş hekimliği, sağlık sektöründe robotik cihazların en çok kullanıldığı alanlar arasındadır. İngiltere'de yapılan 2019-2020…

4 yıl ago

Nasıl Bilgisayar Toplanır? Bilgisayar Toplamak -1

Nasıl bilgisayar toplanır merak edenler için derledik. Yeni bir bilgisayar sahibi olmak herkesin hoşuna gider.…

4 yıl ago

Uber, Birleşik Krallıkta Araç Kiralama Hizmeti Başlattı

Uber bugün, İngiltere'deki kullanıcıların araba kiralama şirketi olan CarTrawler ile ortaklaşa yaptıkları platform ile araç…

4 yıl ago