Genelleştirilmiş doğrusal modeller - kurs 3600 ruble. Açıköğretimden, eğitim 3 hafta, haftada yaklaşık 6 saat, Tarih 29 Kasım 2023.
Miscellanea / / December 01, 2023
Geleneksel doğrusal modellerin uygulanabilirliğinin koşullarından biri, modelin seçildiği temel olarak gözlemlerin birbirinden bağımsız olmasıdır. Ancak uygulamada sıklıkla malzeme toplama tasarımının bu koşulun ihlalini kaçınılmaz kılacak şekilde olduğu durumlar vardır. Öğrenciler arasında beden eğitimi performansı ile IQ testi puanları arasındaki ilişkiyi açıklayan bir model oluşturmaya karar verdiğinizi hayal edin. Bu sorunu çözmek için çeşitli kurumlarda çok sayıda numune yaptınız. Bu tür verileri geleneksel şemaya göre oluşturulmuş tek bir analizde birleştirmek mümkün müdür? Tabii ki değil. Her üniversitedeki öğrenciler bazı yönlerden birbirine benzeyebilir. İncelenen miktarlar arasındaki ilişkinin doğası bile biraz farklı olabilir. Grup içi korelasyonların olduğu bu tür veriler doğrusal karma modeller kullanılarak analiz edilmelidir. Bazı yordayıcıların modele “rastgele faktörler” olarak dahil edilmesi gerektiğini göstereceğiz. Rastgele faktörlerin hiyerarşik olarak sıralanabileceğini öğreneceksiniz. Farklı dağılım türlerini takip eden bağımlı değişkenler için bu tür karma modellerin nasıl oluşturulabileceğini tartışacağız. Ek olarak, modelin rastgele kısmının daha da karmaşık olabileceğini göstereceğiz; bir ortak değişkenin etkisine yanıt olarak varyansın davranışını modelleyen bir bileşene sahip olabilir. Kursun sonunda çeşitli veri kümelerinden birini seçerek karma modeller oluşturma pratiği yapabileceğiniz bir proje bulacaksınız. Bu verilerin analizine dayanarak tekrarlanabilir araştırma geleneğinde bir rapor oluşturabilirsiniz.
Doçent, Omurgasız Zooloji Bölümü, Biyoloji Fakültesi, St. Petersburg Devlet Üniversitesi, Ph.D.
Bilimsel ilgi alanları: deniz bentos topluluklarının yapısı ve dinamikleri, mekansal ölçekler, süksesyon, türler arası ve tür içi biyotik etkileşimler, deniz omurgasızlarının büyümesi ve üremesi, popülasyonların demografik yapısı, mikroevrim, biyoistatistik.
Kurs 4 modülden oluşmaktadır:
1) Genelleştirilmiş doğrusal modellere giriş
Genelleştirilmiş doğrusal modeller (GLM'ler), normal dağılıma uymayan niceliklerin davranışını modellemenize olanak tanır. GLM dünyasındaki ilk adımlarınızı kolaylaştırmak için, normal dağılmış miktarlar için GLM örneğini kullanarak yapılarını analiz edeceğiz - bu şekilde basit doğrusal modellerle paralellikler kurabilirsiniz. Bir bağlantı fonksiyonunun ne olduğunu, maksimum olasılığın nasıl çalıştığını ve Wald testleri ve olabilirlik oranı testlerini kullanarak GLM hipotezlerinin nasıl test edileceğini öğreneceksiniz.
2) Model seçim problemi
Bu modülde bina modelleriyle ilgili metodolojik konular hakkında konuşacağız. Bir model, gerçekliğin basitleştirilmiş bir temsilidir ve bu basitleştirmenin farklı rakip yöntemleri arasında seçim yapmak, analistin sıklıkla yaptığı bir görevdir. Bu modülde modelleri bilgi kriterlerini kullanarak karşılaştırmayı öğreneceksiniz. Model seçerken analizin ana seçeneklerini tartışacağız ve modellerin gizli çokluğuyla bağlantılı olarak ortaya çıkan zorluklardan bahsedeceğiz. Son olarak, model seçimi suiistimallerinin ana türlerini (veri avlama, p-hacking) tanımayı öğreteceğiz.
3) Veri sayımı için genelleştirilmiş doğrusal modeller
Bu modülde sayılabilir büyüklüklerin modellenmesine yönelik temel yöntemleri tartışacağız. Öncelikle geleneksel doğrusal modellerin neden veri saymaya uygun olmadığını tartışacağız. Sayılabilir dağılımların özellikleri, sayılabilir veriler için GLM türleri ile bunların tanılama özellikleri arasındaki farkları anlamanıza yardımcı olacaktır. GLM tahminlerini bağlantı işlevi ölçeğinde ve yanıt değişkeni ölçeğinde görselleştirdiğinizde, bağlantı işlevinin iş başında olduğunu göreceksiniz.
4) İkili yanıtlı genelleştirilmiş doğrusal modeller
Bazen bir olayın gerçekleşip gerçekleşmediğini, olayın gerçekleşip gerçekleşmediğini simüle etmeye ihtiyaç duyulur. futbol takımı veya kayıp, hastanın tedaviden sonra iyileşip iyileşmediği, müvekkilin suç işleyip işlemediği satın al ya da alma. Geleneksel doğrusal modeller bu tür ikili verileri (iki sonucu olan olaylar) modellemek için uygun değildir ancak bu, genelleştirilmiş doğrusal modeller kullanılarak kolayca yapılabilir. Bu modülde olayların gerçekleşme olasılıklarını olasılık olarak temsil ederek modellemeyi öğreneceksiniz. Logit link fonksiyonunun nasıl çalıştığına ve kullanıldığında GLM katsayılarının nasıl yorumlandığına bakacağız. Son olarak, bir veri analizi projesini tamamlayarak farklı dağılımlara sahip genelleştirilmiş doğrusal modelleri analiz etme pratiği yapabileceksiniz. Bu analizin sonuçlarının, rmarkdown/knitr kullanılarak yazılmış, html formatında bir rapor olarak sunulması gerekecektir.
• Analitik ve Veri Bilimine başlamak için hangi becerilerin gerekli olduğunu öğrenin • Çalışmak için Excel, SQL, Power BI, Google Data Studio'yu kullanmayı öğrenin veri ve ilk kodunuzu Python'da yazın• Adım adım kılavuz edinin ve veri bilimi alanına nasıl gireceğinizi ve Veri Biliminde bir rol seçmeyi öğrenin
4,4
1 490 ₽