İstatistiksel Testler ve Yorumlama
t-test, chi-square, ANOVA, korelasyon testleri — Code Interpreter ile otomatik ve sonuçların yorumu.
Şükrü Yusuf KAYA
9 dakikalık okuma
OrtaHangi durumda hangi test?#
İstatistiksel testler 2 ana soruya cevap verir:
- İlişki var mı? → korelasyon, regresyon
- Fark anlamlı mı? → t-test, ANOVA, chi-square
ChatGPT, hangi testin uygun olduğunu veriyi inceleyip kendisi seçebilir.
Test seçimi karar tablosu#
| Soru tipi | Bağımlı değişken tipi | Bağımsız değişken tipi | Test |
|---|---|---|---|
| 2 grup farkı | Sürekli | İkili kategorik | Independent t-test |
| 3+ grup farkı | Sürekli | 3+ kategorik | One-way ANOVA |
| 2 ölçüm farkı | Sürekli | Tek grup, 2 zaman | Paired t-test |
| Kategorik ilişki | Kategorik | Kategorik | Chi-square |
| Sürekli ilişki | Sürekli | Sürekli | Pearson / Spearman korelasyonu |
| Etki tahmini | Sürekli | Sürekli + kategorik | Linear regression |
| Olasılık tahmini | İkili | Karışık | Logistic regression |
text
Ekteki ab_test.csv dosyasını analiz et. İki grup var:- Group A: kontrol (n=850)- Group B: yeni hero ile (n=830) Metrik: 'converted' (0/1) — landing page'de signup butonuna tıkladı mı. Yapmanı istediklerim: 1. **Tanımlayıcı istatistik**: her grup için n, conversion rate, %95 güven aralığı2. **Test seçimi**: hangi test (z-test? chi-square?), neden3. **Test çalıştır**: p-value + effect size (Cohen's h)4. **Yorum**: anlamlı mı? Pratik anlamlılığı var mı? Sample size yeterli mi?5. **Görsel**: bar chart with error bars6. **Karar**: B'yi yayına geçirelim mi? Risk? Code Interpreter kullan, kodu da göster.A/B test analizi için kapsamlı prompt — istatistik + iş kararı.
⚠️ p-değer fetişizmi
p < 0.05 = kesin doğru DEĞİL. Sadece 'tesadüfen bu sonucu görmek %5'ten az olası' anlamına gelir. Mutlaka effect size, practical significance, sample size birlikte değerlendir. ChatGPT'ye 'p-değerine ek olarak effect size ve pratik anlam yorumu ver' demek bu hatayı önler.
Özet#
✓ Test seçimi: değişken tipine göre karar tablosundan al
✓ ChatGPT + Code Interpreter ile test 30 sn'de çalışır
✓ p-değer + effect size + sample size = sağlıklı yorum
✓ A/B test, çoklu grup karşılaştırma, korelasyon — hepsi tek araç
Sıradaki ders: Veri temizleme workflow'u.
Yorumlar & Soru-Cevap
(0)Yorum yazmak için giriş yap.
Yorumlar yükleniyor...
İlgili İçerikler
Modül 1: Başlangıç ve Temeller
ChatGPT Nedir? Tarihçe, Evrim ve Bugünün Manzarası
Öğrenmeye BaşlaModül 1: Başlangıç ve Temeller
Hesap Açma ve Plan Karşılaştırması: Free, Plus, Pro, Team, Enterprise
Öğrenmeye BaşlaModül 1: Başlangıç ve Temeller