Araştırmaya Dön
REJİM TESPİTİ
Bölüm 5: Boğa, Ayı veya Yatay — Modeller Karar Versin
Omega Arena • Şubat 2026 • DEVAM EDİYOR
Özet. Bölüm 4'te fiyat yönünü tahmin eden modeller eğitildi. Burada farklı bir yaklaşım benimsiyoruz:
rejim tespiti. "Yarın fiyat yükselecek mi?" yerine "ne tür bir piyasadayız?" diye soruyoruz.
Üç model—HMM (denetimsiz), Random Forest (denetimli) ve Attention'lı BiLSTM—piyasa koşullarını Boğa, Ayı veya Yatay olarak
sınıflandırmak için birlikte çalışıyor. %100 hindsight-doğru etiketler ve 203 özellik ile
bu modeller mükemmel tarihsel gerçekten öğreniyor.
1. NEDEN REJİM TESPİTİ?
Bölüm 4'ün fiyat tahmin modelleri 0.52-0.57 civarında AUC skorları elde etti. Rastgeleden iyi, ama mütevazı. Sorun? Piyasalar farklı koşullarda farklı davranır.
Boğa piyasasında işe yarayan bir strateji, ayı piyasasında felaket olabilir. Yükseliş trendinde "düşüşü satın al" anlamına gelen sinyal, düşüş trendinde "düşen bıçağı yakala" anlamına gelir.
Rejim tespiti bağlam sağlar. Tek bir modelin her şeyi tahmin etmeye çalışması yerine,
önce piyasa durumunu belirleyen özel modeller var. Sonra diğer modeller davranışlarını buna göre uyarlayabilir.
Üç Rejim
| Rejim | Günlük Etiket | Haftalık/Aylık Etiket | Tanım |
| BOĞA | YUKARI | BOĞA | Pozitif % değişim |
| AYI | AŞAĞI | AYI | Negatif % değişim |
| YATAY | AYNI | YATAY | Sıfır % değişim |
2. VERİ SETİ: KURUMSAL DÜZEY
Kestirmeden gitmedik. Bu veri seti aylarca süren veri mühendisliğini temsil ediyor.
Veri Kaynakları
| Kaynak | Özellik | Açıklama |
| Level 1 | 43 | RSI, MACD, Bollinger Bands, ATR, ADX, Ichimoku, vb. |
| Level 2 | 18 | Sharpe, Sortino, VaR, CVaR, Max Drawdown, vb. |
| Level 3 | 52 | Volatilite rejimleri, trend gücü, korku/açgözlülük, tükenme |
| Level 5 | 19 | VIX, DXY, SPY korelasyonu, makro sinyaller |
| Level 6 | 21 | COT verileri, verim eğrisi, kredi spread'leri |
| Level 7 | 15 | Bağlam-duyarlı: ATH %, 52-hafta aralığı, halving döngüsü |
| FRED | 13 | Federal Reserve ekonomik göstergeleri |
| TOPLAM | 203 | İşleme sonrası: 235 (one-hot encoding ile) |
Temporal Bölüm
| Bölüm | Tarih Aralığı | Satır | Amaç |
| Eğitim | 2014-09-17 → 2023-12-31 | 163,574 | Model öğrenimi |
| Doğrulama | 2024-01-01 → 2024-12-31 | 34,402 | Hiperparametre ayarı |
| Test | 2025-01-01 → 2026-01-26 | 35,531 | Final değerlendirme |
Veri sızıntısı yok. Katı temporal sıralama, modellerin eğitim sırasında gelecek verileri asla görmemesini sağlar.
Test verisi gerçekten görülmemiş—modellerin hiç karşılaşmadığı bir yıldan.
Neden Level 7 Bağlam Özellikleri?
Standart teknik göstergeler (Level 1-3) kısa vadeli kalıpları yakalar: RSI, MACD, Bollinger Bands 14-50 günlük pencerelerde çalışır. Ancak rejim tespiti uzun vadeli bağlam gerektirir. $50K'daki fiyat, tüm zamanların en yükseği olduğunda ve ATH'nin %50 altında olduğunda tamamen farklı şeyler ifade eder.
Problem: Mevcut özellikler "Büyük resimde neredeyiz?" gibi soruları cevaplayamıyordu.
Level 7, rejim sınıflandırması için bu eksik bağlamı sağlamak üzere özel olarak tasarlandı.
| Özellik Kategorisi | Neyi Yakalar | Rejimler İçin Neden Önemli |
| ATH Bağlamı |
Tüm zamanların en yükseğinden uzaklık, ATH'den bu yana gün |
Boğa piyasaları ATH'leri iter; ayı piyasaları onlardan uzaklaşır |
| 52-Hafta Aralığı |
Yıllık en yüksek/en düşük aralığındaki konum |
Yıllık diplere yakın = olası birikim; zirvelere yakın = olası dağıtım |
| Dönem Getirileri |
YTD getiri, yıllık getiri, çoklu dönem momentum |
Rejim kalıcılığı: boğa yılları boğa kalır, ayı yılları ayı kalır |
| Mevsimsellik |
Haftanın günü, ay, çeyrek, çeyrek sonu bayrakları |
Tarihsel kalıplar: "Mayıs'ta sat", Q4 rallileri, hafta sonu etkileri |
| Halving Döngüsü |
Bitcoin halving'inden bu yana/halving'e gün, döngü konumu % |
Kripto-spesifik: halving'ler tarihsel olarak boğa piyasası başlangıçlarıyla ilişkili |
Level 7 olmadan, modeller tamamen farklı piyasa bağlamlarında aynı özellik kalıplarını görürdü. Level 7 ile, ATH'deki -%5 günlük düşüş, yıllık diplerdeki -%5 düşüşten farklı görünür—çünkü gerçekten farklıdır.
3. ETİKETLER: %100 HİNDSİGHT DOĞRULUĞU
Bu, rejim tespitini fiyat tahmininden farklı kılan temel içgörüdür.
Biz zaman yolcularıyız. Tarihsel verileri etiketlerken, tam olarak ne olduğunu biliyoruz.
Fiyat yükseldiyse, YUKARI. Düştüyse, AŞAĞI. Eşik yok. Tahmin yok.
Modelin görevi, hangi özellik kalıplarının hangi sonuçlara karşılık geldiğini öğrenmek.
Etiket Dağılımı (Eğitim Seti)
| Etiket Türü | YUKARI/BOĞA | AŞAĞI/AYI | AYNI/YATAY |
| Günlük Yön | ~%50 | ~%49 | ~%1 |
| Haftalık Rejim | ~%51 | ~%48 | ~%1 |
| Aylık Rejim | ~%52 | ~%47 | ~%1 |
4. MODEL 1: HIDDEN MARKOV MODEL (HMM)
Denetimsiz öğrenme. HMM etiketlerimizi görmez. Gizli durumları tamamen özellik kalıplarından keşfeder.
Neden HMM?
- Doğal rejim geçişi: Piyasalar durumlar arasında geçiş yapar—HMM bunu açıkça modelliyor
- Etiket önyargısı yok: Etiketlemeyi düşünmediğimiz kalıpları keşfeder
- Yorumlanabilir: Her durumun net istatistiksel özellikleri var
Konfigürasyon
| Parametre | Değer | Sebep |
| Özellikler | 219 (sadece sayısal) | HMM sürekli özellikler gerektirir |
| Denenecek durumlar | 2, 3, 4, 5 | BIC ile optimal sayıyı bul |
| Kovaryans | Diagonal | Çok özellikle sayısal stabilite |
| İterasyonlar | 300 | Yakınsama sağla |
| Başlatmalar | 10 | Yerel minimumdan kaçın |
HMM Durumu
| Adım | Durum |
| Veri hazırlığı | TAMAMLANDI |
| Eğitim scripti | TAMAMLANDI |
| Eğitim çalıştırma | BEKLİYOR |
| Durum analizi | BEKLİYOR |
5. MODEL 2: RANDOM FOREST
Denetimli öğrenme. Random Forest hindsight-doğru etiketlerimizi görür ve bunları özelliklerden tahmin etmeyi öğrenir.
Neden Random Forest?
- Tabular veriyi mükemmel işler: Yapılandırılmış veri için altın standart
- Özellik önemi: Hangi metriklerin en önemli olduğunu söyler
- Gürültüye dayanıklı: Ağaç topluluğu hataları ortalar
- Ölçekleme gerektirmez: Ağaç tabanlı modeller normalize veri gerektirmez
Konfigürasyon
| Parametre | Arama Aralığı |
| n_estimators | 500 - 1,250 |
| max_depth | 15 - 35, None |
| min_samples_split | 2 - 15 |
| min_samples_leaf | 1 - 6 |
| max_features | sqrt, log2, 0.3, 0.5 |
| class_weight | balanced, balanced_subsample |
Eğitim Yaklaşımı
- RandomizedSearchCV: 100 hiperparametre kombinasyonu
- 5-katlı çapraz doğrulama: Sağlam performans tahmini
- Puanlama metriği: F1-macro (sınıflar arasında dengeli)
- Üç ayrı model: Günlük, Haftalık, Aylık tahminler
Random Forest Durumu
| Adım | Durum |
| Veri hazırlığı | TAMAMLANDI |
| Eğitim scripti | TAMAMLANDI |
| Eğitim çalıştırma | BEKLİYOR |
| Özellik önemi analizi | BEKLİYOR |
6. MODEL 3: BİDİRECTİONAL LSTM + ATTENTİON
Diziler için derin öğrenme. LSTM 90 ardışık günü işler ve sonraki günün rejimini tahmin eder.
Neden Attention'lı LSTM?
- Dizi modelleme: 90 gün boyunca temporal kalıpları öğrenir
- Bidirectional: Dizileri ileri ve geri okur
- Attention mekanizması: Dizideki hangi günlerin en önemli olduğunu öğrenir
- Çok görevli: Tek model günlük, haftalık VE aylık aynı anda tahmin eder
Mimari
| Bileşen | Konfigürasyon |
| Girdi | (batch, 90 gün, 235 özellik) |
| LayerNorm | Girdileri normalize et |
| BiLSTM | 3 katman, hidden_size=256 |
| Attention | Önemli zaman adımlarını öğren |
| Paylaşılan Dense | 256 → 128 dropout ile |
| Çıktı Başlıkları | 3 ayrı başlık (günlük/haftalık/aylık) |
Eğitim Konfigürasyonu
| Parametre | Değer |
| Dizi uzunluğu | 90 gün |
| Batch boyutu | 128 |
| Epoch | 150 (erken durdurma ile) |
| Öğrenme oranı | 1e-3 |
| Dropout | 0.3 |
| Erken durdurma sabrı | 20 epoch |
| Optimizer | AdamW weight decay ile |
| Scheduler | ReduceLROnPlateau |
| Sınıf ağırlıklandırma | Ters frekans |
LSTM Verileri
| Bölüm | Diziler | Şekil | Boyut |
| Eğitim | 154,844 | (154K, 90, 235) | 13.1 GB |
| Doğrulama | 25,942 | (26K, 90, 235) | 2.2 GB |
| Test | 27,020 | (27K, 90, 235) | 2.3 GB |
LSTM Durumu
| Adım | Durum |
| Veri hazırlığı (90 günlük diziler) | TAMAMLANDI |
| Model mimarisi | TAMAMLANDI |
| Eğitim scripti | TAMAMLANDI |
| Eğitim çalıştırma (GPU) | BEKLİYOR |
7. VERİ PAYPLİNE: 10 DOĞRULAMA KONTROLÜ
Kurumsal düzey veri hazırlığı her şeyi birden fazla kez doğrulamak demektir.
| # | Kontrol | Sonuç |
| 1 | DB sütunları veri setiyle eşleşiyor | ✓ GEÇTİ |
| 2 | Tüm tablo özellikleri mevcut | ✓ GEÇTİ |
| 3 | Örnek veri DB ile eşleşiyor | ✓ GEÇTİ |
| 4 | Satır sayıları eşleşiyor | ✓ GEÇTİ |
| 5 | Boş sütun yok | ✓ GEÇTİ |
| 6 | Veri tipleri doğru | ✓ GEÇTİ |
| 7 | Duplicate yok, fiyat bütünlüğü | ✓ GEÇTİ |
| 8 | Tarih sürekliliği | ✓ GEÇTİ |
| 9 | Rastgele örnek çapraz doğrulama | ✓ GEÇTİ |
| 10 | Etiket tutarlılığı (işaret = yön) | ✓ GEÇTİ |
10/10 kontrol geçti. Veri seti doğrulandı, temizlendi ve eğitime hazır.
8. ALTYAPI
Eğitim önemli hesaplama kaynakları gerektiriyor.
| Model | Hesaplama | Bellek | Tahmini Süre |
| HMM | CPU | ~4 GB RAM | 1-2 saat |
| Random Forest | CPU (tüm çekirdekler) | ~8-16 GB RAM | 2-4 saat |
| LSTM | GPU (A100/L40) | ~30-40 GB VRAM | 4-8 saat |
9. MEVCUT DURUM
| Bileşen | Durum | Notlar |
| Veri Seti | TAMAMLANDI | 233K satır × 203 özellik × 97 varlık |
| ML Final Veri Setleri | TAMAMLANDI | train/val/test bölümleri, toplam ~18 GB |
| HMM Verisi | TAMAMLANDI | 219 sayısal özellik, 137 MB |
| RF Verisi | TAMAMLANDI | 235 özellik, 212 MB |
| LSTM Verisi | TAMAMLANDI | 90 günlük diziler, 17.6 GB |
| HMM Eğitimi | BEKLİYOR | RunPod CPU'da çalıştırmaya hazır |
| RF Eğitimi | BEKLİYOR | RunPod CPU'da çalıştırmaya hazır |
| LSTM Eğitimi | BEKLİYOR | RunPod GPU'da çalıştırmaya hazır |
| Ensemble | BEKLİYOR | Bireysel modeller tamamlandıktan sonra |
10. SONRAKİ ADIMLAR
- 18 GB veri setini RunPod network volume'a yükle
- HMM eğit (CPU pod, ~2 saat)
- Random Forest eğit (CPU pod, ~4 saat)
- LSTM eğit (GPU pod A100/L40, ~6 saat)
- Sonuçları analiz et ve modelleri karşılaştır
- Ensemble oylama sistemi oluştur
- Bölüm 6 ile entegre et (Claude Opus 4.5 karar katmanı)
Bölüm 5 Durumu: DEVAM EDİYOR
Veri hazırlığı tamamlandı. Eğitim scriptleri hazır. RunPod altyapısında çalıştırılmayı bekliyor.
© 2026 Omega Arena