Araştırmaya Dön

REJİM TESPİTİ

Bölüm 5: Boğa, Ayı veya Yatay — Modeller Karar Versin

Omega Arena • Şubat 2026 • DEVAM EDİYOR

VARLIK

233K

SATIR

203

ÖZELLİK

MODEL

Özet. Bölüm 4'te fiyat yönünü tahmin eden modeller eğitildi. Burada farklı bir yaklaşım benimsiyoruz: rejim tespiti. "Yarın fiyat yükselecek mi?" yerine "ne tür bir piyasadayız?" diye soruyoruz. Üç model—HMM (denetimsiz), Random Forest (denetimli) ve Attention'lı BiLSTM—piyasa koşullarını Boğa, Ayı veya Yatay olarak sınıflandırmak için birlikte çalışıyor. %100 hindsight-doğru etiketler ve 203 özellik ile bu modeller mükemmel tarihsel gerçekten öğreniyor.

İÇİNDEKİLER

1. Neden Rejim Tespiti? 2. Veri Seti: Kurumsal Düzey 3. Etiketler: %100 Hindsight 4. Model 1: HMM 5. Model 2: Random Forest 6. Model 3: LSTM + Attention 7. Veri Pipeline: 10 Kontrol 8. Altyapı 9. Mevcut Durum 10. Sonraki Adımlar

1. NEDEN REJİM TESPİTİ?

Bölüm 4'ün fiyat tahmin modelleri 0.52-0.57 civarında AUC skorları elde etti. Rastgeleden iyi, ama mütevazı. Sorun? Piyasalar farklı koşullarda farklı davranır.

Boğa piyasasında işe yarayan bir strateji, ayı piyasasında felaket olabilir. Yükseliş trendinde "düşüşü satın al" anlamına gelen sinyal, düşüş trendinde "düşen bıçağı yakala" anlamına gelir.

Rejim tespiti bağlam sağlar. Tek bir modelin her şeyi tahmin etmeye çalışması yerine, önce piyasa durumunu belirleyen özel modeller var. Sonra diğer modeller davranışlarını buna göre uyarlayabilir.

Üç Rejim

Rejim	Günlük Etiket	Haftalık/Aylık Etiket	Tanım
BOĞA	YUKARI	BOĞA	Pozitif % değişim
AYI	AŞAĞI	AYI	Negatif % değişim
YATAY	AYNI	YATAY	Sıfır % değişim

2. VERİ SETİ: KURUMSAL DÜZEY

Kestirmeden gitmedik. Bu veri seti aylarca süren veri mühendisliğini temsil ediyor.

Veri Kaynakları

Kaynak	Özellik	Açıklama
Level 1	43	RSI, MACD, Bollinger Bands, ATR, ADX, Ichimoku, vb.
Level 2	18	Sharpe, Sortino, VaR, CVaR, Max Drawdown, vb.
Level 3	52	Volatilite rejimleri, trend gücü, korku/açgözlülük, tükenme
Level 5	19	VIX, DXY, SPY korelasyonu, makro sinyaller
Level 6	21	COT verileri, verim eğrisi, kredi spread'leri
Level 7	15	Bağlam-duyarlı: ATH %, 52-hafta aralığı, halving döngüsü
FRED	13	Federal Reserve ekonomik göstergeleri
TOPLAM	203	İşleme sonrası: 235 (one-hot encoding ile)

Temporal Bölüm

Bölüm	Tarih Aralığı	Satır	Amaç
Eğitim	2014-09-17 → 2023-12-31	163,574	Model öğrenimi
Doğrulama	2024-01-01 → 2024-12-31	34,402	Hiperparametre ayarı
Test	2025-01-01 → 2026-01-26	35,531	Final değerlendirme

Veri sızıntısı yok. Katı temporal sıralama, modellerin eğitim sırasında gelecek verileri asla görmemesini sağlar. Test verisi gerçekten görülmemiş—modellerin hiç karşılaşmadığı bir yıldan.

Neden Level 7 Bağlam Özellikleri?

Standart teknik göstergeler (Level 1-3) kısa vadeli kalıpları yakalar: RSI, MACD, Bollinger Bands 14-50 günlük pencerelerde çalışır. Ancak rejim tespiti uzun vadeli bağlam gerektirir. $50K'daki fiyat, tüm zamanların en yükseği olduğunda ve ATH'nin %50 altında olduğunda tamamen farklı şeyler ifade eder.

Problem: Mevcut özellikler "Büyük resimde neredeyiz?" gibi soruları cevaplayamıyordu. Level 7, rejim sınıflandırması için bu eksik bağlamı sağlamak üzere özel olarak tasarlandı.

Özellik Kategorisi	Neyi Yakalar	Rejimler İçin Neden Önemli
ATH Bağlamı	Tüm zamanların en yükseğinden uzaklık, ATH'den bu yana gün	Boğa piyasaları ATH'leri iter; ayı piyasaları onlardan uzaklaşır
52-Hafta Aralığı	Yıllık en yüksek/en düşük aralığındaki konum	Yıllık diplere yakın = olası birikim; zirvelere yakın = olası dağıtım
Dönem Getirileri	YTD getiri, yıllık getiri, çoklu dönem momentum	Rejim kalıcılığı: boğa yılları boğa kalır, ayı yılları ayı kalır
Mevsimsellik	Haftanın günü, ay, çeyrek, çeyrek sonu bayrakları	Tarihsel kalıplar: "Mayıs'ta sat", Q4 rallileri, hafta sonu etkileri
Halving Döngüsü	Bitcoin halving'inden bu yana/halving'e gün, döngü konumu %	Kripto-spesifik: halving'ler tarihsel olarak boğa piyasası başlangıçlarıyla ilişkili

Level 7 olmadan, modeller tamamen farklı piyasa bağlamlarında aynı özellik kalıplarını görürdü. Level 7 ile, ATH'deki -%5 günlük düşüş, yıllık diplerdeki -%5 düşüşten farklı görünür—çünkü gerçekten farklıdır.

3. ETİKETLER: %100 HİNDSİGHT DOĞRULUĞU

Bu, rejim tespitini fiyat tahmininden farklı kılan temel içgörüdür.

Biz zaman yolcularıyız. Tarihsel verileri etiketlerken, tam olarak ne olduğunu biliyoruz. Fiyat yükseldiyse, YUKARI. Düştüyse, AŞAĞI. Eşik yok. Tahmin yok. Modelin görevi, hangi özellik kalıplarının hangi sonuçlara karşılık geldiğini öğrenmek.

Etiket Dağılımı (Eğitim Seti)

Etiket Türü	YUKARI/BOĞA	AŞAĞI/AYI	AYNI/YATAY
Günlük Yön	~%50	~%49	~%1
Haftalık Rejim	~%51	~%48	~%1
Aylık Rejim	~%52	~%47	~%1

4. MODEL 1: HIDDEN MARKOV MODEL (HMM)

Denetimsiz öğrenme. HMM etiketlerimizi görmez. Gizli durumları tamamen özellik kalıplarından keşfeder.

Neden HMM?

Doğal rejim geçişi: Piyasalar durumlar arasında geçiş yapar—HMM bunu açıkça modelliyor
Etiket önyargısı yok: Etiketlemeyi düşünmediğimiz kalıpları keşfeder
Yorumlanabilir: Her durumun net istatistiksel özellikleri var

Konfigürasyon

Parametre	Değer	Sebep
Özellikler	219 (sadece sayısal)	HMM sürekli özellikler gerektirir
Denenecek durumlar	2, 3, 4, 5	BIC ile optimal sayıyı bul
Kovaryans	Diagonal	Çok özellikle sayısal stabilite
İterasyonlar	300	Yakınsama sağla
Başlatmalar	10	Yerel minimumdan kaçın

HMM Durumu

Adım	Durum
Veri hazırlığı	TAMAMLANDI
Eğitim scripti	TAMAMLANDI
Eğitim çalıştırma	BEKLİYOR
Durum analizi	BEKLİYOR

5. MODEL 2: RANDOM FOREST

Denetimli öğrenme. Random Forest hindsight-doğru etiketlerimizi görür ve bunları özelliklerden tahmin etmeyi öğrenir.

Neden Random Forest?

Tabular veriyi mükemmel işler: Yapılandırılmış veri için altın standart
Özellik önemi: Hangi metriklerin en önemli olduğunu söyler
Gürültüye dayanıklı: Ağaç topluluğu hataları ortalar
Ölçekleme gerektirmez: Ağaç tabanlı modeller normalize veri gerektirmez

Konfigürasyon

Parametre	Arama Aralığı
n_estimators	500 - 1,250
max_depth	15 - 35, None
min_samples_split	2 - 15
min_samples_leaf	1 - 6
max_features	sqrt, log2, 0.3, 0.5
class_weight	balanced, balanced_subsample

Eğitim Yaklaşımı

RandomizedSearchCV: 100 hiperparametre kombinasyonu
5-katlı çapraz doğrulama: Sağlam performans tahmini
Puanlama metriği: F1-macro (sınıflar arasında dengeli)
Üç ayrı model: Günlük, Haftalık, Aylık tahminler

Random Forest Durumu

Adım	Durum
Veri hazırlığı	TAMAMLANDI
Eğitim scripti	TAMAMLANDI
Eğitim çalıştırma	BEKLİYOR
Özellik önemi analizi	BEKLİYOR

6. MODEL 3: BİDİRECTİONAL LSTM + ATTENTİON

Diziler için derin öğrenme. LSTM 90 ardışık günü işler ve sonraki günün rejimini tahmin eder.

Neden Attention'lı LSTM?

Dizi modelleme: 90 gün boyunca temporal kalıpları öğrenir
Bidirectional: Dizileri ileri ve geri okur
Attention mekanizması: Dizideki hangi günlerin en önemli olduğunu öğrenir
Çok görevli: Tek model günlük, haftalık VE aylık aynı anda tahmin eder

Mimari

Bileşen	Konfigürasyon
Girdi	(batch, 90 gün, 235 özellik)
LayerNorm	Girdileri normalize et
BiLSTM	3 katman, hidden_size=256
Attention	Önemli zaman adımlarını öğren
Paylaşılan Dense	256 → 128 dropout ile
Çıktı Başlıkları	3 ayrı başlık (günlük/haftalık/aylık)

Eğitim Konfigürasyonu

Parametre	Değer
Dizi uzunluğu	90 gün
Batch boyutu	128
Epoch	150 (erken durdurma ile)
Öğrenme oranı	1e-3
Dropout	0.3
Erken durdurma sabrı	20 epoch
Optimizer	AdamW weight decay ile
Scheduler	ReduceLROnPlateau
Sınıf ağırlıklandırma	Ters frekans

LSTM Verileri

Bölüm	Diziler	Şekil	Boyut
Eğitim	154,844	(154K, 90, 235)	13.1 GB
Doğrulama	25,942	(26K, 90, 235)	2.2 GB
Test	27,020	(27K, 90, 235)	2.3 GB

LSTM Durumu

Adım	Durum
Veri hazırlığı (90 günlük diziler)	TAMAMLANDI
Model mimarisi	TAMAMLANDI
Eğitim scripti	TAMAMLANDI
Eğitim çalıştırma (GPU)	BEKLİYOR

7. VERİ PAYPLİNE: 10 DOĞRULAMA KONTROLÜ

Kurumsal düzey veri hazırlığı her şeyi birden fazla kez doğrulamak demektir.

#	Kontrol	Sonuç
1	DB sütunları veri setiyle eşleşiyor	✓ GEÇTİ
2	Tüm tablo özellikleri mevcut	✓ GEÇTİ
3	Örnek veri DB ile eşleşiyor	✓ GEÇTİ
4	Satır sayıları eşleşiyor	✓ GEÇTİ
5	Boş sütun yok	✓ GEÇTİ
6	Veri tipleri doğru	✓ GEÇTİ
7	Duplicate yok, fiyat bütünlüğü	✓ GEÇTİ
8	Tarih sürekliliği	✓ GEÇTİ
9	Rastgele örnek çapraz doğrulama	✓ GEÇTİ
10	Etiket tutarlılığı (işaret = yön)	✓ GEÇTİ

10/10 kontrol geçti. Veri seti doğrulandı, temizlendi ve eğitime hazır.

8. ALTYAPI

Eğitim önemli hesaplama kaynakları gerektiriyor.

Model	Hesaplama	Bellek	Tahmini Süre
HMM	CPU	~4 GB RAM	1-2 saat
Random Forest	CPU (tüm çekirdekler)	~8-16 GB RAM	2-4 saat
LSTM	GPU (A100/L40)	~30-40 GB VRAM	4-8 saat

9. MEVCUT DURUM

Bileşen	Durum	Notlar
Veri Seti	TAMAMLANDI	233K satır × 203 özellik × 97 varlık
ML Final Veri Setleri	TAMAMLANDI	train/val/test bölümleri, toplam ~18 GB
HMM Verisi	TAMAMLANDI	219 sayısal özellik, 137 MB
RF Verisi	TAMAMLANDI	235 özellik, 212 MB
LSTM Verisi	TAMAMLANDI	90 günlük diziler, 17.6 GB
HMM Eğitimi	BEKLİYOR	RunPod CPU'da çalıştırmaya hazır
RF Eğitimi	BEKLİYOR	RunPod CPU'da çalıştırmaya hazır
LSTM Eğitimi	BEKLİYOR	RunPod GPU'da çalıştırmaya hazır
Ensemble	BEKLİYOR	Bireysel modeller tamamlandıktan sonra

10. SONRAKİ ADIMLAR

18 GB veri setini RunPod network volume'a yükle
HMM eğit (CPU pod, ~2 saat)
Random Forest eğit (CPU pod, ~4 saat)
LSTM eğit (GPU pod A100/L40, ~6 saat)
Sonuçları analiz et ve modelleri karşılaştır
Ensemble oylama sistemi oluştur
Bölüm 6 ile entegre et (Claude Opus 4.5 karar katmanı)

Bölüm 5 Durumu: DEVAM EDİYOR
Veri hazırlığı tamamlandı. Eğitim scriptleri hazır. RunPod altyapısında çalıştırılmayı bekliyor.