V. Regime-Conditioned Analysis & Post-Training Diagnostics
Section นี้ไม่ใช่ขั้นตอน training แต่เป็นส่วนสำคัญของ กระบวนการวิจัย ซึ่งตอบคำถามหลักของงานว่า
หลังจากฝึกโมเดลด้วยข้อมูลทุกยุคแล้ว รูปแบบ (pattern) ที่โมเดลเรียนรู้ มี "ความสัมพันธ์เชิงลำดับเหตุการณ์กับ outcome" จริงหรือไม่ และรูปแบบนั้น คงอยู่ข้ามยุค หรือ เฉพาะบางยุค?
ด้วยเหตุนี้ Section นี้จึงทำหน้าที่:
- นิยามวิธีตรวจสอบ representation หลังการฝึก
- วิเคราะห์แพตเทิร์นในระดับ ลำดับเหตุการณ์, ฟีเจอร์, macro context
- ทดสอบความเสถียรของ pattern ตามช่วงเวลา
- แยกสัญญาณจริงออกจาก noise หรือ overfitting
5.1 Regime Partition & Era-Specific Evaluation Framework
ให้ชุดช่วงเวลาที่แบ่งตามยุคตลาด (macro regime)
โดยแต่ละ $R_\ell$ เป็นช่วงเวลาไม่ทับซ้อนกัน
และครอบคลุมช่วงข้อมูล
หลังฝึกโมเดลแล้ว เราประเมินการกระทำของโมเดลแยกตามยุค
ให้ representation ระดับลำดับของสินทรัพย์ $a$ ณ เวลา $t$
ให้ชุดเหตุการณ์ที่อยู่ในยุค $R_\ell$
เราคำนวณ performance function
โดย $\mathcal{M}$ อาจเป็น
- AUROC
- Brier score
- log-loss เฉพาะเหตุการณ์หายาก
- or outcome-conditional metric
ความคิดหลักคือ เราไม่ได้วัด "ความแม่นยำทั่วตลาด" แต่ดูว่าพฤติกรรม pattern เสถียรหรือเปลี่ยนไปตามยุคตลาด
5.2 Cross-Era Stability of Learned Patterns
เพื่อทดสอบว่า pattern ใด "เป็นสากลข้ามยุค" เรานิยามการฉาย representation ไปสู่ latent subspace
ให้ projection function
เราวิเคราะห์การกระจายของ representation ระหว่างยุคต่าง ๆ
เช่น วัด distributional distance
หรือ KL-divergence เชิง density estimation
ความหมายเชิงวิจัย:
- ถ้า $D$ ต่ำ → pattern representation "คงตัวข้ามยุค"
- ถ้า $D$ สูง → pattern นั้น "ขึ้นกับ regime อย่างเฉพาะเจาะจง"
กรณีหลังมีความหมายว่า pattern ที่ดูมีนัยในบางช่วง อาจเป็นผลของโครงสร้างตลาดเฉพาะยุค ไม่ใช่รูปแบบเชิงสากล
5.3 Event-Level Attribution via Attention-Weight Analysis
จาก Section 3 ให้ attention weight ระหว่าง event $i$ และ $j$
เรานิยาม event saliency score
และเฉลี่ยตามยุค
ความหมาย: วัดว่า เหตุการณ์ชนิด $x$ มีบทบาทต่อ pattern แค่ไหนในแต่ละยุค
ทำให้สามารถตรวจสอบได้ว่า
- ฟีเจอร์บางตัวสำคัญเฉพาะ QE regime
- บางตัวสำคัญเฉพาะ crisis regime
- หรือบางตัวสำคัญสม่ำเสมอทุกยุค
ซึ่งช่วยตอบโจทย์เชิงสมมุติฐาน pattern accumulation มีลักษณะ context-dependent หรือไม่
5.4 Macro-Token Interaction Analysis
เพื่อดูว่าฟีเจอร์ micro-event กำลัง "ทำงานภายใต้ macro context ใด"
เรานิยาม conditional attention weight
และนิยาม context-coupling score
ความหมาย: วัดระดับที่ "เหตุการณ์ฟีเจอร์ $x$" เชื่อมโยงกับ macro event $m$
ตัวอย่างการตีความ:
- Feature-A มี coupling สูงกับ QE-START
- แต่ coupling ต่ำมากกับ QT-PHASE
- แปลว่า pattern เดียวกัน อาจ "ทำงาน" ภายใต้ QE แต่ "ไร้ความหมาย" ภายใต้ QT
นี่คือการตรวจสอบเชิงสาเหตุเชิงบริบท (contextual causality-like behavior) โดยไม่อ้าง causal claim โดยตรง
5.5 Outcome-Conditional Pattern Profiling
เพื่อดูว่าลำดับเหตุการณ์ชนิดใด ปรากฏก่อน outcome บางแบบบ่อยเป็นพิเศษ
เรานิยาม neighborhood representation
และเรียนรู้ centroid
พร้อมวัด similarity
ถ้า representation ก่อนเหตุการณ์ "ขาขึ้น" มีการรวมกลุ่มแน่น (low intra-cluster variance) ในบางยุค
แปลว่า มีรูปแบบเชิงลำดับที่ปรากฏซ้ำก่อนผลลัพธ์แบบนั้น
แต่หาก variance สูงมาก → ไม่มี evidence ว่ามี pattern ที่เสถียร
5.6 Per-Era Counterfactual-Style Consistency Check
เราต้องแยกกรณี
- "โมเดลเก่งเฉพาะยุคนั้นเพราะ overfit"
- vs "pattern จริง ๆ ทำงานเฉพาะยุคนั้น"
จึงสร้าง cross-era evaluation
ให้ representation จากยุค $R_i$
และทดสอบบน distribution ของยุค $R_j$ โดยตรึงพารามิเตอร์โมเดล
ความหมาย: ถ้า pattern จากยุค $R_i$ ล้มเหลว ในยุค $R_j$ → บ่งชี้ว่า pattern เป็น regime-local phenomenon
ซึ่งสอดคล้องสมมุติฐานว่า บาง pattern อาจเกิดจากภาวะตลาดที่ไม่ยั่งยืน
5.7 Noise-Hypothesis Baseline Tests
เพื่อคัดกรอง pattern เทียม เราทำ baseline ต่อไปนี้:
(1) Sequence Shuffle Test
สับตำแหน่งเหตุการณ์
ถ้า performance แทบไม่ลดลง → แปลว่าโมเดลไม่ได้ใช้ "ลำดับเหตุการณ์จริง" = pattern ไม่จริงเชิงโครงสร้าง
(2) Macro-Masking Test
ลบ macro tokens ชั่วคราว
แล้ววัด
ถ้า $\Delta\Pi \approx 0$ → macro context ไม่ได้มีส่วนร่วมจริง
(3) Random Feature Injection Test
สุ่มเหตุการณ์เทียม
แล้วตรวจว่าถูกตีความเป็น pattern หรือไม่
ถ้าใช่ → โมเดล over-sensitive ต่อ noise
5.8 Interpretability for Engineering Integration
ทีมวิจัย/วิศวกรสามารถสกัดผลลัพธ์ในรูป:
- per-era attention heatmap
- feature-saliency timeline
- macro-interaction graph
- regime-cluster trajectories
ผลเหล่านี้ช่วย
- ใช้เป็นข้อมูลต่อยอด feature engineering
- วางกรอบ hypothesis ใหม่ในเฟสถัดไป
- ตรวจสอบความสมเหตุสมผลก่อนนำไปใช้จริง
5.9 หลักการสรุปผลเชิงวิจัย (Research Interpretation Protocol)
ผลลัพธ์จะถือว่ามี คุณค่าทางวิจัย หาก
- มี pattern ที่สัมพันธ์กับ outcome อย่างมีนัย
- pattern นั้น คงตัวบางส่วนข้ามยุค หรือ แสดงความสัมพันธ์เฉพาะยุคอย่างสอดคล้องกับ macro logic
- ไม่เกิดเฉพาะกรณี noise baseline
- ไม่ขึ้นกับ feature เดี่ยว แต่เกิดจาก ลำดับเหตุการณ์ร่วม
กล่าวอีกแบบ: งานนี้ไม่ได้พยายามพิสูจน์ว่า "ทำนายราคาได้" แต่พิสูจน์ว่า โครงสร้างเชิงเหตุการณ์ของตลาด มีความสัมพันธ์เชิงสถิติที่ไม่ใช่สุ่ม
5.10 จุดเชื่อมไป Section ถัดไป
Section นี้สรุป วิธี "อ่านค่าความหมาย" จากโมเดลหลังการฝึก ใน Section ถัดไปเราจะไปสู่: Experimental Design, Dataset Construction & Reproducibility Framework
ซึ่งจะอธิบาย
- วิธีเตรียมข้อมูลเชิงระบบ
- วิธีออกแบบ experiment ให้ตรวจสอบได้
- มาตรฐาน reproducibility สำหรับงานนี้