VI. Experimental Design, Dataset Construction & Reproducibility Framework
Section นี้ทำหน้าที่กำหนด มาตรฐานเชิงวิธีวิจัยของงานทั้งหมด ว่า
- ข้อมูลถูกเตรียมอย่างไร
- การสร้าง label และ event sequence ทำอย่างไร
- การแบ่งกลุ่มข้อมูลและช่วงเวลาออกแบบอย่างไร
- การทดลองดำเนินอย่างไรเพื่อให้ผลลัพธ์ ไม่เกิด bias และตรวจสอบซ้ำได้
กล่าวอย่างเป็นทางการ: Section นี้คือ "protocol ของงานวิจัย" ที่รับรองว่า ผลที่ได้มาจากโครงสร้างกระบวนการที่โปร่งใสและ reproducible ไม่ใช่ผลของการ tuning แบบ trial-and-error
6.1 Dataset Definition — Multi-Asset Event-Time Panel
ให้มีชุดสินทรัพย์
และช่วงข้อมูล
สำหรับสินทรัพย์ $a$ ชุดเหตุการณ์แบบรวม (จาก Section 2):
พร้อมราคาเวลาไม่ต่อเนื่อง
ชุดข้อมูลรวมทั้งระบบ
กล่าวเชิงโครงสร้าง:
- เป็น panel data แบบ event-time
- ไม่ได้อิง sampling เป็นระยะเท่ากัน
- เน้นโครงสร้าง "เหตุการณ์ → ลำดับ → outcome"
6.2 Event Construction Protocol (Asset & Macro Levels)
6.2.1 Asset-Level Event Extraction
เหตุการณ์มาจากฟีเจอร์ต่างชนิด เช่น
- Boolean condition triggers
- factor-state transitions
- indicator crossing events
- structural / fundamental signals
นิยามตัวสร้างเหตุการณ์
ข้อกำหนด:
- เหตุการณ์ต้องเกิดจากข้อมูล ที่ทราบ ณ เวลานั้นจริง
- ห้ามใช้ข้อมูลที่มีการ back-fill
- ต้องเก็บ timestamp ก่อน outcome อย่างเคร่งครัด
6.2.2 Macro-Level Event Definition
ชุด macro event:
ต้องถูกนิยามตามเกณฑ์ ex-ante observable rule เช่น
- วันที่เริ่ม QE ตามประกาศจริง
- วันที่อัตราดอกเบี้ยเปลี่ยน
- วันที่ shock ถูกบันทึกใน public source
ไม่อนุญาตให้กำหนดแบบ hindsight เช่น "มองย้อนหลังแล้วถือว่าช่วงนี้คือ crisis"
จึงต้องระบุชุดแหล่งข้อมูลประกาศจริง และ freeze definitions ก่อนเริ่ม training
6.2.3 Unified Event Merge Procedure
กระบวนการรวม sequence (สำหรับสินทรัพย์ $a$):
และบังคับ invariants:
- เวลาไม่ถอยหลัง $t_1^a \le t_2^a \le \dots$
- macro events เหมือนกันทุกสินทรัพย์
- ไม่มีการสร้าง event ย้อนหลัง
6.3 Outcome Label Construction
ให้ผลตอบแทนช่วงอนาคต
นิยามฟังก์ชัน outcome
ตัวอย่าง threshold-based:
ข้อกำหนด สำคัญ:
- $y_t^a$ ต้องใช้เฉพาะราคาในช่วง $[t, t+\Delta]$
- ห้ามใช้ median / forward fill ข้ามอนาคต
- กำหนด $\tau$ และ $\Delta$ ก่อนเริ่มทดลอง และ ล็อกค่า
6.4 Causal-Safe Training Window Construction
สำหรับแต่ละ sample เวลา $t$
กล่าวคือ
ห้ามสร้าง window แบบ rolling retrospective ที่กินอนาคต
6.5 Temporal Splitting & Forward Evaluation Protocol
เพื่อคง time-causal validity แบ่งเป็น
- train
- validation
- test
โดย
และทดลองแบบ rolling-forward:
ช่วยให้:
- ตรวจสอบ performance stability ตามเวลา
- ลดความเสี่ยงเลือกช่วงที่ bias
6.6 Experimental Arms (What We Compare Against)
เพื่อให้ผลวิจัยมีความหมาย ต้องมี baseline ที่เปรียบเทียบได้
6.6.1 Baseline Models
- Random / Majority baseline
- Logistic regression บน aggregated features
- GRU / LSTM (no macro tokens)
- Transformer without macro tokens
- Transformer with macro tokens (proposed)
เป้าหมาย: ไม่ใช่เพื่อชนะ baseline แต่เพื่อพิสูจน์ว่าการใส่ "ลำดับเหตุการณ์ + macro context" มีมูลค่าทางข้อมูลเชิงโครงสร้าง
6.7 Hyperparameter Governance (Pre-Analysis Rule)
เพื่อหลีกเลี่ยง tuning-bias ตั้งค่าเป็น pre-registered ranges
ตัวอย่าง:
การเลือก final model:
- ใช้ validation ที่แบ่งตามเวลา
- ไม่อนุญาต retro-selection จาก test set
6.8 Reproducibility Requirements
งานวิจัยจะถือว่า reproducible เมื่อมี:
- Versioned dataset recipe (ไม่จำเป็นต้องเปิดข้อมูลดิบ แต่ต้องเปิดสูตรสร้าง)
- Config-locked experiment files เช่น YAML / JSON
- บันทึก commit hash, random seed, hyperparameters, training log
- ฟังก์ชันตรวจสอบความสอดคล้อง เช่น
เพื่อยืนยันว่า sequence ไม่เปลี่ยนระหว่างรัน
6.9 Error & Risk Audit — What Can Go Wrong
เพื่อความโปร่งใส ต้องประเมินความเสี่ยงที่อาจเกิด เช่น
- regime mis-labeling
- survivorship bias ของ universe หุ้น
- corporate action causing price jumps
- missing-event distortion
- redundancy of correlated events
ทุกข้อควรถูกบันทึกใน risk appendix
6.10 Interpretation Scope & Ethical Boundary
เอกสารกำหนดว่า
- ผลลัพธ์ใช้เพื่อ การวิจัยเชิงโครงสร้าง
- ไม่ตีความเป็นเครื่องมือคาดการณ์กำไร
- ไม่อ้าง causal claim โดยตรง
- เป็นการศึกษาเชิง pattern-relation เท่านั้น
6.11 Connection to Final Sections
เมื่อ Section 6 วางรากฐานด้าน dataset, experiment protocol, reproducibility
Section ถัดไปจะมุ่งสู่ Limitations, Extensions & Future Research Directions (ขอบเขตจำกัดของงาน, กรอบขยาย, และทิศทางวิจัยต่อยอด)