Event-Driven Representation Learning in Sparse Financial Time Series

Abstract

งานวิจัยนี้นำเสนอกรอบแนวคิดสำหรับการเรียนรู้ representation จากลำดับเหตุการณ์ที่กระจัดกระจาย (sparse event sequences) ในข้อมูลอนุกรมเวลาทางการเงิน โดยผสานเหตุการณ์ระดับสินทรัพย์ (asset-level events) และเหตุการณ์ระดับมหภาค (macro-level events) เข้าด้วยกันใน sequence เดียว เพื่อศึกษาความสัมพันธ์เชิงโครงสร้างระหว่างรูปแบบลำดับเหตุการณ์กับผลลัพธ์ทางราคา ภายใต้บริบทของยุคตลาด (macro regime) ที่แตกต่างกัน งานนี้มุ่งเน้นการวิจัยเชิงสำรวจ ไม่ใช่การสร้างระบบทำนายราคาเชิงปฏิบัติการ

I. Introduction & Problem Formulation

1.1 Motivation

พฤติกรรมของราคาหุ้นในตลาดการเงินไม่ได้เกิดจากตัวแปรรายตัวเพียงลำพัง แต่เป็นผลสะท้อนของ ลำดับเหตุการณ์ (event sequences) ที่กระจายตัวอย่างไม่สม่ำเสมอในเวลา เช่น

เหตุการณ์เชิงพื้นฐานของบริษัท
สัญญาณเชิงกลยุทธ์
ตัวบ่งชี้เชิงพฤติกรรมการซื้อขาย
เหตุการณ์เชิงมหภาค เช่น QE, QT, Crisis, Policy Shock

สมมุติฐานหลักของงานวิจัยนี้คือ:

แม้จะไม่สามารถทำนายทิศทางราคาหุ้นได้อย่างแม่นยำ แต่ บางลำดับของเหตุการณ์ (pattern accumulation) อาจสัมพันธ์กับแนวโน้มราคาที่เกิดขึ้นภายหลัง ภายใต้เงื่อนไขเชิงบริบท (macro regime) ที่เหมาะสม

เป้าหมายของงานวิจัย ไม่ใช่ทำนายราคาเชิงปฏิบัติการ แต่คือการตรวจสอบว่า รูปแบบเชิงโครงสร้างของเหตุการณ์ สามารถอธิบายความสัมพันธ์ระดับแนวโน้มในบางกรณีได้หรือไม่

1.2 Data Model & Notation

ให้ตลาดมีชุดสินทรัพย์

$$\mathcal{A} = \{a_1, a_2, \dots, a_M\}$$

สำหรับสินทรัพย์ใด ๆ $a \in \mathcal{A}$ เรานิยามชุดเหตุการณ์ในช่วงเวลา $[0,T]$ เป็นลำดับ

$$\mathcal{S}^a = \{(t_i^a, x_i^a)\}_{i=1}^{N_a}$$

โดยที่

$t_i^a \in \mathbb{R}^+$ = เวลาเกิดเหตุการณ์
$x_i^a$ = ตัวแทนเหตุการณ์ (event descriptor)
ลำดับไม่จำเป็นต้องมีคาบเวลาเท่ากัน (asynchronous / sparse)

เรานิยาม สองกลุ่มเหตุการณ์:

$$x_i^a \in \underbrace{\mathcal{X}_{asset}}_{\text{เหตุการณ์ระดับสินทรัพย์}} \cup \underbrace{\mathcal{X}_{macro}}_{\text{เหตุการณ์ระดับมหภาค}}$$

โดยเหตุการณ์ทุกกลุ่มถูกผสานให้อยู่ในลำดับเดียว และเรียงตามเวลา

$$t_1^a \le t_2^a \le \cdots \le t_{N_a}^a$$

1.3 Macro Events as Shared Tokens

ให้มีชุดเหตุการณ์มหภาค (เท่ากันทุกสินทรัพย์)

$$\mathcal{M} = \{(t_j^{macro}, m_j)\}_{j=1}^{K}$$

เมื่อสร้าง sequence สำหรับสินทรัพย์ $a$:

$$\tilde{\mathcal{S}}^a = \text{merge-sort}(\mathcal{S}^a, \mathcal{M})$$

นั่นคือ:

macro events จะ แทรกเข้าไปในลำดับเดียวกัน
แต่มี type identifier ต่างจาก asset events
ทำหน้าที่เป็น บริบทเชิงโครงสร้าง (context tokens)

สิ่งนี้ทำให้โมเดลเรียนรู้ความสัมพันธ์ระหว่าง ลำดับเหตุการณ์ระดับจุลภาค และ บริบทระดับมหภาค ใน sequence เดียว

1.4 Outcome Event Definition

เรานิยามฟังก์ชันสร้างผลลัพธ์จากราคาหุ้น

$$y^a = g(P^a(t))$$

ตัวอย่างเช่น

$$y^a = \begin{cases} 1, & \text{ถ้าผลตอบแทนในช่วง } [t,t+\Delta] \ge \tau_{up}\\ -1, & \text{ถ้าผลตอบแทนในช่วง } [t,t+\Delta] \le \tau_{down}\\ 0, & \text{อื่น ๆ} \end{cases}$$

ซึ่งหมายถึง:

ไม่ได้พยายามทำนายค่าราคา
แต่นิยาม เหตุการณ์ผลลัพธ์ (price-movement event) ที่เป็น discrete sparse signals

วัตถุประสงค์ของโมเดลคือ ไม่ใช่การทำนายทุกราคา แต่ตรวจสอบว่า บางลำดับเหตุการณ์ก่อนหน้า มีแนวโน้มสัมพันธ์กับ $y^a$ หรือไม่

1.5 Learning Objective

เรานิยามตัวแปลงเหตุการณ์เป็น embedding

$$e_i = f_{\theta}(x_i, \Delta t_i)$$

และตัวแบบลำดับ

$$h = F_{\Theta}(e_1,\dots,e_n)$$

จากนั้นโมเดลประมาณ

$$\hat{p}(y^a \mid \tilde{\mathcal{S}}^a)$$

เป้าหมายการฝึกคือการเรียนรู้ representation

$$\Theta^* = \arg\min_{\Theta} \mathcal{L}(y^a, \hat{p}(y^a \mid \tilde{\mathcal{S}}^a))$$

ภายใต้สมมุติฐานว่า pattern ที่แท้จริง ปรากฏเป็น interaction ระหว่าง micro-events และ macro-events มากกว่าตัวแปรเดี่ยว

1.6 Research Focus (ไม่ใช่ prediction system)

งานวิจัยนี้มุ่งเน้น

การหาว่า representation ที่เรียนรู้ แสดง "สัญญาณของ pattern เชิงเหตุการณ์" หรือไม่
ภายใต้ context ของยุคตลาด (macro regime)
ผ่านกรอบ Train-Global → Analyze-Per-Era

ไม่ใช่เพื่อสร้าง trading model โดยตรง แต่เพื่อสำรวจว่า ลำดับเหตุการณ์เชิงโครงสร้างมีคุณค่าทางสถิติหรือไม่