VII. Limitations & Future Work

Section นี้ยอมรับข้อจำกัดของ framework และร่างทิศทางสำหรับการวิจัยในอนาคต

7.1 ข้อจำกัดปัจจุบัน

Conceptual Framework เท่านั้น

บทความนี้นำเสนอ design framework ไม่ใช่ระบบที่ผ่านการทดสอบใน production สิ่งที่ยังไม่ทราบที่สำคัญรวมถึง:

Approval rate จริงในทางปฏิบัติ
ความแม่นยำของ gap detection ในโลกจริง
Throughput ของ human reviewer
คุณภาพ ontology ระยะยาว

ต้องการ experimental validation ด้วยข้อมูลจริง

การพึ่งพา LLM

Framework พึ่งพาความสามารถของ LLM อย่างมาก:

Domain detection accuracy — การเลือก domain ผิดนำไปสู่ false gap
Gap classification — การแยกแยะ true gap จาก error
Proposal quality — การสร้าง type ที่เหมาะสมทาง semantic
Consistency — LLM output อาจแตกต่างกันในแต่ละ run

เมื่อความสามารถของ LLM วิวัฒนาการ ประสิทธิภาพของ framework จะเปลี่ยนแปลง

Human Bottleneck

Human review ยังคงเป็น bottleneck ที่เป็นไปได้ หาก proposal generation เกินกว่า review capacity backlog จะเติบโต สิ่งนี้จำกัดความสามารถของ framework ในการจัดการ scenario ที่มีปริมาณสูงมาก

CORE Domain Scaling

CORE domain ที่ always-include ทำให้ slicing ง่ายขึ้นแต่อาจเป็นปัญหาหากโตใหญ่ขึ้น Design ปัจจุบันสมมติว่า CORE ยังคงเล็ก (5-10 element) อาจต้องการแนวทางทางเลือกสำหรับ core schema ที่ใหญ่กว่า

7.2 ทิศทางอนาคต

Learning from Feedback

Rejection feedback สามารถ train การสร้าง proposal ที่ปรับปรุงแล้ว:

Feedback collected:
  "COOPERATES_WITH rejected as
   duplicate of PARTNERS_WITH"

Future behavior:
  When similar pattern detected,
  suggest using PARTNERS_WITH
  instead of proposing new type

สิ่งนี้สามารถปรับปรุง approval rate เมื่อเวลาผ่านไป

Auto-Merging Proposal

Pending proposal ที่คล้ายกันสามารถถูก merge โดยอัตโนมัติ:

PROP-042: Add ORGANIZATION
PROP-047: Add INTERNATIONAL_ORG

Similarity: 0.92

System suggests: Merge into single
proposal for human review

สิ่งนี้ลดภาระ review สำหรับ proposal ที่เทียบเท่ากันทาง semantic

Confidence-Based Routing

Confidence level ต่างกันสามารถได้รับการปฏิบัติที่แตกต่างกัน:

High confidence (>90%) — Fast-track review queue
Medium (70-90%) — Standard review
Low (<70%) — Detailed expert review

สิ่งนี้ optimize การจัดสรรเวลาของ reviewer

Ontology Health Metric

Dashboard แสดงคุณภาพ ontology เมื่อเวลาผ่านไป:

ความถี่การใช้งาน entity type
Relationship coverage
Gap ที่ตรวจพบต่อ domain
Proposal approval rate
Schema growth trajectory

สิ่งนี้จะช่วยระบุพื้นที่ที่ต้องการความสนใจ

Multi-Language Support

ขยาย framework เพื่อจัดการเอกสารในหลายภาษา พร้อม entity resolution ข้ามภาษาที่เหมาะสม

Restrictive Evolution

Focus ปัจจุบันคือ additive change งานในอนาคตสามารถจัดการ:

Deprecate type ที่ไม่ได้ใช้
Merge type ที่ซ้ำซ้อน
Tighten constraint

สิ่งเหล่านี้ต้องการ consistency checking ที่ระมัดระวังมากขึ้น

7.3 Research Question

คำถามเปิดสำหรับการสืบสวนในอนาคต:

Approval rate เท่าไหร่ที่บ่งชี้คุณภาพ proposal ที่ดี?
Domain granularity ส่งผลต่อ gap detection อย่างไร?
Rejection feedback สามารถปรับปรุง proposal ได้อย่างวัดได้หรือไม่?
Human review batch size ที่เหมาะสมคืออะไร?
LLM ต่างกันเปรียบเทียบกันอย่างไรสำหรับ task นี้?