VII. Limitations & Future Work
Section นี้ยอมรับข้อจำกัดของ framework และร่างทิศทางสำหรับการวิจัยในอนาคต
7.1 ข้อจำกัดปัจจุบัน
Conceptual Framework เท่านั้น
บทความนี้นำเสนอ design framework ไม่ใช่ระบบที่ผ่านการทดสอบใน production สิ่งที่ยังไม่ทราบที่สำคัญรวมถึง:
- Approval rate จริงในทางปฏิบัติ
- ความแม่นยำของ gap detection ในโลกจริง
- Throughput ของ human reviewer
- คุณภาพ ontology ระยะยาว
ต้องการ experimental validation ด้วยข้อมูลจริง
การพึ่งพา LLM
Framework พึ่งพาความสามารถของ LLM อย่างมาก:
- Domain detection accuracy — การเลือก domain ผิดนำไปสู่ false gap
- Gap classification — การแยกแยะ true gap จาก error
- Proposal quality — การสร้าง type ที่เหมาะสมทาง semantic
- Consistency — LLM output อาจแตกต่างกันในแต่ละ run
เมื่อความสามารถของ LLM วิวัฒนาการ ประสิทธิภาพของ framework จะเปลี่ยนแปลง
Human Bottleneck
Human review ยังคงเป็น bottleneck ที่เป็นไปได้ หาก proposal generation เกินกว่า review capacity backlog จะเติบโต สิ่งนี้จำกัดความสามารถของ framework ในการจัดการ scenario ที่มีปริมาณสูงมาก
CORE Domain Scaling
CORE domain ที่ always-include ทำให้ slicing ง่ายขึ้นแต่อาจเป็นปัญหาหากโตใหญ่ขึ้น Design ปัจจุบันสมมติว่า CORE ยังคงเล็ก (5-10 element) อาจต้องการแนวทางทางเลือกสำหรับ core schema ที่ใหญ่กว่า
7.2 ทิศทางอนาคต
Learning from Feedback
Rejection feedback สามารถ train การสร้าง proposal ที่ปรับปรุงแล้ว:
Feedback collected:
"COOPERATES_WITH rejected as
duplicate of PARTNERS_WITH"
Future behavior:
When similar pattern detected,
suggest using PARTNERS_WITH
instead of proposing new type
สิ่งนี้สามารถปรับปรุง approval rate เมื่อเวลาผ่านไป
Auto-Merging Proposal
Pending proposal ที่คล้ายกันสามารถถูก merge โดยอัตโนมัติ:
PROP-042: Add ORGANIZATION
PROP-047: Add INTERNATIONAL_ORG
Similarity: 0.92
System suggests: Merge into single
proposal for human review
สิ่งนี้ลดภาระ review สำหรับ proposal ที่เทียบเท่ากันทาง semantic
Confidence-Based Routing
Confidence level ต่างกันสามารถได้รับการปฏิบัติที่แตกต่างกัน:
- High confidence (>90%) — Fast-track review queue
- Medium (70-90%) — Standard review
- Low (<70%) — Detailed expert review
สิ่งนี้ optimize การจัดสรรเวลาของ reviewer
Ontology Health Metric
Dashboard แสดงคุณภาพ ontology เมื่อเวลาผ่านไป:
- ความถี่การใช้งาน entity type
- Relationship coverage
- Gap ที่ตรวจพบต่อ domain
- Proposal approval rate
- Schema growth trajectory
สิ่งนี้จะช่วยระบุพื้นที่ที่ต้องการความสนใจ
Multi-Language Support
ขยาย framework เพื่อจัดการเอกสารในหลายภาษา พร้อม entity resolution ข้ามภาษาที่เหมาะสม
Restrictive Evolution
Focus ปัจจุบันคือ additive change งานในอนาคตสามารถจัดการ:
- Deprecate type ที่ไม่ได้ใช้
- Merge type ที่ซ้ำซ้อน
- Tighten constraint
สิ่งเหล่านี้ต้องการ consistency checking ที่ระมัดระวังมากขึ้น
7.3 Research Question
คำถามเปิดสำหรับการสืบสวนในอนาคต:
- Approval rate เท่าไหร่ที่บ่งชี้คุณภาพ proposal ที่ดี?
- Domain granularity ส่งผลต่อ gap detection อย่างไร?
- Rejection feedback สามารถปรับปรุง proposal ได้อย่างวัดได้หรือไม่?
- Human review batch size ที่เหมาะสมคืออะไร?
- LLM ต่างกันเปรียบเทียบกันอย่างไรสำหรับ task นี้?