Ontology in the Loop

A Framework for AI-Assisted Knowledge Graph Evolution

Niran Pravithana

VII. Limitations & Future Work

Section นี้ยอมรับข้อจำกัดของ framework และร่างทิศทางสำหรับการวิจัยในอนาคต

7.1 ข้อจำกัดปัจจุบัน

Conceptual Framework เท่านั้น

บทความนี้นำเสนอ design framework ไม่ใช่ระบบที่ผ่านการทดสอบใน production สิ่งที่ยังไม่ทราบที่สำคัญรวมถึง:

  • Approval rate จริงในทางปฏิบัติ
  • ความแม่นยำของ gap detection ในโลกจริง
  • Throughput ของ human reviewer
  • คุณภาพ ontology ระยะยาว

ต้องการ experimental validation ด้วยข้อมูลจริง

การพึ่งพา LLM

Framework พึ่งพาความสามารถของ LLM อย่างมาก:

  • Domain detection accuracy — การเลือก domain ผิดนำไปสู่ false gap
  • Gap classification — การแยกแยะ true gap จาก error
  • Proposal quality — การสร้าง type ที่เหมาะสมทาง semantic
  • Consistency — LLM output อาจแตกต่างกันในแต่ละ run

เมื่อความสามารถของ LLM วิวัฒนาการ ประสิทธิภาพของ framework จะเปลี่ยนแปลง

Human Bottleneck

Human review ยังคงเป็น bottleneck ที่เป็นไปได้ หาก proposal generation เกินกว่า review capacity backlog จะเติบโต สิ่งนี้จำกัดความสามารถของ framework ในการจัดการ scenario ที่มีปริมาณสูงมาก

CORE Domain Scaling

CORE domain ที่ always-include ทำให้ slicing ง่ายขึ้นแต่อาจเป็นปัญหาหากโตใหญ่ขึ้น Design ปัจจุบันสมมติว่า CORE ยังคงเล็ก (5-10 element) อาจต้องการแนวทางทางเลือกสำหรับ core schema ที่ใหญ่กว่า

7.2 ทิศทางอนาคต

Learning from Feedback

Rejection feedback สามารถ train การสร้าง proposal ที่ปรับปรุงแล้ว:

Feedback collected:
  "COOPERATES_WITH rejected as
   duplicate of PARTNERS_WITH"

Future behavior:
  When similar pattern detected,
  suggest using PARTNERS_WITH
  instead of proposing new type
      

สิ่งนี้สามารถปรับปรุง approval rate เมื่อเวลาผ่านไป

Auto-Merging Proposal

Pending proposal ที่คล้ายกันสามารถถูก merge โดยอัตโนมัติ:

PROP-042: Add ORGANIZATION
PROP-047: Add INTERNATIONAL_ORG

Similarity: 0.92

System suggests: Merge into single
proposal for human review
      

สิ่งนี้ลดภาระ review สำหรับ proposal ที่เทียบเท่ากันทาง semantic

Confidence-Based Routing

Confidence level ต่างกันสามารถได้รับการปฏิบัติที่แตกต่างกัน:

  • High confidence (>90%) — Fast-track review queue
  • Medium (70-90%) — Standard review
  • Low (<70%) — Detailed expert review

สิ่งนี้ optimize การจัดสรรเวลาของ reviewer

Ontology Health Metric

Dashboard แสดงคุณภาพ ontology เมื่อเวลาผ่านไป:

  • ความถี่การใช้งาน entity type
  • Relationship coverage
  • Gap ที่ตรวจพบต่อ domain
  • Proposal approval rate
  • Schema growth trajectory

สิ่งนี้จะช่วยระบุพื้นที่ที่ต้องการความสนใจ

Multi-Language Support

ขยาย framework เพื่อจัดการเอกสารในหลายภาษา พร้อม entity resolution ข้ามภาษาที่เหมาะสม

Restrictive Evolution

Focus ปัจจุบันคือ additive change งานในอนาคตสามารถจัดการ:

  • Deprecate type ที่ไม่ได้ใช้
  • Merge type ที่ซ้ำซ้อน
  • Tighten constraint

สิ่งเหล่านี้ต้องการ consistency checking ที่ระมัดระวังมากขึ้น

7.3 Research Question

คำถามเปิดสำหรับการสืบสวนในอนาคต:

  1. Approval rate เท่าไหร่ที่บ่งชี้คุณภาพ proposal ที่ดี?
  2. Domain granularity ส่งผลต่อ gap detection อย่างไร?
  3. Rejection feedback สามารถปรับปรุง proposal ได้อย่างวัดได้หรือไม่?
  4. Human review batch size ที่เหมาะสมคืออะไร?
  5. LLM ต่างกันเปรียบเทียบกันอย่างไรสำหรับ task นี้?