LanceDB คืออะไร? ฐานข้อมูลสำหรับยุค AI ที่เข้าใจ “ความหมาย” ของข้อมูล

 


LanceDB คืออะไร

LanceDB คือฐานข้อมูลประเภท multimodal lakehouse สำหรับ AI การจัดการเป็นแบบ Vector Database ที่ถูกออกแบบมาเพื่อจัดเก็บและค้นหาข้อมูลในรูปแบบเวกเตอร์ ซึ่งเป็นตัวแทนเชิงตัวเลขของข้อมูล เช่น ข้อความ รูปภาพ หรือเสียง โดยเน้นการค้นหาแบบ Semantic Search หรือการค้นหาตาม “ความหมาย” แทนการค้นหาตามคำ (Keyword Search) แบบเดิม


หลักการทำงาน LanceDB

1. แปลงข้อมูลเป็นเวกเตอร์ (Embedding)
2. จัดเก็บใน LanceDB
3. ค้นหาด้วยความคล้าย (Similarity Search)




ข้อมูลทางเทคนิด LanceDB 

Percentile Vector Search Vector Search w. Filtering     Full-Text Search
P50                         25ms                     30ms                             26ms
P90                         26ms                     39ms                             37ms
P99                         35ms                     50ms                             42ms


Name                                 # Vectors             Vector Dimension
dbpedia-entities-openai-1M 1,000,000             1536
synthetic dataset                 15,000,000             256


ความคิดเห็น