亞馬遜AWS曾在去年9月宣布,將OpenSearch開源搜索與分析套件項目轉交給Linux基金會旗下的OpenSearch軟件基金會,此舉標志著該項目正式進入社區(qū)開放主導治理的新階段。盡管項目的管理權發(fā)生了變動,但OpenSearch依然在GitHub平臺上得到精心維護,并繼續(xù)沿用Apache 2.0許可協(xié)議。
近日,OpenSearch項目迎來了其3.0版本的正式發(fā)布,這是自項目移交以來首個具有里程碑意義的版本更新。新版本在搜索性能、數(shù)據(jù)傳輸效率等多個方面實現(xiàn)了全面升級,并且引入了備受期待的“向量搜索”功能。
在性能優(yōu)化方面,OpenSearch 3.0版本的表現(xiàn)尤為亮眼。與2.19版本相比,新版本在多項查詢操作中的平均性能提升了20%;而與1.3版本相比,性能提升更是達到了驚人的9.5倍。這一顯著的性能提升得益于底層索引引擎的升級,即Apache Lucene 10的引入。新版本在向量字段索引、稀疏數(shù)據(jù)處理與壓縮機制等方面進行了優(yōu)化,從而大幅提升了查詢與存儲的效率。
除了性能提升外,OpenSearch 3.0版本還新增了“向量搜索”功能,這一功能此前一直處于實驗階段。現(xiàn)在,“派生向量(Derived Source)”機制已經(jīng)正式上線,它允許系統(tǒng)在不保存原始向量數(shù)據(jù)的情況下,在查詢時動態(tài)獲取向量值。這一機制不僅降低了存儲成本,還提升了冷啟動查詢的響應效率,查詢延遲最多可降低30倍,并且支持多種向量引擎。
OpenSearch 3.0版本還加入了GPU加速索引構建功能,該功能能夠顯著提升向量數(shù)據(jù)索引的構建速度,據(jù)稱速度提升超過9倍。這一功能特別適用于高頻率向量處理場景,為開發(fā)者提供了更加高效的處理手段。同時,新發(fā)布的Explain API也為開發(fā)者提供了深入了解向量查詢評分邏輯的機會,使他們能夠更準確地掌握相似度計算和排序的依據(jù)。