Durch
Markus Lukasson
Diesen Beitrag teilen
.jpg)
Die Embedding-Modelle von nyris belegen den ersten Platz in sämtlichen Benchmark-Datensätzen für visuelle Produktsuche und Teileidentifikation. Sie übertreffen Modelle von Google, Meta, Cohere, Jina AI und Nomic AI, von der Ersatzteilsuche bis zur Produkterkennung. Und das mit 768-dimensionalen Embeddings, kompakter als jedes getestete Konkurrenzmodell.
Das Embedding-Modell bildet die erste Stufe der visuellen Suchplattform von nyris. Darauf aufbauend steigern optische Zeichenerkennung, Re-Ranking, hybride Suche, Filter und Stücklisten (Bill of Material) die End-to-End-Genauigkeit auf über 90 %. Je besser das Retrieval-Fundament, desto wirkungsvoller arbeitet jeder nachgelagerte Schritt.
Wir haben 10 Einbettungsmodelle von 6 Anbietern anhand von 7 Datensätzen verglichen. Die Datensätze umfassen die Identifizierung von Kfz-Ersatzteilen, industrielle Befestigungselemente und Steckverbinder, Heimwerker- und Renovierungsprodukte sowie gängige akademische Benchmark-Datensätze wie „Stanford Online Products“ und „Products-10K“. Drei Datensätze stammen von echten Industriepartnern mit realen Ersatzteilkatalogen. Vier sind öffentlich zugänglich.
Wir haben gemessen, wie zuverlässig jedes Modell exakt das richtige Produkt aus einem Katalog mit Tausenden bis Millionen Artikeln findet. Die Aufgabe: Zu einem Foto eines Teils oder Produkts den passenden Katalogeintrag ermitteln. Wir berichten Standard-Metriken des Information Retrieval: Accuracy@1 (R@1), Accuracy@5 (R@5) und mAP@10.
Alle Benchmark-Ergebnisse und die Methodik finden sich unter https://benchmark.nyris.io.
Bei einzelnen Datensätzen sprechen die Ergebnisse für sich:
Stanford Online Products: nyris erreicht 86,9 % R@1 und 94,2 % R@5. Der Zweitplatzierte, Google SigLIP2, kommt auf 80,3 % R@1 und 90,0 % R@5. Meta PE-Core folgt mit 80,1 % R@1 und 89,8 % R@5.
Produkte-10K: nyris erzielt 77,1 % R@1. Cohere Embed V4 kommt auf 66,5 %, SigLIP2 auf 66,0 %.
Klammern und Verbinder (industrielle Ersatzteile): nyris erzielt 63,4 % bei R@1. Der nächste Wettbewerber, Meta DINOv3, erreicht 26,4 %. Hier zeigt sich die Bedeutung von Fachwissen: Die detaillierte Identifizierung von Bauteilen erfordert Modelle, die speziell für diese Aufgabe trainiert wurden.
ILIAS (CVPR 2025-Benchmark, über 5 Millionen Referenzbilder): nyris erreicht 69,9 % R@1 gegen eine Galerie von mehr als 5 Millionen Bildern. Meta DINOv3 kommt auf 48,0 %.
Das nyris General v5.1 Model erreicht im Durchschnitt 57,6 % R@1 über alle Datensätze. Das zweitbeste Modell, Metas PE-Core L/14, liegt bei 42,9 %. Google Vertex AI Multi-Modal folgt mit 42,8 %.
Die meisten Wettbewerbsmodelle erzeugen Embeddings mit 1024 bis 1408 Dimensionen. Google Vertex AI nutzt 1408. Metas DINOv2, DINOv3 und PE-Core nutzen 1024. Google SigLIP2 nutzt 1152.
nyris General V5.1 nutzt 768 Dimensionen.
Für Produktivsysteme ist das entscheidend. Kleinere Embeddings bedeuten weniger Speicherbedarf und schnellere Suche. Ein 768-dimensionaler Vektor braucht 45 % weniger Speicher als ein 1408-dimensionaler Vektor. Bei einem Index mit Millionen von Produkten heißt das direkt: weniger Server, niedrigere Latenz. nyris liefert die höchste Genauigkeit mit dem kompaktesten Embedding. Diese Effizienz lässt sich in Speicher, Arbeitsspeicher und Latenz messen.
Das Embedding-Modell ist der Retrieval-Kern der Produktidentifikation. Es grenzt Millionen von Katalogartikeln in Millisekunden auf wenige Kandidaten ein. Ob das Suchbild ein Ersatzteil, einen Steckverbinder oder ein Möbelstück zeigt: Das Embedding muss den richtigen Treffer in einem riesigen Produktkatalog finden.
Die nyris-Plattform fügt zusätzliche Intelligenz hinzu:
Die hybride Suche kombiniert visuelle Merkmale mit allen Textsignalen im Bild. Modellnummern, Materialnummern, Spezifikationen, Barcodes, Etiketten: Das System liest und nutzt sie alle. Es erkennt auch den visuellen Kontext, ob ein Teil montiert, lose oder verpackt abgebildet ist. Durch die Verbindung von Aussehen, Text und Kontext erreicht die hybride Suche eine Genauigkeit, die weder Bild- noch Textsuche allein liefern kann.
Re-Ranking wendet ein präziseres Modell an, um die besten Kandidaten neu zu sortieren. Das allein kann die Genauigkeit um 5 bis 10 Prozentpunkte steigern.
OCR (Optical Character Recognition) liest Text aus dem Suchbild. Ein Foto eines Ersatzteils mit aufgedrucktem Etikett oder Teilenummer liefert dem System zusätzliche Identifikationsmerkmale, die reines Sehen nicht erfasst.
Filter grenzen den Suchraum ein. Wenn der Kontext bekannt ist, Produktkategorie, VIN, Marke, Lagerstandort, durchsucht das System nur den relevanten Bereich des Katalogs.
Die Stücklistenlogik (BOM) verknüpft Maschinen mit ihren Komponenten und Baugruppen. Fotografiert ein Servicetechniker ein Typenschild, erkennt die nyris-Typenschilderkennung die Maschine und schränkt die Suche auf deren Stückliste ein. Keine Seriennummer-Eingabe nötig. Der Techniker fotografiert dann das Teil, und das System durchsucht nur die relevanten Komponenten dieser Maschine.
Datenoptimierung verbessert, was im Index landet. Saubere, strukturierte, vollständige Produktdaten mit passenden Bildern steigern die Suchgenauigkeit erheblich. Wo echte Bilder fehlen oder nicht ausreichen, erzeugt nyris synthetische Bilder aus CAD-Dateien. Die Plattform enthält außerdem Werkzeuge, um Dubletten und Einträge schlechter Qualität zu erkennen, so bleibt der Suchindex auch bei wachsendem Katalog präzise.
Visual Synonyms (visuelle Wissensdatenbank) erweitern das visuelle Teilewissen des Systems über die Zeit. Über das nyris-Portal fließen reale Suchanfragen in den Index ein. Ersatzteile und Produkte so, wie sie im Feld tatsächlich aussehen. Jede zugeordnete Anfrage wird zum neuen visuellen Synonym für das jeweilige Produkt. Der Katalog startet mit Studioaufnahmen, doch das System lernt nach und nach, wie Teile unter realen Bedingungen aussehen: verschmutzt, abgenutzt, teilweise verdeckt oder aus ungewöhnlichen Winkeln fotografiert.
Jeder dieser Schritte baut auf dem Embedding-Fundament auf. Die visuelle Suchplattform von nyris vereint sie alle in einem Produktivsystem, das regelmäßig über 90 % End-to-End-Genauigkeit erreicht.
Der Benchmark zeigt drei wesentliche Punkte für die Entwicklung oder den Kauf visueller Suchsysteme:
Die Identifizierung von Ersatzteilen erfordert spezielle Modelle. Im Datensatz „Clips & Connectors", wo sich Teile durch kleine visuelle Merkmale unterscheiden, kommt das beste Allzweck-Foundation-Modell (DINOv3) auf nur 26,4 %. nyris erreicht 63,4 %. Für die industrielle Teileidentifikation ist Domänenwissen unverzichtbar.
Die Wahl des Einbettungsmodells ist von enormer Bedeutung. Eine Differenz von 15 Prozentpunkten bei der durchschnittlichen Genauigkeit@1 zwischen dem besten und dem zweitbesten Modell bedeutet einen großen Unterschied in der Qualität der Kandidaten, die in jede nachgelagerte Stufe eintreten. Ein besseres Embedding macht jeden Folgeschritt wirkungsvoller.
Embedding-Größe sagt nichts über Genauigkeit aus. nyris zeigt, dass ein fokussiertes, sorgfältig trainiertes 768-dimensionales Modell größere Modelle mit fast doppelter Dimensionalität übertrifft.
Die Embedding-Modelle von nyris sind die leistungsstärksten Embeddings für visuelle Produktsuche und Teileidentifikation, die wir getestet haben. Sie übertreffen Modelle von Google, Meta, Cohere, Jina AI und Nomic AI in allen unseren Benchmarks mit einem kompakten 768-dimensionalen Embedding
Das Embedding ist das Fundament. Die visuelle Suchplattform von nyris ergänzt es um Re-Ranking, OCR, hybride Suche, Filter, BOM-Logik und Datenkuratierung und erreicht damit in der Produktion über 90 % Genauigkeit. Von Kfz-Ersatzteilen über industrielle Steckverbinder bis zu Einzelhandelsprodukten, alle Ebenen des Systems greifen ineinander. Und es beginnt mit der stärksten Retrieval-Stufe der Branche.
Die vollständigen Benchmark-Ergebnisse und die Methodik finden Sie unter https://benchmark.nyris.io.
Den Artikel können Sie hier lesen:Benchmark-Bericht (arXiv)
Sie möchten unsere Embeddings mit Ihrem eigenen Produktkatalog testen? Schreiben Sie uns: embeddings@nyris.io.
Erhalten Sie Antworten auf Ihre spezifischen Fragen und finden Sie heraus, warum nyris die richtige Wahl für Ihr Unternehmen ist.
