Durch
Markus Lukasson
Diesen Beitrag teilen
.jpg)
Die Einbettungsmodelle von nyris belegen bei allen Benchmark-Datensätzen für die visuelle Produktsuche und Teileidentifizierung den ersten Platz. Sie übertreffen Modelle von Google, Meta, Cohere, Jina AI und Nomic AI bei Aufgaben wie der Suche nach Ersatzteilen bis hin zur Produktkennung. Und das mit 768-dimensionalen Einbettungen, die kleiner sind als alle getesteten Konkurrenzprodukte.
Das Einbettungsmodell ist die erste Stufe der visuellen Suchplattform von nyris. Darüber hinaus sorgen optische Zeichenerkennung, Neuanordnung, hybride Suche, Filter und Stücklistenlogik für eine End-to-End-Genauigkeit von über 90 %. Die beste Grundlage für die Suche macht jeden nachgelagerten Schritt effektiver.
Wir haben 10 Einbettungsmodelle von 6 Anbietern anhand von 7 Datensätzen bewertet. Die Datensätze umfassen die Identifizierung von Automobilersatzteilen, industriellen Befestigungselementen und Verbindungsstücken, Möbeln, Heimwerker- und Renovierungsprodukten sowie standardmäßige akademische Benchmarks wie Stanford Online Products und Products-10K. Vier Datensätze stammen von realen Industriepartnern mit realen Ersatzteilkatalogen. Fünf sind öffentlich zugänglich.
Wir haben gemessen, wie gut jedes Modell das genau richtige Produkt aus einem Katalog mit Tausenden bis Millionen von Artikeln findet. Die Aufgabe: Anhand eines Fotos eines Teils oder Produkts den passenden Artikel im Katalog finden. Wir berichten über Standardmetriken zur Informationsgewinnung wie Accuracy@1 (R@1), Accuracy@5 (R@5) und mAP@10.
Die vollständigen Benchmark-Ergebnisse und die Methodik finden Sie unter https://benchmark.nyris.io.
Bei einzelnen Datensätzen sprechen die Ergebnisse für sich:
Stanford Online Products: nyris erreicht eine Genauigkeit von 86,9 % bei R@1 und 94,2 % bei R@5. Der Zweitplatzierte, Google SigLIP2, erreicht 80,3 % bei R@1 und 90,0 % bei R@5. Meta PE-Core folgt mit 80,1 % bei R@1 und 89,8 % bei R@5.
Produkte-10K: nyris erreicht 77,1 % R@1. Cohere Embed V4 erreicht 66,5 % R@1, SigLIP2 erzielt 66,0 % R@1.
Clips & Connectors (industrielle Ersatzteile): nyris erreicht 63,4 % R@1. Der nächste Wettbewerber, Meta DINOv3, erreicht 26,4 %. Hier zeigt sich die Bedeutung von Fachwissen: Die detaillierte Identifizierung von Teilen erfordert speziell für diese Aufgabe trainierte Modelle.
Möbel: nyris führt mit 65,8 %. SigLIP2 folgt mit 57,4 %, Vertex AI mit 52,3 %.
ILIAS (CVPR 2025-Benchmark, über 5 Millionen Referenzbilder): nyris erreicht eine Genauigkeit von 69,9 % bei einer Galerie von über 5 Millionen Bildern. Meta DINOv3 erreicht 48,0 %.
nyris General V5.1 erreicht eine durchschnittliche Genauigkeit@1 von 57,6 % über alle Benchmark-Datensätze hinweg. Das nächstbeste Modell, Meta's PE-Core L/14, erreicht 42,9 %. Google Vertex AI Multi-Modal folgt mit 42,8 %.
Die meisten Konkurrenzmodelle erzeugen Einbettungen zwischen 1024 und 1408 Dimensionen. Google Vertex AI verwendet 1408. Meta's DINOv2, DINOv3 und PE-Core verwenden 1024. Google SigLIP2 verwendet 1152.
nyris General V5.1 verwendet 768 Dimensionen.
Dies ist für Produktionssysteme von Bedeutung. Kleinere Einbettungen bedeuten weniger Speicherbedarf und eine schnellere Suche. Ein 768-dimensionaler Vektor benötigt 45 % weniger Speicherplatz als ein 1408-dimensionaler Vektor. Wenn Ihr Index Millionen von Produkten enthält, führt dieser Unterschied direkt zu weniger Servern und einer geringeren Latenz. nyris liefert die beste Genauigkeit bei geringster Einbettung. Das ist Effizienz, die Sie in Bezug auf Speicherplatz, Arbeitsspeicher und Latenz messen können.
Das Einbettungsmodell ist die Suchmaschine für die Produktidentifizierung. Es grenzt Millionen von Katalogartikeln innerhalb von Millisekunden auf eine Handvoll Kandidaten ein. Unabhängig davon, ob es sich bei der Suchanfrage um ein Foto eines Ersatzteils, eines Steckverbinders oder eines Möbelstücks handelt, muss die Einbettung die richtige Übereinstimmung in einem riesigen Produktkatalog finden.
Die nyris-Plattform stapelt dann zusätzliche Intelligenz darauf:
Die hybride Suche kombiniert visuelle Merkmale mit allen im Bild sichtbaren Textsignalen. Modellnummern, Teilenummern, Spezifikationen, Barcodes, Etiketten: Das System liest und nutzt sie alle. Es versteht auch den visuellen Kontext, ob ein Teil montiert, lose oder in einer Verpackung gezeigt wird. Durch die Kombination des Aussehens des Produkts, des darauf befindlichen Texts und seiner Darstellung liefert die hybride Suche eine erstklassige Genauigkeit, die weder Bildverarbeitung noch Textverarbeitung allein erreichen können.
Durch das Re-Ranking wird ein präziseres Modell angewendet, um die besten Kandidaten neu zu ordnen. Allein dadurch lässt sich die Genauigkeit um 5 bis 10 Prozentpunkte steigern.
OCR (Optical Character Recognition) liest Text aus dem Abfragebild. Ein Foto eines Ersatzteils mit einem aufgedruckten Etikett oder einer Teilenummer liefert dem System zusätzliche Identifizierungsinformationen, die mit reinem Sehen nicht erfasst werden können.
Filter schränken den Suchbereich ein. Wenn der Kontext des Benutzers bekannt ist (Produktkategorie, Marke, Lagerort), durchsucht das System nur den relevanten Teil des Katalogs.
Die Stücklistenlogik (BOM) verbindet Maschinen mit ihren Komponenten und Baugruppen. Wenn ein Servicetechniker ein Typenschild fotografiert, identifiziert die Nyris-Typenschilderkennung die Maschine und schränkt die Suche auf ihre spezifische Stückliste ein. Die Eingabe einer Seriennummer ist nicht erforderlich. Der Techniker fotografiert dann das Teil, und das System durchsucht nur die für diese Maschine relevanten Komponenten.
Die Datenkuratierung verbessert die Indizierung. Saubere, strukturierte und vollständige Produktdaten mit den richtigen Bildern erhöhen die Genauigkeit der Suche erheblich. Wenn echte Bilder fehlen oder unzureichend sind, generiert nyris synthetische Bilder aus CAD-Dateien, um Lücken in der Abdeckung zu füllen. Die nyris-Plattform enthält auch Tools zur Identifizierung von Duplikaten und Einträgen mit geringer Qualität, sodass der Suchindex auch bei wachsendem Katalog genau bleibt.
Visual Synonyms (visuelle Wissensdatenbank) erweitert im Laufe der Zeit die visuelle Teileintelligenz des Systems. Über das nyris-Portal werden dem Index reale Suchanfragen hinzugefügt, die Teile so zeigen, wie sie in der Praxis vorkommen. Jede übereinstimmende Anfrage wird zu einem neuen visuellen Synonym für dieses Produkt. Der Katalog beginnt mit Studiobildern, aber im Laufe der Zeit lernt das System, wie Teile unter realen Bedingungen aussehen: verschmutzt, abgenutzt, teilweise sichtbar oder aus ungewöhnlichen Blickwinkeln fotografiert.
Jeder dieser Schritte baut auf der eingebetteten Grundlage auf. Die visuelle Suchplattform von nyris kombiniert alle diese Schritte in einem einzigen Produktionssystem, das regelmäßig eine End-to-End-Genauigkeit von über 90 % erreicht.
Der Benchmark zeigt drei Dinge, die für jeden wichtig sind, der ein visuelles Suchsystem entwickelt oder kauft:
Die Identifizierung von Ersatzteilen erfordert spezielle Modelle. Beim Datensatz „Clips & Connectors“, bei dem sich die Teile durch kleine visuelle Merkmale unterscheiden, erreicht das beste Allzweck-Basismodell (DINOv3) nur 26,4 %. nyris erzielt 63,4 %. Für die Identifizierung von Industrieteilen ist Fachwissen unerlässlich.
Die Wahl des Einbettungsmodells ist von enormer Bedeutung. Eine Differenz von 15 Prozentpunkten bei der durchschnittlichen Genauigkeit@1 zwischen dem besten und dem zweitbesten Modell bedeutet einen großen Unterschied in der Qualität der Kandidaten, die in jede nachgelagerte Stufe eintreten. Eine bessere Einbettung macht jeden nachfolgenden Schritt effektiver.
Die Größe der Einbettung sagt nichts über die Genauigkeit aus. nyris beweist, dass ein fokussiertes, gut trainiertes 768-dimensionales Modell Modelle mit fast doppelter Dimensionalität übertrifft. Bessere Ergebnisse zu geringeren Kosten.
Nyris-Einbettungsmodelle sind die leistungsstärksten Einbettungen für die visuelle Produktsuche und Teileidentifizierung, die wir getestet haben. Sie schlagen Modelle von Google, Meta, Cohere, Jina AI und Nomic AI in 8 von 9 Benchmarks mit einer kompakten 768-dimensionalen Einbettung, die die Infrastrukturkosten niedrig hält.
Die Einbettung ist die Grundlage. Die visuelle Suchplattform von nyris baut darauf auf und bietet Re-Ranking, OCR, hybride Suche, Filter, BOM-Logik und Datenkuratierung, um eine Genauigkeit von über 90 % in der Produktion zu erreichen. Von Automobilersatzteilen über industrielle Steckverbinder bis hin zu Einzelhandelsprodukten – alle Ebenen des Systems arbeiten zusammen, beginnend mit der branchenweit leistungsstärksten Suchphase.
Die vollständigen Benchmark-Ergebnisse und die Methodik finden Sie unter https://benchmark.nyris.io.
Den Bericht können Sie hier lesen:Benchmark-Bericht (PDF)
Möchten Sie unsere Einbettungen in Ihrem eigenen Produktkatalog testen? Kontaktieren Sie uns unter embeddings@nyris.io.
Erhalten Sie Antworten auf Ihre spezifischen Fragen und finden Sie heraus, warum nyris die richtige Wahl für Ihr Unternehmen ist.
